295 101 50MB
Italian Pages 504 Year 2017
Stefano Donati
II logicismo di Bertrand Russell e il suo contesto filosofico Volume IL
Digitized by the Internet Archive in 2022 with funding from Kahle/Austin Foundation
Nttps://archive.org/details/illogicismodiber0002dona_i6d2
Stefano Donati
IL LOGICISMO DI BERTRAND RUSSELL e il suo contesto filosofico
Vol. II
Library of Congress Control Number: 2017903812 CreateSpace Independent Publishing Platform, North Charleston, SC.
First edition: copyright © 2016 Stefano Donati Second edition (U.S. edn): copyright © 2017 Stefano Donati All rights reserved ISBN: 1544209258 ISBN-13: 978-1544209258
SOMMARIO Vol. II
CAPITOLO 8 LE TEORIE DELLO ZIGZAG, DELLA LIMITAZIONE DI GRANDEZZA, E SENZA CLASSI 565 1. Funzioni proposizionali predicative e impredicative 565 2. La teoria dello zigzag 570 3. La teoria della limitazione di grandezza 571 4. La teoria sostituzionale 576 4.1. La teoria sostituzionale semplice 576 4.2. La critica di Poincaré e la risposta di Russell 594 4.3. La prima teoria sostituzionale ramificata 601 4.3.1. La soluzione dei paradossi 601 4.3.2. La prima versione dell’assioma di riducibilità 606 4.4. L'abbandono della teoria sostituzionale 609 CAPITOLO 9 LA TEORIA DEI TIPI DEL 1907 618 1. Il principio del circolo vizioso 619 1.1. Il principio del circolo vizioso e gli enunciati generali 621 2. La gerarchia degli ordini e dei tipi 626 2.1. La spiegazione di Russell 626 2.2. Il significato dei termini chiave 627 2.3. La gerarchia degli ordini: una prima interpretazione 632 2.4. La gerarchia degli ordini: seconda interpretazione 636 3. La soluzione dei paradossi “semantici” 640 4. L’ontologia della teoria dei tipi del 1907 642 S. L'assioma di riducibilità 643 6. La teoria delle classi e delle relazioni in estensione 645 7. Lo sviluppo delle idee fondamentali dell’aritmetica 657 7.1. Alcune difficoltà derivanti dalla teoria dei tipi 657 7.2. Un argomento modale contro la definizione russelliana di “numero cardinale” 662
CAPITOLO 10 LA TEORIA DEL GIUDIZIO COME RELAZIONE MULTIPLA 667 1.I giudizi elementari all’epoca dei Principia 667 2. L'evoluzione successiva 671 3. Giudizi generali e giudizi molecolari 682 4. L’interpretazione di Landini 685 5. Wittgenstein e l'abbandono della teoria 691
CAPITOLO 11 LA TEORIA DEI TIPI DEI PRINCIPIA 701 1. Le funzioni proposizionali nei Principia 703
1.1. Predicati o attributi? 703 1.2. Funzioni proposizionali, proposizioni e universali 714 1.3. Le funzioni proposizionali come simboli 721 1.4. La quantificazione 726 1.5. Continuità nel pensiero russelliano 739 2.1 tipi logici 740 - 2.1. La suddivisione in tipi delle funzioni proposizionali 740 2.1.1. L'argomento del circolo vizioso 741
ii
Sommario
2.1.2. L'argomento per esame diretto 743 2.2. La gerarchia dei tipi e degli ordini 745 2.3. L'assioma di riducibilità 751 3. Le classi 757 3.1. La riduzione delle classi a funzioni proposizionali 757 3.2. Convenzioni d’ambito e quantificazione 762 4. La soluzione dei paradossi nei Principia 765 CAPITOLO 12 ALTERNATIVE, CRITICHE E PROPOSTE DI EMENDAMENTO AL SISTEMA DEI PRINCIPIA 769 1. La teoria assiomatica degli insiemi 769 1.1. La teoria assiomatica di Zermelo 770 1.1.1. Gli assiomi del 1908 770 1.1.2. Zermelo e il paradosso di Russell 775 1.1.3. Alcuni sviluppi successivi 777 1.1.4. Concezione iterativa e limitazione di grandezza 794 1.2. Russell e il sistema di Zermelo 805 2. Critiche e emendamenti alla teoria Principia 808 2.1. La teoria dei tipi contraddice se stessa? 808 2.2. Critiche al principio del circolo vizioso 814 2.3. Critiche all’assioma di riducibilità 817 2.4. La seconda edizione dei Principia 821 2.5. La teoria di Ramsey 829 2.6. Russell dopo la seconda edizione dei Principia 839 2.7. Sviluppi della teoria dei tipi 842 2.7.1. La teoria semplice dei tipi 842 2.7.2. La teoria cumulativa dei tipi 848 2.8. I sistemi fondazionali di Quine 849 2.9. Critiche all’assioma dell’infinito 860 2.10. L'assioma dell’infinito secondo Carnap, Fraenkel e Bar-Hillel 862
2.11. L'assioma dell’infinito secondo Ramsey 865
CAPITOLO 13 IL LOGICISMO DI RUSSELL 871 1. Proprietà delle proposizioni logiche 871 1.1. Analitico e sintetico 871 1.2.I principi logici sono autoevidenti? Sono a priorî? 890 1.3. L’autoevidenza a priori è garanzia di verità? 899 2. Che cos'è la logica? 905 CAPITOLO 14 ALCUNE OBIEZIONI GENERALI AL LOGICISMO 917 1. L’obiezione di Quine 917 2. Il primo teorema d’incompletezza di Gòdel 935 2.1. Il teorema 939 2.2. Conflitto con il realismo? 952 2.3. Conflitto con il logicismo? 956
BIBLIOGRAFIA 963 Opere di Bertrand Russell 964 Opere di altri autori 975 Indice dei nomi di persona 1040 Indice degli argomenti 1047
CAPITOLO 8 LE TEORIE DELLO ZIGZAG, DELLA LIMITAZIONE DI GRANDEZZA, E SENZA CLASSI
1. FUNZIONI PROPOSIZIONALI PREDICATIVE E IMPREDICATIVE L’articolo “On denoting”, in cui Russell pubblicava per la prima volta la sua teoria delle descrizioni, fu redatto alla fine di luglio del 1905 e uscì su Mind nell’ottobre successivo. Il 24 novembre dello stesso anno, Russell inviò alla London Mathematical Society un saggio dal titolo “On some difficulties in the theory of transfinite numbers and order types”. In questo saggio, presentato di fronte alla stessa associazione il 14 dicembre successivo, Russell proponeva per la prima volta — come una possibile soluzione ai paradossi logici — quella “teoria senza classi”
(no class theory) di cui la cosiddetta “teoria ramificata dei tipi” dei Principia Mathematica non è che una forma. La “teoria senza classi” è la proposta di fare a meno, in logica e in matematica, dell’assunzione che vi siano classi e relazioni in estensione — considerando ogni apparente riferimento a tali entità come un semplice modo di dire. Come lo stesso Russell dichiara in “My mental development” (1944), quest'idea gli fu suggerita dal precedente sviluppo della sua teoria delle descrizioni definite: Ciò che fu di una certa importanza in questa teoria [delle descrizioni] fu la scoperta che, analizzando un enunciato significante, non si deve assumere che ciascuna parola o espressione separata abbia un significato di per sé. [...] Presto divenne chiaro che i simboli di classe potevano essere trattati come le descrizioni, cioè, come parti non significanti di enunciati significanti.'
L’idea di Russell era che, così come espressioni quali “L'autore di Waverley” sono solo apparentemente nomi d’entità, anche quelle che sembrano essere espressioni denotanti classi siano, in realtà, simboli che non denotano
nulla, ma che contribuiscono — in un modo da specificarsi — paiono. Il 7 dicembre del 1905 Russell scrisse a Couturat: Sono delle zione remo
al significato di determinati contesti in cui com-
molto felice che approviate l’articolo “On denoting”. Credo che esso sia molto importante; non solo a causa della soluzione difficoltà segnalate nell’articolo stesso, ma anche perché sono arrivato, perseguendo lo stesso metodo, alla mia attuale soludella contraddizione [Russell si riferisce a una forma particolare di “teoria senza classi”, la teoria sostituzionale, di cui parlepiù avanti, in questo capitolo (v. sotto, $ 4)].°
Il menzionato articolo di Russell “On some difficulties in the theory of transfinite numbers and order types” prende spunto da un articolo di Ernest W. Hobson dell’inizio del 1905, intitolato “On the general theory of transfinite numbers and order types”. In questo saggio, Hobson discute le difficoltà connesse con il paradosso di Burali-Forti, giungendo alle conclusioni seguenti: (1) non possono esistere tutti i numeri ordinali, né tutti gli alef cantoriani, e quindi non c’è l’insieme di tutti questi numeri ordinali, né quello di tutti questi numeri cardinali ($$ 5, 6, e
8); (ii) all’epoca del saggio non si è ancora dimostrata l’esistenza di numeri ordinali superiori al numerabile, e quindi dei rispettivi alef — perché, argomenta Hobson, un numero cardinale o ordinale è tipicamente una proprietà comune a più insiemi,* cosicché per introdurre un alef, e i numeri ordinali corrispondenti, non basta avere un
| Russell [1944a], pp. 13-14. 2 In Russell [2001a], p. 559. * V. Hobson [1905]. Russell non è particolarmente critico nei confronti dell’articolo di Hobson. In una lettera a Geoffrey H. Hardy del 22 giugno 1905 (ora in Garciadiego [1992], appendice, pp. 190-192), Russell scrive: «Hobson non è chiaro, ma io penso che in linea di massima abbia ragione [...]» (in Garciadiego [1992], appendice, p. 192).
4 Hobson sostiene che i concetti di numero cardinale e di numero ordinale sorgano per astrazione da più insiemi, conservando le proprietà comuni
ai loro elementi
corrispondenti
(secondo
una certa relazione
uno-uno),
e trascurando
le differenze tra essi. Hobson
solleva
un’obiezione simile a quella mossa da Frege alle caratterizzazioni cantoriane per astrazione dei concetti di numero ordinale e di numero cardinale (v. sopra, cap. 2, nota 49) — secondo le quali un numero ordinale è ricavato considerando un insieme e astraendo dalla natura dei suoi elementi, e, in modo simile, un numero cardinale è ricavato considerando un insieme e astraendo sia dalla natura dei suoi elementi, sia dall’ordine in cui questi elementi sono dati. Scrive Hobson: «L'ordine relativo di due elementi qualsiasi di un aggregato [aggregate] ordinato transfinito è determinato dalle caratteristiche individuali di questi elementi (includendo, se rilevanti, le loro posizioni nello spazio ©
capitolo 8
566
insieme di numeri ordinali (per es., per introdurre N; e @; non basta avere l’insieme di tutti i numeri ordinali della prima e della seconda classe cantoriane), ma occorre aver definito anche almeno un altro insieme, non costituito
di numeri ordinali (ma, per es., costituito di punti nello spazio geometrico), che abbia la stessa potenza del primo, cioè i cui elementi si possano porre in una relazione uno-uno con quelli del relativo insieme di numeri ordinali ($$ 6, 7 e 8); (iii) è possibile che in futuro si dimostri l’esistenza di alef superiori al numerabile e dei corrispondenti numeri ordinali, ma sicuramente ciò non sarà possibile ascendendo oltre un certo alef determinato ($ 6, $ 8). Nell’ultima parte del saggio ($$ 10, 11, e 12), Hobson respinge l’uso del principio incorporato nell’assioma di scelta per formare insiemi, perché, secondo Hobson, una condizione necessaria per considerare un insieme infini-
to come esistente, e per poterne far uso nelle dimostrazioni, è che esso sia definibile per mezzo di una proprietà, esprimibile in modo finito, che ne caratterizzi univocamente i membri. Il saggio di Russell è diviso in due parti dedicate, rispettivamente, alle difficoltà originate dalle antinomie logiche e alla questione dell’assioma di scelta. Russell spiega così l’ accostamento dei due argomenti: Il dubbio sulla verità dell’assioma di Zermelo nasce dall’impossibilità di scoprire una norma [norm] con cui scegliere un termine da ognuna delle classi [c/asses] di un insieme [ser], mentre la difficoltà degli aggregati inconsistenti [inconsistent aggregates] nasce dalla presenza di una norma perfettamente definita combinata con l’assenza dimostrabile di un aggregato [aggregate] corrispondente. Questo suggerisce che una norma sia condizione necessaria ma non sufficiente per l’esistenza di un aggregato; se è così, la soluzione completa del nostro primo insieme di difficoltà consisterebbe nella scoperta delle condizioni precise che una norma deve soddisfare per definire un aggregato. La determinatezza logica, sembra, non è sufficiente [.. 3g
Qui è opportuno fermarsi per esaminare una questione terminologica: poco più avanti, Russell avverte che, nello scritto in esame, egli usa «le parole norma [norm], proprietà [property] e funzione proposizionale [propositional function] come sinonimi [synonyms]»;° poiché le proprietà — secondo il modo usuale di esprimersi — non sono entità linguistiche, sembra naturale inferirne che “norme” e “funzioni proposizionali” non debbano essere intese come notazioni, ma come entità non linguistiche. Questa conclusione è stata effettivamente tratta da John Richards ([1980], pp. 327-328), ma non sembra essere storicamente accurata. Vediamo perché. Subito prima di dichiarare l’uso delle parole “norma”, “proprietà” e “funzione proposizionale” come sinonimi, Russell spiega che cosa intende con ‘funzione proposizionale”: N22
Una funzione proposizionale di x è qualsiasi espressione [expression] @!x il cui valore, per ogni valore di x, è una proposizione; tale è “x è un uomo” oppure “senx= 1”. Analogamente scriviamo @!(x, y) per una funzione proposizionale di due variabili; e così via. In questo scritto userò le parole norma [norm], proprietà [property], e funzione proposizionale come sinonimi.”
Appare strano, a prima vista, che Russell usi la parola “expression” per riferirsi a funzioni proposizionali, se queste ultime non sono intese come entità linguistiche. Richards sostiene però proprio questo, cioè che Russell usa la parola “expression” per riferirsi a entità extralinguistiche: Russell dice che una funzione proposizionale è un’espressione [expression]. E siamo portati a concludere da ciò che con “espressione” Russell intenda realmente un’“entità linguistica”. Sembrerebbe dunque che Russell fosse indeciso riguardo alla natura delle funzioni proposizionali. Lasciando da parte il punto che nessuno ha mai accusato Russell di sostenere che una proprietà (che è sinonimo di funzione proposizionale) sia un’entità linguistica, che base abbiamo per assumere che “espressione” significhi “entità linguistica” per Russell? Russell ammetteva che entità non linguistiche possano “esprimere”, e quindi “espressione” si dovrebbe prendere semplicemente come un modo di riferirsi a qualcosa che esprime.*
nel tempo) soggette alla [cioè, implicate dalla] norma [norm] definente [l’aggregato]. Se allora, si fa completa astrazione dalla natura degli elementi, essi divengono indistinguibili l’uno dall’altro, e l’ordine nell’aggregato è quindi cancellato [...]» (Hobson [1905], $ 3, pp. 174175); e ancora: «La definizione di numero cardinale, per astrazione, che impiega Cantor, può essere giustificata solo dall’interpretazione, che si faccia astrazione solo da quelle caratteristiche per cui gli elementi dell’aggregato differiscono dagli clementi corrispondenti degli aggregati equivalenti [cioè, cardinalmente simili]. L’astrazione parziale consisterà allora nell’assumere il numero cardinale come la caratteristica comune a tutti questi aggregati equivalenti. Fare un’astrazione completa dalla natura degli elementi di un aggregato transfinito [come prescrive Cantor] eliminerebbe la relazione con il numero cardinale» (Hobson [1905], $ 7, p. 180).
° Russell [1906a], $ I, p. 136. “Norma” (norm) e “aggregato” (aggregate) sono termini che Russell riprende qui dall’uso di Hobson [1905]. ° Russell [1906a], $ I, p. 137; corsivi di Russell.
? Russell [1906a], $ I, pp. 136-137. * Richards [1980], pp. 327-328.
Le teorie dello zigzag, della limitazione di grandezza, e senza classi
567
Richards si riferisce evidentemente alla teoria sostenuta da Russell all’epoca dei Principles, secondo cui certi sintagmi significano concetti denotanti, che sono entità extralinguistiche le quali hanno la proprietà di denotare particolari oggetti. Tuttavia, Russell non si serve mai della parola “esprimere” per indicare il rapporto tra un concetto denotante e la sua denotazione: si serve, appunto, di “denotare” — e solo di rado della parola “significare”, utilizzata in un senso lato, nelle spiegazioni preliminari. È dunque inverosimile supporre che Russell potesse usare “espressione” per designare un’entità non linguistica sulla base del fatto che essa esprimerebbe qualcosa. A ciò si aggiunga che, dopo l'elaborazione della sua teoria delle descrizioni, Russell non riconosceva più l’esistenza di en-
tità non linguistiche con la proprietà di denotare qualcosa, e dunque non è possibile che — all’epoca di “On some difficulties...” — egli avesse la tentazione di utilizzare “espressione” nel senso indicato da Richards. In “On some difficulties...”, in realtà, “expression” è usato proprio per riferirsi a simboli e così è adoperato, in primo luogo, “funzione proposizionale”. Quando Russell usa il termine “proprietà”, intende fare riferimento a ciò che i/ senso comune suppone essere il riferimento delle espressioni funzionali, ma, con ciò, non intende affatto far propria l’idea secondo cui le “proprietà”, o le “funzioni proposizionali”, in senso non linguistico, sarebbero effettive entità. Questo diviene evidente quando, nel $ II dello scritto in esame, dopo aver dichiarato: «Ciò che è dimo-
strato dalle contraddizioni che abbiamo considerato è in generale questo: “Una funzione proposizionale di una variabile non determina sempre una classe”’»,'° Russell inserisce una nota a piè di pagina in cui dice: Qui si deve comprendere che gli argomenti che mostrano che non c’è sempre una classe mostrano anche che non c’è sempre un'entità separabile che sia la funzione proposizionale (in quanto opposta ai suoi valori); e che qualche funzione proposizionale di due variabili non determina una relazione in intensione [in intension] o in estensione [in extension], se per relazione intendiamo
un'entità separabile che può essere considerata separatamente dai termini correlati."
Si osservi com’è usato il termine “funzione proposizionale” nei passaggi riportati: dapprima Russell rileva che le contraddizioni provano che una funzione proposizionale non definisce sempre una classe; poi, nella nota, afferma che «gli argomenti che mostrano che non c’è sempre una classe mostrano anche che non c’è sempre un’entità separabile che sia la funzione proposizionale». Egli sta dunque dicendo che le contraddizioni, oltre a dimostrare che una funzione proposizionale di una variabile non definisce sempre una classe, dimostrano che una funzione proposizionale di una variabile non definisce sempre una funzione proposizionale come entità separabile. È chiaro che questo discorso diviene incomprensibile se non si suppone che Russell stia usando “funzione proposizionale” in due sensi diversi: da un lato egli intende parlare di un simbolo, dall’altro del suo supposto riferimento. Questa, tuttavia, non è la tesi più forte proposta da Russell nell’articolo in questione; la tesi più forte è quella della “teoria senza classi”, secondo la quale i simboli di funzione proposizionale non definirebbero mai classi e, per parità di ragionamento, non definirebbero mai attributi. Secondo questa teoria, i simboli di funzione proposizionale sarebbero, in realtà, simboli incompleti,
e non denoterebbero mai né entità intensionali, né entità estensio-
nali. Ciò rende ancora più evidente il fatto che, parlando di ‘funzioni proposizionali” come “proprietà”, Russell intende solo esprimersi nel modo che ritiene più vicino a quello del senso comune preteorico, e non intende affatto implicare che vi siano veramente delle entità come le “proprietà”. Ricapitolando, nel saggio in esame Russell usa il termine “funzione proposizionale” in modo ambiguo: da un lato intende una notazione, dall’altro ciò che questa notazione è supposta denotare dal senso comune, cioè una proprietà. Ma la tesi di Russell è che i simboli funzionali, in realtà, non denotano sempre proprietà e che forse (se la teoria senza classi è corretta) non le denotano mai — cioè, che non esistono affatto “proprietà”, in questo senso. Per illustrare il punto secondo cui un simbolo funzionale non può definire sempre una classe, Russell passa in rassegna, nell’ordine, il paradosso di Cantor, il paradosso da lui scoperto e quello di Burali-Forti. Riguardo al paradosso di Cantor egli scrive: Se ogni norma logicamente determinata definisce una classe, non si può sfuggire alla conclusione che c’è un numero cardinale di tutte le entità. Poiché in quel caso la norma “x = x” definisce una classe, che contiene tutte le entità: chiamiamo questa classe V. Allora la norma ‘“ è simile a V” definisce un insieme di classi che si può considerare il numero cardinale di V, ossia il numero cardi-
nale massimo. Così, se ogni norma logicamente determinata definisce una classe, è impossibile sfuggire alla conclusione che c’è un numero cardinale massimo."
? Discuteremo più ampiamente questa tesi di Richards nel cap. 11, $ 1.1.
'0 Russell [1906a], $ II, p. 145.
!! Ibid., nota.
2 Russell [1906a], $ I, p. 138.
capitolo 8
568
Ciò che, come sappiamo, è in contraddizione con il teorema di Cantor. Riguardo al paradosso che porta il suo nome, Russell osserva che la norma “x non è una classe che è elemento di se stessa” non può definire una classe: «Infatti, se essa definisse po classe w, troveremmo che, se w è un membro di se stessa, allora non è un membro di se stessa, e viceversa». Il paradosso di Burali-Forti è più complesso, ma anch'esso, secondo Russell, scaturisce dall’assunzione che ogni norma definisca una classe. Il paradosso si ottiene: (1) prendendo la classe di tutti i numeri ordinali; (2) dimostrando che gli elementi di questa classe, disposti in ordine di grandezza, formano una serie ben ordinata (3) considerando il numero ordinale di questa serie. Tale numero ordinale dev'essere maggiore di tutti gli elementi della serie e, poiché la serie comprende tutti gli ordinali, non può essere un numero ordinale: una contraddizione. Da tale contraddizione si deve concludere, osserva Russell, che o la norma ‘x è un numero ordinale’’ non definisce una
classe, oppure che, se la definisce, allora la norma “@e f sono numeri ordinali e @ è minore di #° non definisce una relazione seriale. Russell argomenta poi che i paradossi logici si possono ridurre a una medesima forma comune, che è la seguenle:
“Data una proprietà @ e una funzione f, tali che, se @ appartiene a tutti i membri di v, f‘u [ricordiamo che un simbolo della forma ‘fx? significa, per Russell, lo stesso che l’usuale ‘“f(x)”] esista sempre, abbia la proprietà @ e non sia un membro di u; allora la supposizione che ci sia una classe w di tutti i termini aventi la proprietà @ e che f‘w esista porta alla conclusione che f‘w ha e non ha la proprietà @.”?!*
Possiamo rendere in simboli l’idea di Russell come segue: assumendo che @ e f siano una proprietà e una funzione tali che:
(*) MM
15 PM)
f1) €
A PfU)))),
allora la supposizione che esista la classe w di tutti gli x tali che @(x), cioè che si abbia:
(#) Me
w= 0),
e che esista anche l’oggetto f(w), conduce a una contraddizione. Infatti, prendendo w come u in (*), e f(w) come x in (**), si ottiene la contraddizione che @(f(w) e —@(f(W)). L’idea di questa forma comune dei paradossi era venuta a Russell alcuni mesi prima, mentre lavorava sul paradosso di Burali-Forti; in una lettera a Couturat datata 24 settembre 1905 Russell scrive: Quanto ai miei lavori personali, mi sono posto ultimamente a esaminare la contraddizione di Burali-Forti. Ho trovato questa generalizzazione: Sia @!x una proprietà (funzione proposizionale) qualsiasi, che appartiene sempre a f‘u (dove f‘u è una funzione qualsiasi della classe w) quando essa appartiene a tutti i termini di ; e rogna che si abbia f‘u —€ u nelle medesime circostanze. Si consideri allora la classe x (0!x)[dTla classe degli x che hanno la proprietà g”: Russell È serve qui di una notazione simile a quella di Frege]. Si troverà @!f°x(@!x).f° x (p!x) -e x (@! x), cheè una contraddizione."
Si tratta esattamente della spiegazione riportata, in termini appena diversi, nell’articolo “On some difficulties in the theory of transfinite numbers and order types”. In quest'articolo, Russell spiega che il paradosso di BuraliForti si ottiene assumendo, come proprietà @, quella di essere un numero ordinale, considerando un qualsiasi segmento u della serie ben ordinata degli ordinali in ordine di grandezza, e prendendo “f‘w” a significare “il numero ordinale di v”.!° Questo non si adatta perfettamente allo schema generale, ma è facile riformulare la spiegazione di Russell in modo che vi si adatti: assumendo sempre che @ sia la proprietà di essere un numero ordinale, si può considerare u come una qualsiasi classe di numeri ordinali, e stabilendo che, se u è la classe che contiene solo il numero 0, f‘u = 1,!” altrimenti, f°u è il numero ordinale della serie ben ordinata, in ordine di grandezza, di
13 14 !5 !©
Russell [1906a], $ I, p. 139. Russell [1906a], $ I, p. 142. In Russell [2001], p. 533-534. V. Russell [1906a], $ I, p. 141.
!” Questa clausola è dovuta solo al fatto che — per definizione — non possono esistere serie di un solo elemento, e che quindi, se i numeri
ordinali si definiscono come nei Principia, il numero ordinale 1 non può essere il numero di una relazione seriale (v. sopra, cap. 2, $ 4.2.3).
Le teorie dello zigzag, della limitazione di grandezza, e senza classi
569
tutti i numeri ordinali non maggiori di almeno un elemento di w”. Il paradosso di Burali-Forti mostra che la supposizione che esista una classe w comprendente tutti i numeri ordinali e che esista il numero ordinale della serie ben ordinata costituita dai termini di w porta alla conclusione contraddittoria che f‘w, cioè il numero ordinale della serie ben ordinata di tutti i numeri ordinali, ha e non ha la proprietà di essere un numero ordinale. In “On some difficulties...”, Russell mostra che il paradosso che ora porta il suo nome si ottiene assumendo, come proprietà @, quella di essere una classe che non appartiene a se stessa, considerando una qualsiasi classe u di classi che non appartengono a se stesse e prendendo, infine, ‘“f‘w° a significare “la classe che è identica a w” (cioè f‘u= u). Il paradosso di Russell mostra allora che la supposizione che esista una classe w di tutte le classi che non appartengono a se stesse porta alla conclusione contraddittoria che f‘w, cioè w stessa, ha e non ha la proprietà di essere una classe che appartiene a se stessa.'* Russell non spiega come il paradosso di Cantor si possa ridurre alla forma generale proposta, ma un modo di farlo è il seguente. Siano @la proprietà di essere una classe, u una classe di classi, e “f‘w” significhi: “la classe di tutti i sottoinsiemi dell’insieme, v,, cui appartengono tutti e solo i membri dei membri di w” (v, è quindi l'insieme unione di w, e f‘u è il suo insieme potenza). Con questi presupposti, f‘v ha la proprietà @ (è una classe), ma non può appartenere a u: infatti, se f‘u appartenesse a x, tutti i suoi elementi sarebbero anche elementi di v, cosicché f°u sarebbe un sottoinsieme di v, — ma questo è impossibile, perché, per il teorema di Cantor, il numero cardinale di f‘u dev'essere maggiore di quello di v,, e nessun sottoinsieme di un insieme può avere un numero cardinale maggiore dell’insieme stesso. Da ciò deriva che la supposizione che esistano sia la classe w di tutte le classi sia la classe f‘w — cioè l’insieme potenza dell’insieme v,, dato dall’unione dei membri di u — conduce alla conclusione contraddittoria che f‘w è e non è una classe." Il rinvenimento di questa forma comune è importante, agli occhi di Russell, per due ragioni. In primo luogo essa dimostra che i paradossi di Russell, di Burali-Forti e di Cantor non sono affatto casi isolati — affrontabili con espedienti ad hoc —, ma esempi di una classe infinita di paradossi che esibiscono la stessa forma. In secondo luogo, l’esame di questa forma comune può suggerire una diagnosi sul motivo per cui i paradossi sorgono. Secondo Russell: [...] le contraddizioni risultano dal fatto che, secondo gli assunti logici correnti, ci sono processi e classi che possiamo chiamare autoriproduttivi [self-reproductive]. Cioè, ci sono alcune proprietà tali che, data una qualsiasi classe di termini aventi tutti una tale proprietà, possiamo sempre definire un nuovo termine avente anch'esso la proprietà in questione. Quindi non possiamo mai riunire tutti i termini aventi la detta proprietà in un tutto; perché, ogniqualvolta speriamo di averli tutti, la collezione ottenuta procede immediatamente a generare un nuovo termine avente pure la detta proprietà.”
Secondo
la tesi sostenuta in “On some difficulties...”, le contraddizioni
mostrano dunque che una “funzione
proposizionale” di una variabile non sempre determina una classe e che non sempre una “funzione proposizionale” di più variabili determina una relazione in estensione. Russell chiama predicative quelle “norme” che definiscono una classe o una relazione in estensione; chiama invece impredicative quelle “norme” che non definiscono classi o relazioni in estensione. L'analisi dei paradossi logici mostra — secondo Russell — che non tutte le norme possono ritenersi predicative. Resta la questione se esista qualche norma predicativa o se tutte le norme siano impredicative. Una soluzione ai paradossi può essere cercata — dice Russell — nella prima o nella seconda direzione: cioè affermando che alcune, ma non tutte le norme determinano classi o, alternativamente, che non esiste al-
cuna norma che determina una classe.”
!8 V. Russell [1906a], $ I, pp. 142-143. '° Con una piccola modifica del ragionamento appena svolto, si ricava il paradosso di Cantor in una forma che concerne la classe di tutti i numeri cardinali. Siano infatti @ la proprietà di essere un numero cardinale, u una classe di numeri cardinali, e “f‘w” significhi: “il numero cardinale dell’insieme potenza dell’insieme unione, v,, dell’insieme di tutte le classi che hanno un numero cardinale appartenente a w”. Secondo la concezione di Russell, tutte le classi che hanno un certo numero cardinale sono elementi di quel numero cardinale, quindi, in questa prospettiva, si può descrivere v, come l’insieme unione dell’insieme di tutti gli elementi degli elementi di u. Per il teorema di Cantor, l’insieme potenza di v,, deve avere un numero cardinale, f‘u, maggiore di quello di v,. Ne segue che il numero cardinale f‘v non può appartenere a u, perché se esso fosse un membro di x, allora, secondo la definizione di v,, v, avrebbe come sottoinsieme il suo insieme potenza — cosa impossibile, perché nessun insieme può avere un sottoinsieme con un numero cardinale maggiore dell’insieme stesso. Pertanto, la supposizione che esistano la classe w di fusti i numeri cardinali e il numero cardinale f‘w — cioè il numero cardinale dell’insieme potenza di v,, — conduce alla conclusione contraddittoria che f‘w è e non è un numero cardinale.
20 Russell [1906a], $ I, p. 144. 2! V_ Russell [1906a], $ II, p. 145.
570
capitolo 8
Se si sceglie la prima strada — cioè si ammette che alcune funzioni proposizionali siano predicative — si può, dice Russell, optare per due teorie, che egli chiama, rispettivamente, teoria dello zigzag (zigzag theory) e teoria della limitazione di grandezza (theory of limitation of size)? La seconda strada — consistente nel negare che esistano funzioni predicative e dunque che esistano entità come le classi e le relazioni in estensione — si sviluppa invece in quella che Russell chiama teoria senza classi (no class theory). Si osservi che, nel contesto delle locuzioni “teoria dello zigzag”, “teoria della limitazione di grandezza” e “teoria senza classi”, Russell usa il termine “teoria” per indicare un tipo di teoria; in altre parole, egli ammette che ciascuna di queste “teorie” possa assumere forme tra loro diverse.” Nei prossimi paragrafi illustreremo queste “teorie”’: le e prime due, così come Russell le descrive in “On some difficulties...”; la terza, riferendoci soprattutto dell’esposizione più completa che Russell ne fa in un articolo del 1906 — non pubblicato all’epoca — dal titolo “On the substitutional theory of classes and relations”.
2. LA TEORIA DELLO ZIGZAG “Teoria dello zigzag” è per Russell un nome comune, che serve a designare tutte le teorie assimilate dall’assunzione che «le funzioni proposizionali determinano classi quando sono molto semplici, mentre non possono farlo solo quando sono complicate e oscure».?* Russell non fornisce alcuna precisazione su come si debba intendere questo «complicate e oscure»; egli indica però un’importante caratteristica che ogni teoria del genere deve avere: «nella teoria dello zigzag la negazione di una funzione predicativa è sempre predicativa. In altre parole, data una qualsiasi classe, v, tutti i termini che non sono membri di u formano una classe che si può chiamare la classe non-u».° Nella teoria dello zigzag ogni classe determina quindi una bipartizione dell’universo: da una parte tutte le entità che appartengono alla classe, dall’altra tutte le entità che appartengono al suo complemento. Perché debba essere così è abbastanza chiaro: se ciò che determina la predicatività di una funzione è la semplicità di forma (comunque questo concetto si voglia precisare), una funzione dalla forma semplice, e quindi predicativa, non può essere resa “complicata e oscura”, cioè non predicativa, da una semplice negazione. Come testimonia la sua corrispondenza con Philip Jourdain, Russell lavorò a questo tipo di teoria nel corso del 1904. Il nome “teoria dello zigzag” è più tardo, ed è dovuto al fatto che le funzioni che secondo questa teoria non determinano classi sono accomunate dall’avere un andamento “a zigzag” rispetto alla partizione dell’universo in due classi generata da una classe qualsiasi u. Spiega Russell: «Se [...] @!x è una funzione non predicativa, ne segue che, data una qualsiasi classe v, ci devono essere o membri di u per cui @!x è falsa, o membri di non-u per cui g!x è vera».°° Per dirla in altro modo, una funzione @ è non predicativa se e solo se non determina una classe:
-Gu)
(px =xe 1),
e ciò può essere vero — come spiega Russell in una lettera a Jourdain del 4 giugno 1904 — se e solo se «o @x [@!x, nella notazione scelta nell’articolo “On some difficulties...’’]
è qualche volta vera quando x € w è falsa, o
@x è qualche volta falsa quando x € u è vera»,”” ossia se: (MA e un-p!x)v A)y e uan P!x)).
Se non fosse così, ci sarebbe una classe u tale che «p! x sarebbe vera quando, e solo quando, c è un membro di wu; n > ° È 2 è 5 A è cosicché @!x sarebbe predicativa».°* Quella che noi abbiamo espresso simbolicamente con la formula precedente è, dice Russell, «la proprietà dello zigzag che dà il nome alla teoria che stiamo esaminando».
22 V. ibid. 23 Russell chiarisce quest’uso in una lettera a Jourdain del 21 marzo 1906 (v. in Grattan-Guinness [1977], p. 84).
24 Russell [1906a], $ II, pp. 145-146. 2° Russell [1906a], $ II, p. 146. 2° Russell [19062], $ II, p. 146. 27 In Grattan-Guinness [MO7ZNpS36:
28 Russell [1906a], $ II, p. 146. 2° Ibid.
Le teorie dello zigzag, della limitazione di grandezza, e senza classi
571
Russell osserva che quali funzioni debbano essere considerate predicative e quali no, in una teoria dello zigzag, dovrebbe essere stabilito tramite degli assiomi. Egli però non indica quali potrebbero essere questi assiomi; si limita ad affermare che essi «devono essere enormemente complicati [exceedingly complicated) e non si possono raccomandare per alcuna plausibilità intrinseca».?” Questo giudizio deriva a Russell dalla circostanza che: [...] finora, nel tentativo di stabilire gli assiomi per questa teoria, non ho trovato alcun principio guida eccetto quello di evitare le contraddizioni; e questo, in sé, è un principio del tutto insufficiente, giacché ci lascia sempre esposti al rischio che ulteriori deduzioni provochino contraddizioni.*!
Russell si riferisce evidentemente alle difficoltà da lui incontrate nel tentativo di sviluppare una teoria dello zigzag nel 1904. Egli aggiunge però che è possibile che queste difficoltà siano un giorno superate, per cui la teoria non è senz’altro da respingere, ma piuttosto da rubricare tra quelle possibili. Nel quadro di una teoria dello zigzag — spiega Russell — si può evitare la contraddizione di Burali-Forti negando che la funzione “@ e 8 sono numeri ordinali, e @ è minore di £#” sia predicativa.?? Detto altrimenti, si risolverebbe la difficoltà del massimo numero ordinale negando che la classe di tutti i numeri ordinali formi il campo di una relazione seriale. Sempre nel quadro di una teoria del genere, la difficoltà relativa al paradosso di Cantor si può invece risolvere — suggerisce Russell — negando che siano predicative le funzioni che definiscono quelle sottoclassi della classe universale le quali, nello sviluppo del teorema di Cantor, si dimostrano non poter essere correlate con un elemento di tale classe.?* Russell ne conclude che «in questa teoria c’è un numero cardinale massimo, ma non c’è un ordinale massimo:
in ciascun caso si evitano le contraddizioni considerando certe funzioni
come non predicative».?*
3. LA TEORIA DELLA LIMITAZIONE DI GRANDEZZA Come la teoria dello zigzag, anche la teoria della limitazione di grandezza può assumere forme disparate, accomunate stavolta non dall’escludere le classi definite da funzioni proposizionali che mancano di una certa semplicità di forma, ma dall’escludere le classi “troppo grandi”. Questo comporta che, all’opposto di quanto accade nella teoria dello zigzag, il complemento di una classe non esista mai: «se v è una classe, ‘“x non è un elemento di u” è sempre non-predicativa; quindi non c’è una classe come non-w».? In altre parole, nella teoria della limitazione di grandezza una classe non determina una bipartizione dell’universo: da una parte tutte le cose che fanno parte della classe, dall’altra tutte le cose che fanno parte del suo complemento. Che cosa può far pensare che una teoria del genere sia adeguata? La risposta di Russell è la seguente: Le ragioni che raccomandano questo punto di vista sono, all’ingrosso, le seguenti: Abbiamo visto, nella prima parte di questo scritto, che vi è un certo numero di processi, uno dei quali è la generazione degli ordinali, che sembrano essenzialmente incapaci di aver fine, sebbene ciascun processo sia tale che la classe di tutti i termini da esso generati (oppure una funzione di questa classe) dovrebbe essere l’ultimo termine generato da questo processo. È quindi naturale supporre che i termini generati da tale processo non formino una classe. E, se è così, sembra anche naturale supporre che qualsiasi aggregato abbracciante tutti i termini generati da uno di questi processi non possa formare una classe. Di conseguenza ci sarà (per così dire) un certo limite di grandezza che nessuna classe può raggiungere; e qualunque supposta classe raggiunga o sorpassi questo limite è una classe impropria, ossia una nonentità.?°
Ma quale dev'essere il limite che una classe non può raggiungere o superare? Alla fine del $ 2.2 del cap. 4, avevamo visto che, in “On some difficulties...”, Russell dimostra che la classe che dà origine al suo paradosso non
30 Russell [1906a], $ II, p. 147. In una lettera a Jourdain datata 15 marzo 1906 Russell ricorda: «Per la maggior parte dell’anno [il 1904], aderii alla teoria dello “zigzag”, e lavorai a diversi insiemi di proposizioni primitive riguardo a quali funzioni determinino classi. Ma non ottenni mai un insieme di proposizioni primitive che davvero funzionasse, e tutti gli insiemi erano terribilmente complicati e privi di ovvietà [horribly complicated and non-obvious]» (in Grattan-Guinness [1977], p. 79).
°! Ibid.
32 V. Russell [1906a], $ II, p. 148.
33 V. ibid. * Ibid.
3° Russell [1906a], $ II, p. 152.
3° Ibid.
572
capitolo 8
può essere più piccola di quella di tutti i numeri ordinali.?” Russell enuncia anzi la sua dimostrazione in termini più generali, secondo cui tutte le classi paradossali (note) hanno una potenza non inferiore a quella della classe di tutti inumeri ordinali.?* Egli parte dalla formula cui riduce tutti i paradossi logici (insiemistici) conosciuti:
(M(M(e 1) D3 PM) > (fu) € un Pf), osservando che, ogni volta che si hanno una proprietà @ e una funzione f che soddisfino la formula precedente, si può produrre una serie di entità che abbiano tutte la proprietà @ e che abbia la stessa potenza della classe di tutti i numeri ordinali. La tecnica di Russell è di prendere un oggetto che abbia la proprietà @ e associarlo al numero ordinale 0, associando poi a ogni numero ordinale seguente 1’f deila classe di tutti gli oggetti associati ai numeri precedenti. Nel caso del paradosso di Burali-Forti, l'associazione è ovvia, ma proviamo a seguire il metodo di Russell. Sia dunque @ la proprietà di essere un numero ordinale e f la funzione che, prendendo come argomento una qualsiasi classe di numeri ordinali, dà come valore il numero ordinale 1 se la classe contiene solo il numero ordinale di ? altrimenti dà come valore il numero ordinale della serie ben ordinata, in ordine di grandezza, di tutti i
numeri ordinali non maggiori di almeno un elemento della classe. Associamo a se stesso il numero ordinale 0, f{0} al numero ordinale 1, f{0, /{0}} (cioè il numero ordinale della serie di ordinali che contiene solo 0 e 1) al numero ordinale 2, f{0, f{0}, f{0, f{0}}} (cioè il numero ordinale della serie di ordinali che contiene solo 0, 1 e 2) al numero ordinale 3, e così via. Prendiamo ora un caso meno ovvio: il paradosso di Russell. Qui, come sappiamo, la proprietà @ è la proprietà di essere una classe che non appartiene a se stessa, e fè una funzione che, prendendo come argomento una classe, dà come valore la classe stessa. Associamo una qualsiasi classe & che non sia un elemento di se stessa con il numero ordinale 0, f{ &} (={ @}) sarà allora associata al numero ordinale 1, f{@& {@}} (={@, {}}) al numero ordinale 2, f{& {2}, {a, {2}}} {a {a}, {a {a}}}) al numero ordinale 3, e così via. Poiché, per la formula precedente, f(u) ha la proprietà @ per qualsiasi u, avremo una serie di classi non appartenenti a se stesse ordinalmente (e quindi cardinalmente) simile alla serie di tutti i numeri ordinali. La strada sembra dunque promettente: pare che, eliminando le classi “troppo grandi”, si possano spazzar via tutti i paradossi logici (insiemistici). In effetti, le teorie assiomatiche degli insiemi più seguite del Novecento si possono vedere proprio come forme di teoria della limitazione di grandezza. Mi riferisco ai sistemi noti come ZF e NBG, sviluppatisi a partire dalla teoria assiomatica informale proposta da Zermelo nel 1908 e dal sistema proposto da von Neumann nel 1925. Questi sistemi erano di là da venire, ma già all’epoca di “On some difficulties...” l’idea che per far fronte ai paradossi insiemistici bisognasse limitare in qualche modo la grandezza degli insiemi non era una novità. Nel cap. 4 ($ 2.1.3) abbiamo visto che questa era l’idea di Cantor e che Jourdain era giunto, indipendentemente, a conclusioni simili. In un articolo del 1904, Jourdain aveva avanzato la proposta di considerare “inconsistente” (inconsistent) ogni aggregato (aggregate)! avente una sottoclasse (non necessariamente propria) i cui membri possano correlarsi biunivocamente con quelli dell’aggregato di tutti i numeri ordinali.*! Jourdain aveva poi esposto la sua idea a Russell, in una lettera del 17 marzo 1904. In “On some difficulties...”,4* Russell cita effettivamente Jourdain come un sostenitore della teoria della limi-
tazione di grandezza. C°è però una differenza, tra la descrizione fatta in quest'articolo della teoria della limitazione di grandezza e la proposta di Jourdain, rilevata dallo stesso Jourdain in due lettere a Russell del 28 dicembre 1905 e del 21 marzo 1906.* Russell sostiene che la teoria della limitazione di grandezza richiede la negazione dell’esistenza delle classi “troppo grandi”: per esempio, secondo Russell, il paradosso di Burali-Forti si risolve, nel contesto della teoria della limitazione di grandezza, negando che esista una classe di tutti gli ordinali — e non, come nel caso della teoria dello zigzag, negando che questa classe abbia un numero ordinale. Altro esempio: nel quadro della teoria della limitazione di grandezza, secondo Russell, il paradosso di Cantor si risolve negando che vi sia una classe di tutte le entità, o che vi siano classi altrettanto grandi —
laddove, invece, nella teoria dello zig-
zag si ammetteva una classe di tutte le entità, ma si rifiutavano come non predicative quelle sottoclassi della clas-
37 La dimostrazione è attribuita da Russell a George G. Berry (v. Russell [1906a], $ I, p. 143, nota 2). 38 V. Russell [1906a], $ I, p. 143.
°° 40 4 4
Per la giustificazione di questa clausola, v. sopra, nota 17. “Aggregato” (aggregate), è la traduzione scelta da Jourdain per il cantoriano Menge (v. Cantor [1915]). V. Jourdain [1904], $ 4, pp. 66-67. V. anche sopra, cap. 4, $ 2.1.3. Ora in Grattan-Guinness [1977], pp. 27-28.
43 V. Russell [19062], $ I, p. 152, nota. 4 V. in Grattan-Guinness [1977], pp. 66-68 e p. 84.
Le teorie dello zigzag, della limitazione di grandezza, e senza classi
57
(PS)
se universale che, nella dimostrazione del teorema di Cantor, non possono essere correlate con un elemento di tale
classe. Jourdain aveva, in proposito, un’idea diversa: come spiega a Russell nella lettera del 28 dicembre 1905, egli pensava a una teoria della limitazione di grandezza in cui le classi inconsistenti (troppo grandi) siano classi a pieno titolo; solo, classi che non hanno numeri cardinali, né numeri ordinali. In un passo di un articolo del 1905,5°
Jourdain rileva che “assolutamente infinito” [absolutely infinite] sarebbe stata una locuzione migliore di “inconsistente” per esprimere il suo punto di vista, perché una classe inconsistente «non è essa stessa contraddittoria (esiste nel senso matematico della parola), ma non esiste un suo numero cardinale o tipo [d’ordine]».!° Egli riteneva
dunque che le classi inconsistenti fossero tali perché caratterizzate da un'infinità assoluta, che non può essere trattata matematicamente — una posizione vicina a quella di Cantor. Russell rispose alla lettera di Jourdain il primo gennaio 1906: Penso che sia dimostrabile che le classi inconsistenti non sono classi o qualcos’altro, ma sono semplici errori. Ora io estendo questo a tutte le classi. L'errore mi sembra risiedere nel supporre che molte entità si combinino sempre per formare una nuova entità, la classe da esse composta. Nel caso particolare delle classi inconsistenti, questo si può (penso) provare; negli altri casi lo adotto come l’ipotesi più semplice e conveniente.”
Il riferimento di Russell all'esclusione dell’esistenza di tutte le classi deriva dalla sua recente idea (ne parla per la a volta a Jourdain in una lettera del 2 novembre 1905‘) di adottare una peigpare forma di teoria senza clasi: quella teoria sostituzionale di cui parleremo nel prossimo paragrafo. Per ora c’interessa un’altra questione: dr Russell utoreya impraticabile l’idea di Jourdain di considerare esistenti le classi “troppo grandi”? Possiamo comprenderlo” seguendo un argomento esposto nel primo paragrafo di “On some difficulties...”.°° Russell si richiama alla forma comune ai paradossi logici data dalla sua formula:
(1)(Me
13 PM)
(f() € UA P/(U)))).
Considerando dapprima il paradosso di Burali-Forti, egli nota che tale contraddizione si può evitare sia sostenendo che la classe w di tutti gli x che sono @ — cioè la classe di tutti i numeri ordinali — non esista, sia sostenendo che non esista f(w) — cioè il numero ordinale di w. La seconda opzione, naturalmente, è quella che Jourdain preferiva. Ma Russell osserva che essa non è più possibile con il paradosso della classe w di tutte le classi che non appartengono a se stesse: qui l’unica opzione possibile sembra essere quella di negare l’esistenza di w; infatti, non si può negare l’esistenza di f(w) ammettendo quella di w perché f(w) = w.°! A Jourdain il punto era inizialmente sfuggito” perché aveva a la propria teoria pensando al paradosso di Burali-Forti e alla possibilità di dimostrare il teorema del buon ordinamento (v. sopra, cap. 4, $ 2.1.3) — ma difficilmente il problema poteva passare inosservato allo scopritore del paradosso di Russell. Una difficoltà della teoria della limitazione di grandezza, è che le definizioni russelliane di “numero ordinale” e di “numero cardinale” non si possono più utilizzare, se si vuole negare l’esistenza di insiemi non più piccoli di quello di tutti i numeri ordinali. Tali definizioni, infatti, identificano ogni numero ordinale con la classe di tutte le relazioni ordinalmente simili a una relazione seriale ben ordinata data, e ogni numero cardinale con la classe di
tutte le classi cardinalmente simili a una classe data. Ma questo comporta che ciascun numero ordinale, eccetto il numero ordinale 0, e ciascun numero cardinale, eccetto il numero cardinale 0, sia una classe troppo grande per e4 Vv. Jourdain [1905a], $ 8, p. 54. 40 Ibid. Si veda anche la lettera di Jourdain a Russell del 24 maggio 1904 (ora in Grattan-Guinness [1977], pp. 34-35), in cui Jourdain dice:
«la mia terminologia è cattiva sotto ogni aspetto» (Grattan-Guinness, p. 34). 47 In Grattan-Guinness [1977], p. 68. 48 V. in Grattan-Guinness [1977], p. 56.
49 Questo suggerimento si deve a Michael Hallett ([1981], $ 2, p. 389).
50 V. Russell [1906a], $ I, pp. 142-143. °! Ho scritto “sembra essere” perché, in realtà, vi sarebbe anche l’opzione di ammettere che w esista, ma non sia un genere di molteplicità che possa essere, o non essere, un elemento di altre molteplicità. Questa sarà la proposta di von Neumann [1925], di cui parleremo nel cap.
12, alla fine del $ 1.1.3. °? Jourdain cambierà in seguito idea, riguardo all’esistenza di aggregati inconsistenti (v. Hallett [1981], $ 4, pp. 392 e 394). Nella primavera del 1906 egli sostiene che alcuni aggregati inconsistenti non esistono (per es., l’insieme di Russell e i numeri di Russell), mentre altri (per es., quello di tutti i numeri ordinali) esistono (v. Jourdain [1906], pp. 268, 269, 282, 283). Una posizione del genere appare non solo ad hoc, ma opera una distinzione tra insiemi inconsistenti che non può essere giustificata sulla base della loro grandezza. Più tardi, nel 1917, Jourdain rifiuterà le classi inconsistenti come entità (v. Jourdain [1917], p. 150).
capitolo 8
574
È
i
È
3
o
saro . N. z : sistere, perché — come osserva lo stesso Russell sia in “On some difficulties...”,°” sia in un paio di lettere a Jourdain°' — ognuno di questi numeri avrebbe tanti elementi quanti sono tutti gli oggetti dell’universo (e quindi certamente non meno elementi della classe di tutti gli ordinali).’? Ecco perché Russell scrive:
La teoria dello zigzag, in una forma o nell’altra, è quella assunta nella definizione dei numeri cardinali e ordinali come classi di
classi (se si ammette che i numeri siano entità). Perché tutte queste classi di classi, se sono legittime, devono contenere tanti mem-
bri quante sono le entità complessivamente; quindi se la grandezza fa cadere le classi, come supponiamo nella teoria della “limitazione di grandezza”, i cardinali e gli ordinali così definiti saranno classi illegittime.
La soluzione ovvia a questa difficoltà è di cercare una definizione dei numeri che non richieda l’uso di insiemi “troppo grandi”. Nel 1906, Jourdain prefigurò quella che poi sarebbe stata la definizione di von Neumann,” proponendo di identificare il numero ordinale 0 con la classe vuota, ciascun altro ordinale con la serie dei numeri ordinali
che lo precedono,
e il numero
cardinale
di un
ordinale
come
la classe
di tutti i predecessori
di
quell’ordinale. Seguendo questa definizione, però, si ottiene un diverso numero cardinale (una diversa classe) per ogni ordinale transfinito;”” mentre sappiamo che, al contrario, numeri ordinali transfiniti diversi possono essere numeri ordinali di serie i cui campi sono classi aventi la medesima potenza. L'errore è tuttavia facile da emendare, ed è lo stesso Russell a farlo, in una lettera a Jourdain del 14 giugno 1906, osservando che un numero cardinale si potrebbe identificare con il primo numero ordinale tra quelli aventi lo stesso numero cardinale di predecessori. La definizione proposta da Russell è qui esattamente quella che von Neumann adotterà nel 1923. Ma essa non poteva soddisfare Russell, perché si può applicare solo ai numeri cardinali di insiemi che possono essere ben ordinati, cosicché, in mancanza di una dimostrazione che ogni numero cardinale è un alef, lascerebbe indefiniti i numeri cardinali degli eventuali insiemi non ben ordinabili. È vero che, nel 1904, Zermelo aveva dimostrato il teo-
rema del buon ordinamento, secondo cui ogni insieme può essere ben ordinato — e dunque ogni numero cardinale è un alef — (v. sopra, cap. 4, $ 4.2.3), ma la sua dimostrazione richiedeva l’assioma di scelta, che Russell considerava dubbio (v. sopra, cap. 4, $ 4.3) — e uno dei motivi principali di ciò era proprio che esso consentiva di dimostrare il teorema del buon ordinamento. Un'altra difficoltà della teoria della limitazione di grandezza è che essa non ci dice, di per sé, quali classi siano troppo grandi. I paradossi dimostrano che la classe di tutti gli ordinali è troppo grande, e che quindi sono troppo .
53 V._ il passo riportato poco più avanti. 9 Una del 28 aprile 1905 (ora in Grattan-Guinness [1977], pp. 43-49) l’altra del primo gennaio 1906 (ora in Grattan-Guinness [1977], pp. 67-68). I passi cui mi riferisco sono, rispettivamente, a p. 49 e a p. 67. 59 Nella lettera a Jourdain del 28 aprile 1905, Russell fa l'esempio del numero 1, che — secondo la sua definizione — è composto di tante classi quante sono tutte le entità. Un modo semplice di vedere che i numeri ordinali e cardinali — definiti alla maniera di Russell — non possono contenere meno elementi di quanti siano complessivamente i numeri ordinali è osservare che ciascun numero ordinale n può essere sia correlato con la serie di mm numeri ordinali da n compreso in poi (queste serie avrebbero tutte m elementi e dunque fanno tutte parte del numero ordinale rm, secondo la definizione di Russell), sia correlato con la classe di 7 numeri ordinali da n compreso in poi (queste classi hanno tutte m elementi, e dunque fanno tutte parte del numero cardinale m, secondo la definizione di Russell).
5° Russell [1906a], $ II, p. 147. È importante, in questo passo, prestare attenzione alla clausola tra parentesi — “se si ammette che i numeri siano entità” —: infatti, come vedremo, nella “teoria senza classi” i numeri possono benissimo essere definiti come classi di classi, ma poi-
ché qui il parlare di classi non è che un semplice modo di esprimersi, che non implica nessun riferimento reale a entità come le classi, le classi sono destituite di qualsiasi esistenza reale, e i numeri stessi, essendo definiti come classi (di classi), si trovano a non essere vere enti-
tà. °? V. von Neumann [1923], p. 347 (ediz. orig., p. 199). Von Neumann identifica ciascun numero ordinale con l’insieme di tutti i numeri ordinali precedenti. La definizione di von Neumann è oggi quella standard nella teoria assiomatica degli insiemi (v. sotto, cap. 12, $ 1.1.3). °* Si presenta qui un problema tecnico simile a quello che abbiamo trattato nel $ 4.2.3 del cap. 2, cioè che non può esistere una serie — nel senso russelliano (ordine stretto totale), che Jourdain sembra accettare — di un solo elemento. La difficoltà si può risolvere in diversi modi,
per esempio stipulando che il numero ordinale 1 sia {(0, 0)} (una relazione non seriale), e poi ponendo gli altri numeri ordinali come uguali a relazioni seriali: 2= {(0, 1)}, 3= {(0, 1), (0, 2) (1, 2)} e così via. Oppure si può sviluppare la serie degli ordinali considerando i predecessori di ciascun numero ordinale come ordinati non da una relazione seriale (di ordine stretto totale), 2”. Ma, se ora prendiamo 2 come nostro soggetto iniziale, cosicché il prototipo sia “2 > 2”, la sostituzione di x dà “x > x, che non è la funzione proposizionale che vo-
Le teorie dello zigzag, della limitazione di grandezza, e senza classi
577
argomenti. Per esempio, invece di ‘“@ è una funzione unità” (ossia “C’è uno, e un solo, x per cui @!x è vera”), avremo “C'è un'entità b tale che p(x/a) è vero quando, e solo quando, x è identico a 5”. Non vi sarà ora nessun’entità come il numero 1 in isola-
mento; ma potremo definire ciò che intendiamo con “Una, e solo una, proposizione del tipo p(2/a) (per un dato p e a) è vera”. Invece di dire “La classe u è una classe che ha un solo membro”, diremo (come sopra) “C'è un’entità b tale che p(/a) è vero quando, e
solo quando, x è identico a b”. Qui i valori di x per cui p(x/a) è vero rimpiazzano la classe u; ma noi non assumiamo che questi va-
lori collettivamente formino una singola entità che sia la classe da essi composta.”*
In questo contesto, Russell chiama “costituenti” di una proposizione, quelli che nei Principles sono detti termini di una proposizione,” cioè i suoi soggetti logici. La teoria abbozzata da Russell consiste dunque nel rimpiazzare le espressioni di funzione proposizionale (che suggeriscono un riferimento a funzioni proposizionali, in senso ontologico non linguistico) con simboli che implicano solo un riferimento a proposizioni (in senso ontologico) e a termini di proposizioni elementari. In modo corrispondente, il parlare di classi e di relazioni in estensione dev'essere interpretato come un modo di dire, che rinvia solo a un’ontologia di proposizioni e di soggetti logici di proposizioni elementari. La spiegazione di Russell in “On some difficulties...’’ — come risulta dal brano sopra riportato — è molto sintetica; ma egli sviluppa la stessa teoria, che ora chiama “teoria sostituzionale”, in un articolo di poco successivo: “On the substitutional theory of classes and relations”.’° L'articolo fu ricevuto dalla London Mathematical Society il 24 aprile del 1906 e presentato davanti alla stessa società il 10 maggio dello stesso anno; in ottobre, tuttavia, Russell decise di ritirarlo prima della pubblicazione nei Proceedings della società, cosicché il saggio non fu pubblicato fino al 1973. Cercheremo di illustrare questa teoria — che chiameremo teoria sostituzionale semplice per distinguerla da altre versioni proposte successivamente da Russell — seguendo l’esposizione più dettagliata che di essa è offerta in quest’ultimo scritto. (Parleremo di teoria sostituzionale, senza qualificazioni, per le asserzioni che
valgono per tutte le versioni di teoria sostituzionale successivamente adottate da Russell.) Qualsiasi forma di “teoria senza classi”, naturalmente, deve fornire un metodo per interpretare gli enunciati che, in apparenza, vertono su classi o su relazioni in estensione, senza assumere che esistano realmente entità co-
me le classi e le relazioni in estensione. Nella teoria sostituzionale, ciò si realizza interpretando le espressioni che apparentemente si riferiscono a funzioni proposizionali in senso ontologico e le espressioni che apparentemente si riferiscono a classi e relazioni in estensione, solo nel contesto degli enunciati in cui esse compaiono, in modo che — una volta che esse siano state parafrasate — non rimangano nella parafrasi altri riferimenti che a proposizioni e ai termini delle proposizioni. In questa teoria, le “proposizioni” sono concepite — alla maniera dei Principles — come entità non linguistiche di per sé sussistenti. Le proposizioni sono, insieme ai termini di proposizioni elementari, le uniche entità che è necessario assumere nella teoria. È importante sottolineare che — nella teoria sostituzionale semplice, proprio come nei Principles — non vi sono due generi di entità, cioè le proposizioni e i termini di proposizioni (nel senso dei Principles) elementari, ma un solo genere di entità, gli individui in generale, di cui fanno parte sia le proposizioni, sia i termini delle proposizioni elementari. Che Russell adoperi nell’esposizione (come faremo anche noi) le lettere “p”, “q’ e “Y° come costanti e variabili proposizionali e le lettere “a”, “db”, “©” e “X° come costanti e variabili non proposizionali, dev'essere preso come un semplice ausilio per l’intuizione: in realtà non vi sono, nella teoria in esame, diversi stili di variabili, ma solo variabili individuali.”
Russell comincia la sua esposizione introducendo il simbolo primitivo:
p/a'x!q (o la variante notazionale “p(x/0)! g”*) a significare “g è ciò che risulta da p sostituendo a con x in tutti quei luoghi (se ce ne sono) in cui a si presenta in p”.” Si avverta che Russell non intende parlare della sostituzione di nomi all’interno di enunciati, ma della sostituzione di entità all’interno di altre entità complesse. Non si tratta di sostituire, per esempio, il nome “Socrate” al nome “Platone” all’interno dell’enunciato “Platone è un filosofo”, ma
di sostituire Socrate, l’uomo in carne e ossa, a Platone, in carne e ossa, nella proposizione — concepita come entigliamo. [Nota di Russell.]
74 Russell [1906a], $ IT, p. 155. ATL sopra, cap. 6, $ 2.2.
7° V. Russell [1906c]. "V. Russell [1906c], p. 168 e p. 175, nota. 78 La notazione “p(x/a)” era quella proposta, come abbiamo visto, in Russell [1906a], $ II, p. 155.
7° V. Russell [1906c], p. 168.
578
capitolo 8
tà non linguistica, indipendente dai nostri enunciati e dai nostri pensieri — Platone è un filosofo. Il modo di esprimersi di Russell appare strano se si pensa a una sostituzione come qualcosa che noi possiamo fare: senza dubbio non possiamo sostituire un’entità a un’altra all’interno di proposizioni concepite in senso ontologico; possiamo solo sostituire un simbolo a un altro. Ma ciò che intende Russell non dipende da queste connotazioni del verbo “sostituire”: potremmo leggere “p/aix!q” come: “q è l'entità composta identica a p eccetto che perché l’entità x si presenta in essa al posto di a”. Il simbolo “p/aix”, che è parte di “p/a'x!g” — o, usando la notazione equivalente, il simbolo “p(2/0)” che è parte di “p(x/a)!g”È! — è una descrizione definita, di cui Russell spiega il significato con la locuzione: “ciò che risulta da p sostituendo a con x in tutti quei luoghi (se ce ne sono) in cui a si presenta in p”.È° Formalmente si ha dunque:
p/aix =ar (19)(p/a'x!q)." Il simbolo “p/a” che è parte di “p/a'x è chiamato da Russell matrice (matrix). È da notare che il simbolo “p/a”, preso da sé, non è neppure una descrizione definita, perché rappresenta l’espressione incompleta: “il risultato della sostituzione di a in p con...”.** Solo aggiungendo il nome dell’entità che si deve sostituire ad a in p si ottiene una descrizione definita. Naturalmente, tale descrizione —
osserva Russell —
è a sua volta un “simbolo incom-
pleto”, che assume un significato «solamente quando facciamo un’asserzione sul risultato della sostituzione». Secondo la teoria in esame, il simbolo “p/a” è quello che sarebbe considerato (se fosse un vero nome, e non un
simbolo incompleto) il nome di una classe. Questo simbolo è definito solo quando compare in certi contesti. Un contesto in cui il simbolo “p/a” si definisce è: “x € p/a”: x è un membro di p/a — sostiene Russell — se e solo se il risultato della sostituzione di a in p con x è vero. È qui opportuno fermarsi un attimo per esaminare un certo problema che può sorgere nell’interpretazione della teoria in esame. Il problema è come debbano essere interpretati i riferimenti che Russell fa alla nozione di ‘verità”. Per esempio, Russell scrive: «Due entità qualsiasi p e a definiscono una classe, ossia p/a, e x è un membro di questa classe se p/a'x è vero».*” La definizione di “appartenenza” sembra essere dunque:
x € p/a =x p/a'x è vero. Se ora eliminiamo la descrizione definita “p/a'x” dall’enunciato “p/a'x è vero”, secondo le prescrizioni della teoria delle descrizioni di Russell, otteniamo:
x € p/a=ar (Ap’)((9)(p/a'x!q = q= p°) A
p'è vero).
Sembra dunque che la teoria sostituzionale di Russell richieda essenzialmente l’uso di un predicato di verità attribuibile alle proposizioni. Questa è, per esempio, l'opinione di Peter Hylton ([1980]), il quale afferma: [...] la teoria sostituzionale richiede l’impiego della nozione di verità. Non possiamo, per esempio, definire l’appartenenza a una matrice se non dicendo qualcosa di equivalente a: “» è un membro di p/a” significa “il g tale che p/a'x! q è vero”. Quest’uso della nozione di verità è talvolta dissimulato dall’abitudine di Russell di usare gli enunciati ambiguamente, talvolta come nomi di proposizioni e talvolta come asserzioni di esse; ma questa stessa ambiguità fa un uso essenziale, sebbene tacito, della nozione di verità.**
#0 Quine ([1967]) dà quindi un’interpretazione inaccurata di questa teoria, quando scrive (p. 150): «L’idea centrale della teoria senza classi era che, invece di parlare della classe di tutti gli oggetti che soddisfano un dato enunciato [sentence], si potrebbe parlare dell’enunciato [sentence] stesso e di sostituzioni all’interno di esso». Il fraintendimento di Quine è senza dubbio giustificato dalla scarsa cura riservata da Russell alla distinzione tra uso e menzione dei segni.
8! Per uniformità, nel seguito ci atterremo alla prima notazione.
82 V. Russell [1906c], p. 169. 8? Nell'articolo che stiamo considerando, Russell — sicuramente per evitare complicazioni espositive in una teoria già di per sé non facilissima — evita sistematicamente di fornire vere e proprie definizioni simboliche, limitandosi a spiegare le definizioni della teoria a parole, o a proporle in una forma semi-simbolica. Nel seguito, cercherò sempre di rendere le definizioni di Russell in forma simbolica. 84 V. Russell [1906c], p. 170.
8° V. ibid., nota.
$© V_ Russell [1906c], p. 172. 87 Russell [1906c], p. 172.
** HyIton [1980], p. 25.
Le teorie dello zigzag, della limitazione di grandezza, e senza classi
579
Che il Russell precedente i Principia Mathematica usi gli enunciati talora come nomi di proposizioni e talora come asserzioni di esse è vero, ma si tratta di un’ambiguità facile da sciogliere: essi sono usati nel primo modo quando compaiono come costituenti di enunciati molecolari e nel secondo modo quando compaiono in isolamento. In effetti — come ha ben puntualizzato per primo Gregory Landini” — fino ai Principia Mathematica," Russell non concepisce le particelle logiche nel modo (oggi) standard, ovvero come segni che devono essere fiancheggiati da enunciati, ma come segni che devono essere fiancheggiati da nomi di proposizioni. In altri termini, i simboli “D”, “A”, “V”, indicano, per il Russell pre-Principia, delle relazioni tra entità non linguistiche e il simbo-
lo “-’’ indica un attributo di entità non linguistiche.”' Russell è esplicito, su questo punto. Per esempio, in “Sur la logique des relations avec des applications à la théorie des séries”, del 1901, Russell parla delle «relazioni [...]
che sono fondamentali per la logica (come e e 9)»; in una lettera a Couturat datata 5 luglio 1904 egli scrive: v
È
-
2
Letra
5
5
«[...] le relazioni fondamentali del nostro calcolo sono delle relazioni in intensione: tali sono >, €, =, ecc.»;°° un’altra lettera a Couturat del 14 marzo precedente, Russell scrive: “
LIMA
in
.=.° Ciò si definisce:
D2Gla= ID GGI Questa relazione sussiste (01) tra due P. [proposizioni] vere (B) tra due entità [étres] che non sono P. vere.?*
Nell'articolo “The theory of implication” — coevo allo sviluppo della teoria sostituzionale — Russell spiega che “p > g” significa “p implica 9g” ed «è equivalente a “se p è vera allora g è vera”, ossia “‘p è vera’ implica ‘q è vera’; è anche equivalente a “se g è falsa, p è falsa”»;” in modo del tutto analogo, egli interpreta “-p” come “p IS 96 x R 39 S D eta, non è vera””° e “p A g” come “p è vera e gq è vera”.”” Questo è un esempio tipico del modo usato da Russell per spiegare il significato dei connettivi. Ma non suffraga l’idea che le particelle logiche, per il Russell pre-Principia, debbano essere fiancheggiate da enunciati e che, per es., in “p A g” — dove (19908) “p” e 699 “97 sono nomi di proposizioni — siano impliciti dei predicati di verità. Ciò che egli intende è, per es., che la relazione A vale tra le proposizioni p e qse e solo se p è vera e q è vera. In altre parole, con le spiegazioni precedenti, Russell non fornisce un’esplicitazione nel linguaggio oggetto delle formule “p > g°, ‘“p”, “p Ag”, ma specifica informalmente le condizioni di verità degli enunciati che contengono particelle logiche (o meglio: le condizioni di verità delle proposizioni, in senso ontologico, che contengono i corrispettivi ontologici delle particelle logiche). Un’esplicitazione di “p Aq’, seguendo le definizioni dei Principles, non sarebbe “Se p è vera allora qg è vera”, ma “Per ogni proposizione r, che p implichi che g implica r, implica r°. Si osservi, d’altronde, che già nel primo paragrafo dei Princi99
66
ples Russell afferma esplicitamente che la nozione di verità è usata in matematica, ma «non è un costituente delle
proposizioni che essa considera». Si consideri, ancora, il modo in cui, nel 1902-03, Russell trascrive simbolicamente “Tutte le proposizioni della 29, « 3» 99 classe m sono vere”: “(g)(g e m > 9)”. Se supponiamo che il segno “D” debba qui essere inteso nel modo oggi standard, ne deriva che, ogni volta si specifica un valore per la variabile “9”, ci si trova con un condizionale in cui l’antecedente è un enunciato (l’enunciato che una certa cosa appartiene a m), ma il conseguente lo è solo se integrato da un implicito predicato di verità. Ma per Russell, in “q € m > g”, sia l’antecedente, sia il conseguente soSA V., per es., Landini [1998a], $ 2.1, pp. 43-44, Landini [2003], pp. 249-251, Landini [2004b], pp. 379-380, e Landini [201 1a], cap. 3, pp.
137-140. V. anche Stevens [2005], cap. 3, pp. 70-71. 90 Per la situazione nei Principia, si veda per es. Landini [1998a], $ 10.1, p. 255, e $ 10.2, p. 258. Poiché nell’ontologia dei Principia (1910) non esistono più proposizioni in senso ontologico non linguistico, ma solo enunciati, le particelle logiche dei Principia non possono più essere, come nel Russell precedente, simboli che fiancheggiano nomi di proposizioni, ma devono essere particelle enunciative, ossia fiancheggianti enunciati. Detto altrimenti: non essendoci più proposizioni, nell’ontologia dei Principia, i connettivi non possono più indicare relazioni tra proposizioni. 2 V_ anche, sopra, cap. 6, $ 3. Una concezione simile dei connettivi — come simboli che denotano funzioni da entità a valori di verità — è
sostenuta da Frege (v. sopra, cap. 5, $ 1). ?2 Russell [1901e], p. 4. Nella simbologia peaniana che usa Russell all’epoca, il segno “O” simboleggia sia l’implicazione sia l'inclusione.
93 24 9 °© 97 *
In Russell [2001], p. 417. In Russell [2001a], p. 372. V. Russell [1906b], p. 162. V. Russell [1906b], p. 164. V. Russell [1906b], p. 175. Russell [1903a], $ 1, p. 3.
?? V. sopra, cap. 6, $ 11.1.
capitolo 8
580
no, in realtà, nomi di proposizioni — nomi di entità tra cui vale la relazione indicata da “D” se e solo se la proposizione indicata da “q e m” è falsa o la proposizione indicata da “9” è vera. Ciò significa che una descrizione definita, per Russell, può benissimo occupare il posto di “p”, di “9”, o di entrambi, in “p> g”, “pp”, “p Aq”, “pv q”, “p= q’”, “p= q': Vintero enunciato riceverà un’interpretazione sulla base delle stesse regole che permettono di interpretare — nella teoria delle descrizioni di Russell — una formula del tipo “aRb”, dove R è una relazione diadica, quando descrizioni definite compaiono al posto del nome “a”, del nome “b”, o di entrambi.
Naturalmente, gli enunciati non si possono interpretare come nomi di proposizioni anche quando compaiono in isolamento: in una riga di una dimostrazione, per es., dobbiamo sempre avere un enunciato, non un nome proprio.
Quando compaiono in isolamento, e non nel contesto di un enunciato più ampio, gli enunciati si devono interpre-
tare come asserzioni. Ciò tuttavia non contrasta con la prospettiva di Russell all’epoca, che vedeva in un enunciato qualcosa che può sia nominare, sia asserire una proposizione." Nel primo caso si ha ciò che, nei Principles, è chiamato concetto proposizionale (ciò che è indicato da espressioni come, per es., “la morte di Cesare”) , nel secondo si ha ciò che, nei Principles, è chiamato proposizione asserita (per es., ciò che è indicato da “Cesare morì”). Ma concetto proposizionale e proposizione asserita differiscono, per Russell, solo dal punto di vista psicologico, essendo, di fatto, la stessa entità; scrive Russell: [...] è difficile vedere come “Cesare morì” differisca da “la verità della morte di Cesare”, nel caso in cui ciò sia vero, o da “la falsi-
tà della morte di Cesare” nell’altro caso. Tuttavia è chiarissimo che questa, in ogni caso, non è mai equivalente a “Cesare morì”. E chiaro che ci dev'essere una nozione fondamentale di asserzione, data dal verbo, che si perde appena sostituiamo [al verbo] un nome verbale, e si perde quando la proposizione in questione è resa soggetto di qualche altra proposizione. Ciò non dipende dalla forma grammaticale; perché se dico “Cesare morì è una proposizione”, non asserisco che Cesare morì, e un elemento che è presente 59) x in “Cesare morì” è scomparso. [...] La via più ovvia sarebbe dire che la differenza tra una proposizione asserita e una non asserita v } È i } È Lasi ad p & : 101 non è logica, ma psicologica. Nel senso in cui le proposizioni false possono essere asserite, questo è senza dubbio vero.
Il concetto proposizionale sembra, in effetti, non essere altro che la proposizione stessa, la differenza essendo semplicemente quella psicologica che noi non asseriamo la proposizione in un caso, e la asseriamo nell’altro.!°
Vi sono dunque due modi in cui si può pensare a un oggetto, nel caso che quest’oggetto sia un complesso: lo si può rappresentare [vorstellen], oppure lo si può giudicare [urtheilen]; l'oggetto è però in entrambi i casi lo stesso (per es. quando si dice “il vento freddo” e quando si dice “il vento è freddo”).!9
In armonia con la teoria dei Principles, le proposizioni russelliane si devono dunque considerare come entità che — analogamente ai concetti, che possono comparire come termini in certi contesti e in altri contesti no — compaiono come termini se inserite in un’altra proposizione, e come proposizioni asserite quando compaiono in isolamento. Se, tuttavia, si pone:
x € p/a =x p/a'x, sembra problematico interpretare ‘x e p/a” quando compare in isolamento. Infatti, se “x € p/a” è una descrizione definita, e una descrizione definita non ha — come sostiene sempre Russell — nessun significato in isolamento, si dovrebbe concluderne che “x € p/a”, preso da sé, non ha nessun significato: una conclusione sicuramente assurda. Per la soluzione di questo problema si può guardare a ciò che Russell dice pochi anni dopo nei Principia, dove — come vedremo nel cap. 10 — tutti gli enunciati sono interpretati come descrizioni definite. Nel secondo capitolo dell’introduzione ai Principia, Russell scrive: [...] l’espressione [phrase] che esprime la proposizione è ciò che chiamiamo simbolo “incompleto” [...] [in una nota a piè di pagina inserita a questo punto, Russell rinvia al cap. 3 dell’introduzione ai Principia, dove sono trattati i simboli incompleti]; esso non ha significato in se stesso ma richiede qualche integrazione [supplement] al fine di acquisire un significato completo. Questo fatto è in qualche modo celato dalla circostanza che il giudizio stesso fornisce un’integrazione sufficiente, e che il giudizio in se stesso non
1° Che, per Russell, «le proposizioni sono sia nominabili sia asseribili dagli enunciati», e che «questa concezione delle proposizioni pone in grado di fare a meno di qualsiasi menzione esplicita della verità in logica», è rilevato già in Goldfarb [1989], p. 238.
!0! Russell [1903a], $ 52, pp. 48-49; corsivo mio. 102 Russell [1903a], $ 499, pp. 526-527. !03 In Frege [1976], p. 242 (lettera di Russell a Frege datata 24 maggio 1903).
Le teorie dello zigzag, della limitazione di grandezza, e senza classi
581
fa nessuna aggiunta verbale alla proposizione. Così, “la proposizione ‘Socrate è umano”” usa “Socrate è umano” in un modo che richiede un’integrazione di qualche genere prima di acquisire un significato completo; ma quando io giudico “Socrate è umano”, il significato è completato dall’atto di giudicare, e non abbiamo più un simbolo incompleto."
Da ciò possiamo trarre la conclusione che, per Russell, quando “xe p/a” compare da solo, è integrato dall’asserzione stessa di “x e p/a”, che non fornisce nessun supplemento verbale al simbolo, ma fornisce comunque un contesto che rende significante la descrizione “p/a'x”. Così, il significato di “x e p/a”, in isolamento, sarà l’asserzione di ciò che risulta da p sostituendo a con x in tutti quei luoghi (se ce ne sono) in cui a si presenta in p. Ciò non rende necessario nessun predicato di verità implicito: l’interpretazione di ‘“p/a'x” sarà semplicemente:
(Ap”((g)(p/a'x! q = p'= q) Ap’), dove un predicato di verità — nell’interpretazione di Russell — non è affatto necessario. Procediamo ora nell’esposizione della teoria sostituzionale semplice. Si osservi che in questa teoria l’“appartenenza” a una classe non è più una nozione primitiva — come accadeva nei Principles — ma è definita dalla formula: x € p/a =x p/a'x, dove l’espressione “p/a” «non è il nome di un’entità, ma una semplice parte dei simboli che sono nomi di entiNEM105 GELE vr À 2 n È fifa tà». © Russell chiarisce la definizione con un esempio. Supponiamo di voler interpretare la proposizione espressa dall’enunciato “Platone è un elemento della classe degli uomini”: Prendiamo “Socrate è umano” come p, e “Socrate” come a.['] Allora x appartiene alla classe p/a se, quando si sostituisce x a Socrate in “Socrate è umano”, il risultato è una proposizione vera. Così se definiamo la classe degli uomini come la classe p/a, troviamo che Platone è un uomo, perché p/a'Platone . = . Platone è umano, che è una proposizione vera.!”
Per mezzo della nozione primitiva di “sostituzione”, Russell definisce anche l'identità:
ENI dove il definiens si legge: “Il risultato del sostituire y a x in x è ancora x”. Questa definizione è così spiegata da Russell: «È ovvio che il risultato del rimpiazzare x con y è y; così questo [cioè che il risultato di sostituire x con y sia x] può verificarsi solo se x e y sono identici; questo giustifica la definizione». '* Un’espressione del tipo “p/a = g/b”, esprime invece l’uguaglianza (equality) tra due matrici (che, lo ricordiamo, non sono entità), ed è definita da Russell come un’abbreviazione di: “Per tutti i valori di “x”, p/a'x e g/b'x so6.99
o
90100
no equivalenti”;
ò
È
in simboli:
p/a = q/b =a (x) (p/a'x = q/b'x). Eliminando le descrizioni otteniamo:
p/a= g/b=a () (Ap) Ag)()(p/a'x!r =r=p’) A (8)(g/b'x!s =s=q)Ap'=q).
!©4 [PM], vol. I, introduzione, cap. 2, $ III, p. 44. !05 Russell [1906c], p. 170. 106 Si noti che qui, nonostante la presenza delle virgolette, Russell non sta parlando di segni, ma delle entità cui i segni si riferiscono. In tutta la produzione filosofica di Russell, le virgolette non hanno un valore ben definito. Talvolta, sono utilizzate nel loro uso oggi più comune: quello di denotare un’espressione. Talvolta, Russell le utilizza per denotare un concetto che costituisce il significato di un'espressione. Altre volte, come in questo caso, le virgolette sono utilizzate da Russell (talora pleonasticamente) come espediente tipografico per marcare i confini di un sintagma all’interno di un’espressione più complessa (v. anche, sopra, cap. 6, $ 7.3).
!07 Russell [1906c], p. 173. 108 Russell [1906c], p. 169.
109 V. Russell [1906c], p. 173, nota.
582
capitolo 8
Il definiens si legge: “Per ogni x esiste uno e un solo p' che risulta dalla sostituzione di a con x in p, ed esiste uno e un solo g' che risulta dalla sostituzione di b con x in g, e p'è equivalente a 9g”. Russell tratta le relazioni in estensione in modo del tutto analogo alle classi.'!° Il simbolo:
pa, b)' (x, y)!q significa “9 è ciò che risulta da p sostituendo simultaneamente a e b, rispettivamente, con x e y in tutti quei luoghi (se ce ne sono) in cui essi si presentano in p”. Il simbolo “p/(a, b)'(x, y)” è una descrizione definita, e significa: “ciò che risulta da p sostituendo simultaneamente a e b con x e y in tutti quei luoghi (se ce ne sono) essi si presentano in p”. La necessità della clausola secondo la quale la sostituzione dev'essere “simultanea” emerge — osserva Russell — come segue.'!! Supponiamo di voler ottenere la proposizione gq che risulta sostituendo ad a e » in p rispettivamente x e y. Potremmo pensare di procedere così: consideriamo dapprima la sostituzione di x ad a in p, che ci dà, poniamo, una proposizione p'; poi consideriamo la sostituzione di y a b in p‘, che ci dà una certa proposizione che — in molti casi — possiamo verificare essere proprio la proposizione qg che cercavamo. Si potrebbe dunque essere tentati di dare la seguente definizione:
p/a, b)'(x, y)!q =a (Ap) (pla'x! p' n pIb'y!q). Russell nota, tuttavia, che una definizione del genere non funzionerebbe in generale.'!? Per comprendere quale sia il problema, si deve porre mente al fatto che a e b possono essere anche proposizioni (non vi sono, nella teoria sostituzionale semplice, diversi stili di variabili!) e dunque può succedere che a sia un costituente di d, o viceversa. Ora, se accade, per esempio, che a sia un costituente di b, sostituendo x ad a in p, p' non conterrà più d e dunque la seconda sostituzione (vacua) non darà più luogo a g, ma solo (ancora) a p‘'. Per questo si rende necessario stabi-
lire che la sostituzione di x e y ad a e d in p denotata da “p/(a, b)'(x, y)” dev'essere “simultanea”. Per spiegare che cosa si debba intendere con ciò, dobbiamo premettere alcune definizioni date da Russell nell’articolo che stiamo esaminando.'!* Prima di tutto, “a non compare in p” — in simboli “a ex p” — è definito come: “Per ogni x, il risultato della sostituzione di a in p con x è p”; ossia:
a ex p=ar (x) (p/a'x! p). Russell definisce poi “a compare in p — in simboli “a in p” — come: “C'è almeno un x tale che sostituito ad a in p non dà come risultato p”; ossia: ainp=ar-(a ex p). Infine, Russell definisce “p è indipendente da 9g” — in simboli “p ind g” — come: “Per ogni x, è falso che x compaia sia in p sia in g”; ossia: pindg=x@-(xinpAxing).
Ora siamo in grado di comprendere la definizione, data da Russell, di “sostituzione simultanea” di x e y ad a e bin p.'!* Russell distingue due casi: (1) d compare in a. Allora scegliamo un'entità u che non compaia in p, e che sia indipendente sia da b sia da y; sostituiamo dapprima u ad a, poi y a b, e finalmente x a u. Il risultato sarà p/a, b)'(x, y); in altri termini, il ri-
sultato sarà quel q che consideriamo il risultato della sostituzione simultanea di a e b in pconxe
150 V. Russell [1906c], pp. 169-170. !!! V. Russell [1906c], p. 173. !!2 V_ ibid. 1!5 Per quanto segue, v. Russell [1906c], p. 169.
114 v. Russell [1906c], pp. 173-174.
y.
Le teorie dello zigzag, della limitazione di grandezza, e senza classi
583
(2) b non compare in a. In questo caso, è possibile che a compaia in b, o che a non compaia in b. In entrambi i casi, scegliamo un’entità v che non compaia in p e che sia indipendente sia da a sia da x; sostituiamo dapprimawuab, poi x ad a, e finalmente y a u. Il risultato sarà p/a, b)(x, y). Russell non lo fa, ma se vogliamo trascrivere la definizione data con (1) e (2) in simboli otteniamo:
p/a, b)'(x, Y)!q =4 (b ina > (Au)(u ex p A (uind b 1 u ind y) A (An) (3s) (p/a u!r A r/b'y!s n s/ux!q))) A (b ex a > (Au)(u ex p A (u ind a n uind x) A (An) (As) (p/b'u!r n r/a'x!s n swy!q))). L'espressione “p/(a, b)” che compare in “p/a, b)'(x, y)” è una matrice che rappresenta — secondo la teoria in esame — una relazione diadica.'! Per la precisione, il simbolo “p/(a, b)” è quello che sarebbe considerato — se fosse effettivamente un nome, e non un simbolo incompleto —
il nome di una relazione. Come nel caso del sim-
bolo “p/a”, il simbolo “p/(a, b)”? non ha però significato in isolamento dalle espressioni in cui compare: esso rappresenta infatti l’espressione: “Il risultato della sostituzione simultanea di a e d in p con...”. In analogia con quanto accade per le classi, l’enunciato “x e y sono nella relazione p/a, b)” è vero — secondo Russell — se e solo se il risultato della sostituzione simultanea di a e b in p con x e y è vero; si può dunque porre la definizione: x(pa, b))y =a Pa, b)' (x, y).
Come nel caso delle classi, se “x(p/(a, b)) y” compare in isolamento la sua parafrasi sarà:
(Ap°((9)(pAa, b)'(x, Y)!qa =
p'=q) Ap).
Anche qui, Russell provvede un esempio: [...] sia a Filippo e 6 Alessandro, e sia p “Filippo è il padre di Alessandro”. Allora p/a, b)'(x, y) è “x è il padre di y” che è vera quando, e solo quando, x ha con y la relazione di paternità, che è la relazione che p afferma sussistere tra a e b. Così la matrice p/a,
b) si può prendere a rappresentare la relazione di paternità.'!°
In analogia con il caso delle classi, l’espressione “p/a, b) = g/(c, d)” è da interpretarsi come un’abbreviazione di: “Per tutti i valori di “x” e di “y”, p/a, b)'(x, y) e 9A(c, d)'(x, y) sono equivalenti”. In simboli:
p/a, b) = g/(c, d) =a )Y) (Aa, b)' (x, y) = AC, d)(x, Y)). Per la loro importanza fondamentale nello sviluppo della matematica, è essenziale essere in grado di definire le classi di classi (per esempio, i numeri cardinali sono — secondo Russell — classi di classi). Una classe di classi è definita, nell’ambito della teoria in esame, come un genere particolare di relazione diadica: il genere definito da un’espressione esprimente una funzione di p e di a quando “p’” e “a” compaiono in essa solo nel simbolo “p/a”. La definizione precisa è la seguente: «La matrice g/(p, a) è detta classe di classi se, per tutti i valori di r, c, r', c', a condizione che r/c = r/c', allora gp, a)(r, c) è equivalente a g/p, a) (r', c’)».!!” «In tal caso», dice Russell, «diciamo che la classe r/c è un membro della classe di classi 9/(p, 4) quando 9/p, a)'(r, c) è vero».'!* Abbiamo dun-
que: r/c e gp, a) =ar (9/(p, a) è una classe di classi) A g/p, a) (r, €), dove
115 V_ Russell [1906c], p. 170 e p. 174. 1! Russell [1906c], p. 174. !!7 Russell [1906c], PARLO:
115 Ibid.
capitolo 8
584
g/(p, a) è una classe di classi =ar (r) (c) (rc) (r/c'= r'/c">D g/p, d)'(r', c) = Up, UA)
In forma totalmente simbolica, abbiamo dunque la seguente definizione:
re e g/(p, a) =s (1) (e (r")(c') (r/c'= r'c"5 gp, a)'(r', 9) = g/p, a'(r", c') A gp, d'(r, C). Una volta definite le classi di classi diviene possibile definire i numeri cardinali. Ecco come Russell spiega la definizione del numero 0 delle entità (vedremo più avanti, nel $ 4.1.3, che questa qualificazione è importante): Si consideri una proposizione come “In Irlanda non ci sono serpenti”. Questo equivale a “Per tutti i valori di x è falso che x è un serpente in Irlanda”. Se scriviamo p per “Socrate è un serpente in Irlanda”, e a per Socrate, la classe p/a non ha membri, cosa che si IS può esprimere diversamente dicendo che il numero dei membri di p/a è 0. Così dire “Il numero dei membri della classe p/a è 0”, è equivalente a dire “Per tutti i valori di x, p/a’x è falsa”. Quest’asserzione contiene p e a; chiamiamola g. Allora 0 si può definire come la matrice g/(p, a). Perché si supponga che p‘, a’ abbiano la relazione 9/(p, a), ossia si supponga che 9/p, a)'(p', a’) sia vero. Eseguendo la sostituzione, vediamo che questo asserisce “Per tutti i valori di x, p/a"x è falsa”, che asserisce che p/a' è una classe che non ha membri, ossia il cui numero è 0. Perciò 0 è il valore della matrice {(x)-(p/0)°x}/(p, 4) [...]. Conformemente a questa de-
finizione, 0 è una relazione tra una proposizione e un’entità, in altre parole la relazione che, qualunque cosa possiamo sostituire all’entità nella proposizione, il risultato è sempre falso.!!°
Secondo la spiegazione di Russell, abbiamo che la classe p/a' appartiene al numero 0 delle entità se e solo se il risultato della sostituzione simultanea di p e a in (x)-(p/a'x) con p'e a'è vero; cioè:
p‘/a'e 0= {(x)-(p/a'x)}/p, a) (p', a’). Il numerale “0” delle entità è quindi rappresentato — nella teoria sostituzionale — dalla matrice “{)-(p/a'x)}/p, a)”. Se “p/a'e 0” compare in isolamento, il suo significato sarà, naturalmente, l’asserzione della proposizione espressa da “{(x)-(p/a'x)}/(p, a) (p', a)”, ovvero: x
p‘a'e 0= Ba (MN{M As ((4)(p/a'x!9'=gq'=5) A-s)}/p, ap a)!r=r=q)A9) La parte destra della formula che precede equivale a: “Esiste uno e un solo gq che risulta dalla sostituzione simultanea di p e a con p'e a' nella proposizione espressa da ‘Per ogni x c’è uno e un solo r che risulta dalla sostituzione di aconxinp,erè falso’, eg è vero”. Il numero 1 delle entità è definito in modo del tutto analogo.'?” Dire che la classe p/a' appartiene al numero cardinale 1 delle entità equivale a dire che il risultato della sostituzione simultanea di p e a in (3c)(®) (p/a'x = x = c) con p'e a'è vero; cioè:
p‘/la'e 1={(d)(p/a'x=x=c)}/p,
a) (p', a).
Il numerale “1° delle entità è quindi rappresentato — nella teoria sostituzionale — dalla matrice “(4c) (x) (p/aix = x= Jp, a)”.
Se “p/a' e 1” compare in isolamento, il suo significato sarà, naturalmente, l’asserzione della proposizione designata da “{(dc) (1) (p/a'x=x= ©)}/(p, a)’(p', a’), ovvero: p‘la'e
1= AMA) As (4)
((p/a'x!9'=q9'=5)
As=x=0}/p, dp’, a)lr=r= q) Aq).
La seconda parte della formula che precede equivale a: “Esiste uno e un solo g che risulta dalla sostituzione simultanea di p e a con p'e a' nella proposizione espressa da ‘Esiste un c tale che per ogni x c’è uno e un solo r che risulta dalla sostituzione di a con x in p, e questo r è vero se e solo sex = c’, e q è vero”.
!!9 Russell [1906c], p. 175. 120 V. Russell [1906c], p. 176.
Le teorie dello zigzag, della limitazione di grandezza, e senza classi
585
In questa teoria, i numeri cardinali continuano dunque ad essere definiti come classi di classi, ma adesso i simboli di classe non rappresentano entità, ma sono solo modi di dire: ne segue che i numeri stessi non sono più da considerarsi entità: ci sono numerali, ma non numeri.
Come osserva Russell, nella teoria in esame è possibile ottenere anche i rappresentanti simbolici di altri oggetti indispensabili alla costruzione della matematica, come classi di classi di classi, relazioni tra classi ecc." Le classi
di classi di classi saranno un certo tipo di relazioni triadiche; una relazione diadica tra classi di individui sarà un genere particolare di relazione tetradica; e così via. Una classe di classi di classi, per esempio, sarà rappresentata da una matrice della forma “q/(p, r, c)” se, per ogni p‘, r', c', p", r', a", qualora p‘Ur', c') e p'/(r", c') siano classi di classi, e p(r', c) = p'/r", c'), si abbia che 9/7, r, c)'(p'r', c')) è equivalente a 9/p, r, ©)(p'Ar", c').
4.1.2. Per chiarire la base filosofica della teoria sostituzionale, in “On the substitutional theory of classes and relations” Russell offre dapprima un’analisi della difficoltà in cui incorre la teoria delle classi di Frege, la quale assume che le classi siano entità: Il nocciolo della teoria di Frege è quello che segue. Qualunque cosa una classe possa essere, sembra ovvio che qualsiasi funzione «x determina una classe, cioè la classe degli oggetti soddisfacenti gx. Così “x è umano” definisce la classe degli esseri umani, “x è un numero primo pari” definisce la classe il cui solo membro è 2, e così via. Possiamo quindi (così sembrerebbe) definire ciò che intendiamo con “x è un membro della classe w”, 0 “x è un w” come possiamo dire più in breve. Ciò significherà: “C’è qualche funzione @ che definisce la classe v ed è soddisfatta da x”. Abbiamo quindi bisogno di un’assunzione che garantisca che due funzioni definiscono la medesima classe quando esse sono equivalenti, ossia tali che per ogni valore di x sono entrambe vere o entrambe false. Così “x è un uomo” e “x è un bipede implume” definiranno la medesima classe. Da questa base si può sviluppare l’intera teoria delle classi. Ma se assumiamo, come fa Frege, che la classe sia un’entità, non possiamo sfuggire alla contraddizione circa la classe delle classi che non sono membri di se stesse. Perché è essenziale per un’entità che essa possa essere una determinazione possibile di x in qualsiasi funzione proposizionale @x; cioè, se gx è una funzione proposizionale, e a una qualsiasi entità, ga dev’essere una proposizione significante. Ora se una classe è un’entità, “x è un #” sarà una funzione proposizionale di u; quindi, “x è un x” dev'essere significante. Ma se “x è un x” è significante, la migliore speranza di evitare la contraddizione è distrutta. "°°
Russell prosegue spiegando quella che ora egli ritiene essere la fallacia nella teoria di Frege: Il punto dove, mi sembra, la precedente definizione di “x è un w” è erronea, è che essa parla di “una funzione @” senza nessun argomento. Ora una funzione, come lo stesso Frege ha posto in evidenza, non è assolutamente nulla senza qualche argomento; quindi, non possiamo mai dire, di qualsiasi formula contenente una funzione variabile, che questa vale “per qualche valore di @” o “per tute - 1: z »% . “ ad as1123 ti i valori di 9”, perché non c’è una cosa come @ e pertanto non ci sono “valori di @”.'°
Qui ritorna lo scetticismo nei confronti dell’esistenza di entità corrispondenti ai simboli di funzione proposizionale che Russell aveva già espresso, qualche anno prima, nei Principles. Il problema — continua Russell — è però superato dalla teoria sostituzionale: Con l’aiuto delle matrici [...] si può quasi sempre esprimere ciò che è sostanzialmente la stessa cosa di una formula asserita “per tutti i valori di @”’, ma vi sono certi casi limite in cui le matrici non faranno ciò, e tali casi sono precisamente quelli che conducono
a contraddizioni. [...]
[...] Se p è ga, p/a'x è in generale @x [...]. Così p/a'x rimpiazzerà, per la maggior parte degli scopi, @x, e invece di “tutti i valori di @” parleremo di “tutti i valori di p e a”. Così invece di una funzione variabile @, avremo due entità variabili, p e a. Due entità qualsiasi p e a definiscono una classe, ossia p/a, e x è un membro di questa classe se p/a'x è vero. (Se p non contiene a, la classe contiene ogni cosa se p è vera, e non contiene nulla se p è falsa.) Dire che x è un membro della classe @ è ora come dire che per qualche valore di p e a, @ è la matrice p/a e p/a'x è vero. Qui, invece della funzione variabile @, che non potrebbe essere staccata dal suo argomento, abbiamo le due variabili p e a, che sono entità, e si possono variare. Ma ora “x è un x° diviene privo di significato, perché “x è un @° richiede che asia della forma p/a, e dunque non sia affatto un’entità. In tal modo l'appartenenza a una classe si può definire, [...] e al tempo stesso si evita la contraddizione. "°°
La teoria sostituzionale evita la contraddizione poiché ha un effetto simile a quello che avrebbe una suddivisione in tipi di funzioni proposizionali e classi, in una teoria dove queste fossero assunte come autentiche entità.
12! V_ ibid. 122 Russell [1906c], p. 171. 123 Ibid. 124 V_ sopra, cap. 6, $ 8.2. 125 Russell [1906c], pp. 171-172.
capitolo 8
586
Questo perché i simboli (variabili o costanti) che apparentemente si riferiscono a funzioni proposizionali (in senso ontologico) e classi non sono — almeno nella notazione primitiva — simboli semplici, ma hanno una determinata struttura, cosicché diviene impossibile sostituire a una variabile una costante che non presenti la medesima struttu-
ra. Violare le restrizioni di tipo diviene sintatticamente impossibile: una costante individuale potrà essere sempre sostituta a una variabile individuale, ma le matrici non potranno essere sostituite a variabili individuali, né a variabili che non presentino lo stesso numero di posti di sostituzione. Per esempio, se cerchiamo di sostituire il simbolo “p/a” ad “x” in “x e g/b” otteniamo un’espressione come “p/a € g/b” che non esprime più una proposizione, poiché significa: “Il risultato della sostituzione di a in p con il risultato della sostituzione di b in g con... è vero” — che non è un enunciato, perché non è un’espressione completa. In generale, la traduzione nei termini di questa teoria di un'espressione come “@e @° (dove a rappresenta una classe) non rappresenterebbe più una proposizione. Per esempio, supponendo che & sia una classe di classi, ‘“@ appartiene ad @° diviene “g/(p, a) e g/(p, a)”, che equivale all’espressione incompleta “Il risultato della sostituzione simultanea di p e a in g con il risultato della sostituzione simultanea di p e a in g con... è vero”. Un altro esempio: l’uguaglianza o la disuguaglianza tra due classi può essere asserita solo nell’ambito dello stesso tipo. Scrive Russell: Quando una formula [formula] contiene matrici, la prova se essa sia significante o no è molto semplice: è significante se può essere formulata [stated] interamente in termini di entità. Le matrici non sono nient'altro che abbreviazioni verbali o simboliche; quindi
qualsiasi asserzione [statement] in cui compaiono, se ha da essere un’asserzione significante e non un semplice guazzabuglio, deve poter essere formulata senza matrici. Così per esempio “p/a = g/b” significa: “Qualunque cosa x possa essere, se x è sostituito ad a inpeabing,i risultati sono equivalenti”. Qui non ci sono altro che entità. Ma se tentiamo di interpretare (per esempio) “p/a = g/(b, c)”, scopriamo, introducendo x, che abbiamo a sinistra una proposizione e a destra una matrice.'?° Quindi a destra si deve fornire un altro argomento, mentre a sinistra non c’è più spazio per un argomento. Perciò la formula proposta è senza significato. (Non è falsa: la sua negazione è senza significato proprio come la sua affermazione.) Così dove compaiono matrici, la significanza richiede l’omogeneità di tipo: questo non ha bisogno di essere formulato come principio, ma risulta in ciascun caso dalla necessità di eliminare le matrici al fine di scoprire ciò che realmente significa la proposizione."
Così — osserva Russell — tutte e solo le matrici della forma “p/a” costituiranno un tipo — il primo; quelle della forma “p/(a, b)” costituiranno il secondo tipo; quelle della forma “p/a, b, c)” costituiranno il terzo tipo, e così via.'?5 In generale, una matrice sarà di tipo n se è della forma “p/(x1, x2, ..., Xn)”. Come nota Russell in una lettera a Couturat datata 19 dicembre 1905: «Il metodo della sostituzione, tramite il quale faccio a meno delle classi, ha
pressappoco lo stesso effetto pratico della teoria dei tipi (nella mia Appendice B [dei Principles])».!?° Nella teoria sostituzionale semplice si produce una gerarchia di tipi di funzioni proposizionali (e di classi) grazie a un meccanismo affine a quello che produce una gerarchia di livelli di concetti nella teoria di Frege. In quest’ultima," un’espressione per un concetto di un determinato livello non può essere assunta nel posto d’argomento di un’espressione per un concetto del medesimo livello, pena l’insignificanza: questo perché i concetti sono interpretati da Frege come entità essenzialmente incomplete, e quest’ incompletezza si deve rispecchiare nel corretto simbolismo. Analogamente, in questa teoria di Russell, la gerarchia di tipi di classi deriva dal fatto che le classi sono interpretate come matrici, che sono simboli incompleti. La differenza ovvia, rispetto alla teoria di Frege è che le matrici non denotano entità ‘“insature’’, ma sono simboli interpretati solo contestualmente, che non si suppone denotino nulla. Il progresso rappresentato dalla teoria sostituzionale semplice, rispetto alla teoria dei tipi esposta da Russell nell’appendice B dei Principles, è evidente. Qui non vi è più nessun dubbio di quali formule siano o non siano significanti. Inoltre la gerarchia dei tipi non è formulata in modo arbitrario, ma scaturisce dalla sintassi della teoria basata, a sua volta, sull’assunzione di un’ontologia di sole proposizioni e soggetti logici di proposizioni elementari, che sono considerati entità (individuali) allo stesso titolo. L'eliminazione di funzioni proposizionali e classi nella teoria sostituzionale rappresenta un notevole risparmio ontologico, rispetto ai Principles.
‘20 In parole, quanto si ottiene introducendo x è: “Il risultato di sostituire a in p con xè con”, che è un nonsenso. [Nota di Russell.]
!2? Russell [1906c], pp. 177-178. 128 V. Russell [1906c], pp. 176-177. 129 In Russell [2001a], p. 574. VE
sopra, cap. 5, $ 1.
identico al risultato di sostituire b in g con x e c in q
Le teorie dello zigzag, della limitazione di grandezza, e senza classi
587
Certo, come nei Principles, Russell continua a vedere le proposizioni come costituite da attributi, monadici 0 poliadici, oltre che da particolari. Egli scrive: Si deve osservare che le relazioni identificate con le matrici duali sono (approssimativamente)['°'] relazioni in estensione. Se diciamo “x generò y”, la parola generò esprime la stessa relazione in intensione che è espressa in estensione dalla nostra matrice p/a, b) [dove p = (a generò b)]. L’inconveniente delle relazioni in intensione, dal punto di vista della logica simbolica, è che non tutte le
funzioni proposizionali di due variabili corrispondono a relazioni in intensione, proprio come non tutte le funzioni proposizionali di una variabile corrispondono a predicati [predicati” sta qui, conformemente all’uso dei Principles, per “attributi monadici”]. Una proposizione come “Se Filippo non avesse preparato la strada, le conquiste di Alessandro sarebbero state impossibili” non può sen-
za distorsioni essere messa in una forma che asserisce una relazione in intensione tra Filippo e Alessandro: ma essa dà origine a una matrice, che può essere presa come la relazione in estensione. Le relazioni in intensione sono della massima importanza per la filosofia e la logica filosofica, poiché esse sono essenziali per la complessità, e quindi per le proposizioni, e quindi per la possibilità di verità o falsità. Ma nella logica simbolica, è meglio partire con le proposizioni come dati; ciò che viene prima delle proposizioni non è ancora, per quanto ne so, riconducibile a un trattamento simbolico, e si può persino dubitare se esso sarà mai riconducibile ad esso. 343
Ma nella teoria sostituzionale gli attributi e le relazioni in intensione — almeno in quanto sono termini di proposizioni (nell’accezione dei Principles), cioè soggetti logici di proposizioni — sono sicuramente da considerarsi individui, proprio come nei Principles." Per es., l'attributo della saggezza nella proposizione espressa da “La saggezza è una virtù” compare come termine della proposizione, e dunque è un elemento sostituibile, nella proposizione, con altri individui qualsiasi ammessi nella teoria sostituzionale.
4.1.3. All’inizio della primavera del 1906 Russell riteneva che la teoria sostituzionale semplice bloccasse i paradossi logici. Quest’opinione è corretta per quanto riguarda il paradosso di Russell: chi, nell’ambito della teoria sostituzionale semplice, cercasse di affermare che una classe è, o non è, membro di se stessa, non riuscirebbe neppu-
re a formulare un enunciato significante. La soluzione del paradosso di Burali-Forti — nel contesto della teoria sostituzionale semplice — si basa sulla circostanza che, secondo questa teoria, i numeri ordinali sono di tipi diversi, e non possono dunque esser considerati parte di un’unica serie. La spiegazione è chiara nelle parole di Russell: Il metodo di generare ordinali aggiungendo alla fine di una serie il numero ordinale della serie come termine addizionale è viziato dal fatto che il numero ordinale di una serie è di un tipo logico diverso dai termini della serie. Se i termini della serie sono entità, il numero ordinale della serie è una classe di relazioni duali di entità. Chiamerò un ordinale di questa sorta ordinale-enzità [entityordinal), perché si applica alle serie di entità. Analogamente un numero ordinale che si applichi a serie di classi sarà detto ordinaleclasse [class-ordinal], e così via. Di un numero ordinale applicabile a una serie di ordinali-entità si dovrà parlare molto spesso: lo chiamerò ordinale-ordinale [ordinal-ordinal|]. Un numero ordinale applicabile a una serie di ordinali-ordinali sarà detto ordinaleordinale-ordinale [ordinal-ordinal-ordinal]. Se @ è un qualsiasi tipo logico, un ordinale-@ [@-ordinal] non è mai del tipo a, ma è sempre una classe di relazioni duali tra termini del tipo &[...]. Quindi, a qualunque tipo appartengano i termini di una serie di ordinali, non possiamo mai formare una nuova serie aggiungendo alla fine il numero ordinale della serie. !34
La soluzione del paradosso di Burali-Forti è dunque la seguente: Se sistemiamo tutti gli ordinali-entità in ordine di grandezza, essi formano una serie ben ordinata, che ha un ordinale-ordinale. Quest’ordinale-ordinale è maggiore di qualsiasi ordinale-entità, ed è il primo che abbia tale proprietà. Non c’è contraddizione in questo, poiché non si può mostrare che esista un qualsiasi metodo generale di produrre [manufacturing] serie-entità ordinalmente
15! Alla pagina successiva del testo, Russell chiarisce il motivo di questo “approssimativamente”: «Sebbene una matrice sia più affine a una classe o relazione in estensione che in intensione, essa non è del tutto estensionale; perché anche se p/a e p/a' definiscono la medesima classe, esse possono ancora essere distinte se p è diverso da p'o a da a'. Così la teoria qui difesa è intermedia tra quella dell’intensione e quella dell’estensione» (Russell [1906c], p. 175).
132 Russell [1906c], pp. 174-175. 133 Nei Principles, Russell considera “termine” e “individuo” come sinonimi (v. Russell [1903a], $ 47, p. 43). Questo implica che i concetti, che nei Principles sono considerati termini (v. Russell [1903a], $ 48, p. 44), siano individui. Tale posizione è conservata da Russell anche
nell’esposizione della teoria dei tipi contenuta nell’ appendice B dei Principles, dove leggiamo: «Un termine [term] o individuo [individual] è qualsiasi oggetto [object] che non sia un decorso di valori [range]. Questo è il tipo più basso
di oggetti. Se un tale oggetto [...] compare in una proposizione, qualsiasi altro individuo può sempre essergli sostituito senza perdita di significato. [...] Sembrerebbe che tutti gli oggetti designati da singole parole, stano essi cose 0 concetti [corsivo mio], siano di questo tipo. Così, per esempio, le relazioni che occorrono nelle proposizioni relazionali effettive sono dello stesso tipo delle cose, sebbene le relazioni in estensione, che sono quelle che impiega la Logica Simbolica, siano di un tipo diverso» (Russell [1903a], $ 497, p. 523).
134 Russell [1906c], pp. 180-181.
capitolo 8
588
simili a una serie data di ordinali. Se poi sistemiamo tutti gli ordinali-ordinali in ordine di grandezza, essi formano una serie ben ordinata avente un ordinale-ordinale-ordinale, il quale è il primo che è maggiore di qualsiasi ordinale-ordinale; e così gia: [SSA L’intera soluzione risiede nel fatto che il numero ordinale di una serie è sempre di tipo superiore a quello dei suoi membri.'*
Per quanto riguarda il paradosso di Cantor — che già si era dimostrato più resistente alla prima teoria dei tipi
dei Principles — le cose si fanno invece problematiche. In “On the substitutional theory of classes and relations” Russell afferma che la teoria sostituzionale semplice risolve il paradosso di Cantor: la soluzione consiste — se-
condo Russell — nell’ammettere che in ciascun tipo esiste un numero cardinale massimo, ma che questo numero può sempre essere superato in un tipo più alto. L'affermazione è giustificata dal fatto che i numeri cardinali non sono più unici — come nella teoria “ingenua” degli insiemi — ma si riproducono all’interno di ciascun tipo. Per esempio, nel $ 4.1.1 abbiamo riportato un brano in cui Russell definisce il numero zero delle entità. Non si sarebbe potuto dire semplicemente “il numero zero”, senza specificare “delle entità”, perché, quand’è definito in quel modo, il numero zero non è più la classe di futre le classi che non hanno elementi, ma solo la classe di tutte le
classi di entità che non hanno elementi. È possibile tuttavia — nota Russell — definire un altro numero zero — in simboli ‘0,7 —, che comprenda tutte le classi di classi di entità le quali non hanno elementi. Si fa come segue: Diciamo che la classe p/a è membro della matrice 9g/py; 4), se non soltanto 9/p;, 4)" (P, a) è vero, ma anche, ogniqualvolta p /a'= p/a, allora 9/(po; 40) (P', a’) èvero. Se g/Po, &) non ha membri, in questo senso, allora, purché sia una classe di CES il numero dei suoi elementiè 0;, in cui 0; significa lo zero-classe [c/ass-zero], in quanto distinto dallo zero-entità [entity-zero].!*
Lo zero-classe comprende, per così dire, tutte le classi di classi di entità le quali sono prive di elementi. Si può andare avanti definendo 0, che comprenderà tutte le classi di classi di classi di entità prive di elementi, e così via. Nello stesso modo, in corrispondenza di ogni numero-entità — cioè di ogni numero di classi di entità — si può definire un numero analogo di classi di classi di entità, di classi di classi di classi di entità, e così via.
Il fatto che numeri cardinali di tipi diversi possano essere considerati uguali, o uno maggiore dell’altro, è giustificato — secondo Russell — dalla definizione cantoriana di “identità” tra numeri cardinali: Perché data una classe di termini di un certo tipo, possiamo definire una relazione uno-uno dei termini di detta classe con i termini di una classe dello stesso tipo o di un qualsiasi altro tipo specificato, e quindi possiamo definire ciò che intendiamo dicendo che le classi di tipi differenti sono simili.!5
È da notare che, in questo modo, il termine “cardinalmente simile” diviene ambiguo, ossia non esprime più un’unica relazione, ma infinite relazioni diverse. Si può definire che cosa significa, per due classi di tipo dato, essere cardinalmente simili, ma non in generale il significato di “cardinalmente simile”. Infatti, se si cerca di definire esplicitamente la relazione di similitudine cardinale tra due classi @ e f non si può fare a meno di specificare di me tipo devono essere & e /. Bisogna decidere se vogliamo definire, per esempio, un’espressione della forma ‘p/aè cardinalmente simile a g/b” o un’espressione della forma “p/(a, b) è cardinalmente simile a g/(c, d)”: nei due casi uee. definito relazioni diverse. Per esempio: se @ e f sono entrambe classi della forma “p/a” — cioè del primo tipo,'* allora definiremo una relazione smy del quarto tipo; se sono, rispettivamente, della forma‘pla” della forma “p/(a, b)”, definiremo una relazione sms del quinto tipo; se sono entrambe della forma “p/(a, b)”, allora definiremo una relazione smg del sesto tipo; e così via. Nelle parole di Russell: «il confronto fra un numero di un tipo e un numero di un altro è fatto seguendo una definizione separata per ciascuna coppia di tipi, e non può essere generalizzata». '° Con queste premesse, è possibile comprendere in che modo Russell pensava di risolvere il paradosso di Cantor. Come sappiamo, il paradosso deriva dal fatto che il teorema di Cantor asserisce che, per qualsiasi numero cardinale n, il numero delle sottoclassi di una classe di n elementi, cioè 2”, è sempre maggiore di n. Ne segue che non può esserci un numero cardinale massimo: eppure il numero di tutte le entità sembra essere, per l’ appunto, tale cardinale massimo. La soluzione consiste ora —
per Russell —
nel notare che, se è
una classe di entità, la classe del-
le sue sottoclassi non è, a sua volta, una classe di entità, ma è una classe di classi di entità; dunque il suo numero 155 Russell [1906c], pp. 183-184. 156 Russell [1906c], p. 178. 157 Russell [1906c], pp. 178-179. ° Come si è già accennato, Russell chiama del primo tipo le espressioni come “p/a”, del secondo tipo le espressioni come “p/(a, b)”, e così via (v. Russell [1906c], pp. 176-177).
15° Russell [1906c], p. 179.
Le teorie dello zigzag, della limitazione di grandezza, e senza classi
589
cardinale sarà sì — come prevede il teorema di Cantor — maggiore del numero di & ma sarà di un tipo superiore ad esso. Non ci saranno dunque classi di entità che abbiano un numero cardinale maggiore della classe di tutte le entità: Quindi la soluzione del problema concernente il numero cardinale massimo sta semplicemente nel fatto che una classe non è un'entità, cosicché le classi non sono (come si era supposto) una sottoclasse di entità. Due entità qualsiasi p, a definiscono una classe p/a; ma una coppia di entità non è un’entità, e il numero di coppie di entità può dunque, senza la minima contraddizione, essere maggiore del numero delle entità."
Qui c’è però qui una difficoltà. Se il numero delle entità è finito allora è vero che — come afferma Russell — il numero delle coppie di entità sarà superiore a quello delle entità stesse. Ma se il numero delle entità è No, allora si dimostra formalmente che il numero delle coppie di entità sarà a sua volta Xy e non un numero più grande." Se quindi le entità sono infinite, la teoria sostituzionale semplice porta — contrariamente a quanto afferma Russell — a risultati contrastanti con il teorema di Cantor. Questo fatto — che sembra essere sfuggito a Lackey ([1976], p. 74) — è stato rilevato per la prima volta da Nino Cocchiarella ([1980], p. 90) e, sulla sua scorta, ripreso da Landini ([1987], p. 185; [1989], pp. 313-314). Ecco come espone il punto Landini: Il conflitto con il teorema della classe potenza di Cantor sorge nel modo seguente. Supponendo che la classe di tutti i soggetti logici (proposizioni o altro) sia numerabile, possiamo assegnare a ogni soggetto logico x un numero naturale, #x. Poiché ogni sottoclasse della classe dei soggetti logici è rappresentata in termini di una matrice della forma p/a dove p e a sono soggetti logici, possiamo assegnare a ciascuna di esse un numero razionale #p/a. Come è noto, i numeri naturali hanno la stessa cardinalità dei numeri razionali. Così, la classe di tutti i soggetti logici avrà la stessa cardinalità della sua classe potenza. (Un argomento simile si può formulare indipendentemente da quale sia la cardinalità infinita della classe di tutti i soggetti logici.) Ma il teorema della classe potenza di Cantor dice che non vi è nessuna funzione da una classe alla sua classe potenza; la classe potenza di qualsiasi classe ha sempre una cardinalità più grande!!4
Per evitare la contraddizione bisognerebbe negare che il numero delle entità sia infinito — una posizione che di certo Russell non sarebbe stato disposto a sostenere, perché ne sarebbe derivata la finitezza della classe dei numeri naturali e della classe dei rapporti, con il conseguente collasso della teoria dei numeri reali. In effetti, al contrario,
nel contesto della teoria sostituzionale Russell cerca di dimostrare che il numero delle entità è infinito. Nella teoria sostituzionale risulta bloccata la dimostrazione dell’esistenza di infinite entità secondo metodi simili a quelli usati da Frege o, in precedenza, dallo stesso Russell (v. sopra, cap. 2, $ 6.3): per questi metodi è infatti essenziale poter considerare una classe di entità come una nuova entità, in modo da aggiungerla alle entità già computate in precedenza; ma ciò non si può fare se una classe di entità non è considerata, a sua volta, come un’entità. Tuttavia,
in un articolo intitolato “Les paradoxes de la logique”, scritto nel giugno del 1906 — e dunque poco dopo “On the substitutional theory of classes and relations” — Russell propone una dimostrazione dell’esistenza di infinite entità valida all’interno della teoria sostituzionale. Tale dimostrazione si basa su due assunzioni, che Russell conside-
ra evidentemente vere:'! (1) Esiste almeno un’entità (Russell la formula richiedendo che quanto è vero per tutti i valori di “x” debba essere vero per qualche valore di “x°). (2) Data una qualsiasi proposizione p, esiste sempre almeno un’entità u che non è esplicitamente menzionata in
D. La dimostrazione di Russell procede così: Data un’entità a [la cui esistenza è garantita dall’assioma (1)], abbiamo la proposizione a = 4; e, [...] [in virtù dell’assioma (2)], c’è
un'entità u tale che v non è menzionata in “a = a”. Quest’entità non è a,b) P poiché a è menzionata in “a = a”. Dunque ci sono almeno q due entità. Ci sarà analogamente un’entità non nominata in “a = w”, che non dev'essere né a né u. In questo modo possiamo dimostrare che, se n è un qualsiasi numero finito, ci sono più di n entità, e prendendo in considerazione proposizioni, possiamo produrre [manufacture]
x) A -(p/a'a#))}la*. Informalmente, la (1) dice che p*/a* è la classe di tutte le proposizioni a* tali che asseriscono la verità di tutte le proposizioni appartenenti a una classe p/a cui a* non appartiene. Si osservi però che né il termine “vero”, né termini semantici collegati, compaiono nell’espressione (1), né nelle seguenti espressioni simboliche. Ponendo ora:
2)
rap Ya*”xD x),
ossia, informalmente, “7* è la proposizione espressa da: ‘Tutte le proposizioni della classe p*/a* sono vere’”, la contraddizione procede inarrestabile. Si ha infatti, da (1):
(3)
p*/a*r*= {(da)(Ap)(a*= (x)(p/la'x > x) A —(p/a'a*))}/a*'r*,
ossia, informalmente, “7* appartiene a p*/a* se e solo se appartiene alla classe di tutte le proposizioni a* tali che asseriscono la verità di tutte le proposizioni appartenenti a una classe p/a cui a* non appartiene”. Sostituendo “7” ad “a*° nel secondo membro della (3) si ha:
(4) p*/a*r*> (da)(Ap)(r*= (x) (p/a'x > x) A -(p/a'r*), (O)
Deore)
LASTRE.
&
5
ear
=
5
5
ò
n Kata 5E 3 GAS È $ ò Si può notare un’analogia tra questa dimostrazione e la dimostrazione dell’esistenza d’infinite entità fornita da Bolzano nei suoi Para-
doxien des Unendlichen (v. Bolzano [1851], $ 13). Il brano in cui è contenuta la dimostrazione bolzaniana è stato riportato sopra, nel cap. 2,
$ 6.3. SEA sopra, cap. 6, $ 11.
Le teorie dello zigzag, della limitazione di grandezza, e senza classi
591
Ora, poiché l’identità di due proposizioni implica l’identità dei loro componenti (un oggetto deve ovviamente essere
composto
dalle
stesse
parti di se stesso),
l’identità
“r*=
(x)(p/a'x > x)”, cioè
“M(pYa*xD5
x) =
(x) (p/a'x> x)”, implica sempre “p*= p” e “a*= a”. Quindi possiamo sostituire “p” con “p*? e “a” con “a” in (4) ottenendo:
(6)
pYa*r*>(r*=(pYa*x>x)A-(p%a*r")) x
e da (6), poiché l’identità “r* = (x)(p*/a*x > x)” è vera per la definizione (2), si ha:
(7)
pYa*r*>-(p*/a*r*).
Ma prendendo p* come p e a* come a in (5) si ottiene: (8)
-(p*/a*r*) > (r*= )pYa*x>
e, poiché l’identità
=
(9)
‘66
x) A p*/a* r*)
“r*= (x) (p”*/a*x > x)” è vera per la definizione (2), da (8) si ha:
K{pYa”r®) > pYa*r*.
che è in contraddizione con (7).
Come ha rilevato per primo Gregory Landini testimoniano che Russell si accorse del conflitto 1906. Una versione sostituzionale del paradosso nel manoscritto russelliano “On substitution”,'
in un suo articolo del 1989," i manoscritti russelliani dell’epoca tra la teoria sostituzionale semplice e il teorema di Cantor già nel delle proposizioni dell’appendice B dei Principles si trova infatti scritto nell’aprile-maggio del 1906 — dunque poco dopo la reda-
zione di “On the substitutional theory of classes and relations” —, e nello stesso manoscritto! si trova già la de-
scrizione di un paradosso — specifico della teoria sostituzionale — che Russell esporrà poi in una lettera al suo ex studente Ralph Hawtrey del 22 gennaio 1907, il quale dimostra l’inconsistenza della teoria sostituzionale semplice attraverso un’ argomentazione simile a quella usata nella dimostrazione del teorema di Cantor. La derivazione di quest’ultimo paradosso è strettamente analoga a quella del paradosso delle proposizioni, solo che, invece di assumere: p*/a* = {(Fa)(Ap)(a*= (2) (p/a'x > x) A —(pla'a*))}/a*,
si pone:
p/a,= {@a)(Ap)(a, = p/a'b!q) A -(p/a'a;))}/a,, e invece della proposizione r*:
(x) (pYa*x>3 x), si prende la proposizione: p/as'b!q.
147 V. Landini [1989]. 148 Vv. Russell [1906f], p. 159. La versione del paradosso delle proposizioni di “On Substitution” si ottiene partendo coll’assumere, in (1), “a*= (x)(p/a'x > —x)” (cioè: “a* è la proposizione tutte le proposizioni della classe p/a sono false”), invece di “a*= (x)(p/a'x Dx)”. 149 V. Russell [1906f], p. 131. Il paradosso è esposto anche in “The paradox of the liar”, del settembre 1906 (v. Russell [1906g], p. 351).
!50 |a lettera è riprodotta fotograficamente sull’antifrontespizio di Landini [1998], in B. Linsky [2002b], p. 160, e in Landini [201 1a], cap. 3, p. 149; è trascritta, ma con diversi errori (già rilevati in B. Linsky [2002b], p. 152), in Grattan-Guinness [2000], pp. 579-580, e, correttamente, in appendice a B. Linsky [2002b] (pp. 158-159), e in Russell [2014], p. 125.
!5! Qui “5” e “97” devono intendersi come costanti.
capitolo 8
592 Ecco la derivazione:
(1) po=a Aa) (Ap)(a, = p/a'b!q n -(p/a' a), da cui
(2
p/av(p/a'b!qa)= Ga) Ap(p/aib!qg)= (pla'b!q) A (pla p/ab!q)));
da (2):
(3) p/a (p/aib!q) > Aa) (Ap)(p/aib!q)=(p/a'b!q) A-(p/a'p/ab!q))
152
e
(4)
p/a (p/a'b!a) > (A p(pSwb!q)= (pla'b! 9) > pla p/a'b!q)).
Istanziando p con p, € a con 4 in (4), si ottiene:
5)
—p/a' pla
b!9) > (P/ab!9)=(p/ab!9g) > p/a (p/ayb!9))
e dunque: (6)
-(p/a' (pla
b ! q)) > p/a
(p/a
b ! q).
Ma da (6) e da (3) si ha:
(7) Ba) Ep)(pya'b!qg)= (p/a'b! a) A p/a (p/ab!4) A -(pla'p/ab!q)) e quindi un paradosso, perché “(p/a;'b!q)= (p/a'b! q)” può essere vero solo se po= p e a = a," cosicché la (7) asserisce “p/a; (p/ab!q) A-(p/a(p/ab!q)). Per il simbolismo scelto da Russell nella sua lettera a Hawtrey, Landini, che ha riscoperto questo paradosso nel 1987, lo ha battezzato, nel 1989, “paradosso p/a,” (p/a paradox). Può essere utile ripercorrere il ragionamento di Russell in modo informale. Egli correla a ciascun (surrogato sostituzionale di) classe, p/a, p'/a', p"/a", una proposizione p/a'b! q (cioè, quella espressa da “Il risultato della sostituzione, in p, del costituente a con b è 97), p/a"b!q, p"/a'"b!q, ecc.'°* Poi prende la proposizione p,, espressa da “a, è la proposizione correlata a una classe p/a cui a, non appartiene” e (il surrogato sostituzionale del)la classe P/a, di tutte le proposizioni che non sono elementi delle classi cui sono correlate (così, una generica proposizione p/a'b!q sarà un membro di p/4,, se e solo se essa non è un membro di p/a). Ma p/a, è anch'essa (il surrogato sostituzionale di) una classe di proposizioni. Quindi dev'essere correlata con un’unica proposizione, cioè p/a, db! q .
152 Nelle righe della lettera corrispondenti ai passaggi (2) e (3) (la settima e l’ottava, contando come prima riga l’indicazione di luogo e data), Russell omette una
“o” a pedice di a, cosicché si ha “py/a,'(py/a'b!q)” invece di “p/a
Russell si serve della simbologia “ plia ” per “p/a’b!q”, e pertanto scrive “ p,
a
bi Hod
=
a (0)
P/ab!q)
(per la precisione, nella lettera,
per “p/a (p/a'b!q)”). Il circoletto intorno a
una “o” a pedice e il punto interrogativo che compaiono nel corrispondente del passaggio (2) (settima riga della lettera) non sono di mano di Russell ma, presumibilmente, di Hawtrey (v. B. Linsky [2002b], pp. 153-154). 153 Si osservi che (come puntualizzato in Landini [2013b], p. 8) p/a,'b = p/a'b non implica né p, = p né a, = a, perché se, per es., p, fosse la proposizione espressa da “a,= a,” e p fosse la proposizione espressa da “a = b”, p/a,'b e p/a'b sarebbero entrambe la proposizione espressa da “b = b”, anche se a # a, (e quindi p # p.). Al contrario, poiché “p/a, b!q” sta per (i) “q è ciò che risulta da p, sostituendo a, con ò in tutti i posti in cui 4, si presenta in p,” e “p/a'b! g” sta per (ii) “q è ciò che risulta da p sostituendo a con » in tutti i posti in cui a si presenta in p”, le proposizioni espresse da (i) e da (ii) saranno identiche solo se p, = p e & = a, perché proposizioni identiche devono avere costituenti identici. 154 Si osservi che, poiché g (così come b) è una costante, queste proposizioni saranno sempre, 0 quasi sempre, false; ma questo non è rile-
vante: ciò che importa per la derivazione è la correlazione biunivoca tra ciascun (surrogato sostituzionale di) classe e una proposizione.
Le teorie dello zigzag, della limitazione di grandezza, e senza classi
59
DD
Da ciò si ottiene la contraddizione che p/a,'b!q è e non è un membro di p/a. La teoria sostituzionale semplice s1 rivela inconsistente.
4.1.4. Finora non abbiamo detto nulla del modo in cui sono affrontati i paradossi che oggi usualmente si rubricano come “semantici”, nel contesto della teoria sostituzionale semplice. In “On the substitutional theory of classes and relations” Russell prende in esame solo uno di questi paradossi: quello di Kénig.'?° Ricordiamo che il paradosso di K6nig si ottiene considerando la serie di tutti i numeri ordinali definibili e quindi ricavando una contraddizione dal fatto che il primo numero ordinale indefinibile può apparentemente essere definito come “Il primo numero ordinale che segue tutti i numeri ordinali definibili” o come “Il più piccolo numero ordinale non definibile”.'?° Questo paradosso non è risolto attraverso la gerarchia di tipi risultante dalla teoria sostituzionale semplice, ma può essere risolto — secondo Russell — attraverso un esame del significato della parola “definibile”. In realtà — sostiene Russell — questo termine è ambiguo: [...] definibile è relativo a qualche dato insieme di nozioni fondamentali [fundamental notions], e se chiamiamo / quest’insieme di nozioni fondamentali, “definibile in termini di /° non è mai esso stesso definibile in termini di /. Ciò si può considerare dimostrato
dal precedente paradosso [il paradosso di K6nig]; si vede presto che è probabile, paradosso a parte, quando cerchiamo di trovare una definizione. È facile definire “definibile in termini di 7° per mezzo di un apparato più ampio /‘ ma allora “definibile in termini di /'”” richiederà per la sua definizione un apparato ancora più grande /", e così via. Oppure possiamo prendere “definibile in termini di /° come esso stesso parte del nostro apparato, cosicché avremo ora un apparato J che consiste di / insieme con “definibile in termini di /°. In termini di quest’apparato J, “il più piccolo ordinale non definibile in termini di J° non è definibile. Quindi il paradosso del più piccolo ordinale definibile è solo apparente."?”
Qui Russell osserva che “definibile” è una parola che non ha un significato assoluto, ma sempre relativo a un certo linguaggio L. Ciò che è definibile in un linguaggio L non sarà, in generale, la stessa cosa di ciò che è definibile in un altro linguaggio L'. Supponendo che la logica dei linguaggi di cui parliamo sia fissata, se L ha un insieme di termini primitivi / e L'ha un insieme di termini primitivi /', in generale, ciò che è definibile in termini di L non coinciderà con ciò che è definibile in termini di L‘. In particolare, sostiene Russell, il paradosso di K6nig dimostra che “definibile in termini di L” non fa parte dei termini definibili in termini di L. Possiamo, certamente, immagi-
nare un linguaggio L' nel quale “definibile in termini di L” sia definibile; ciò accade, per esempio, se supponiamo che l’insieme J dei termini primitivi di L' includa tutti i termini primitivi di / e anche “definibile in termini di /”. Ma allora, osserva Russell, “definibile in termini di L'’’ non sarà definibile in L'. Scrive Russell: Il punto del paradosso circa l’indefinibilità è che, a mano a mano che allarghiamo il nostro apparato, alteriamo la nozione “definibile in termini del nostro apparato”, e questa nozione, come il limite di una serie ben ordinata, rimane sempre fuori di ciò che si può definire in termini del nostro apparato; cosicché, se / è un insieme qualsiasi di nozioni fondamentali, allora, comunque si possa sce-
gliere /, “definibilità in termini di 7° rimane indefinibile in termini di /.'°*
Si tratta di una soluzione che è immediatamente estensibile ai paradossi di Richard e di Berry — sostituendo a “definibile”, “nominabile’’ — e che presenta analogie con quella che Richard aveva fornito al paradosso da lui stesso scoperto. Si osservi che questa soluzione non deriva dalla teoria sostituzionale semplice, ma ne è indipendente: essa adombra chiaramente quello che oggi è divenuto il punto di vista ortodosso, sui paradossi semantici: cioè la gerarchia tarskiana di linguaggi, ciascuno dei quali funziona da metalinguaggio del precedente. Russell propone qui dunque una soluzione dei paradossi semantici — almeno di quelli di Richard, di K6nig e di Berry— che è distinta da quella offerta per i paradossi logici — la teoria sostituzionale semplice. '° Ciò non significa, però, che all’epoca Russell considerasse i paradossi semantici come appartenenti a un genere radicalmente distinto da quello dei paradossi logici. Si noti, infatti, che entrambi i generi di paradossi sono evitati con un meccanismo affine. La teoria sostituzionale mima, in un’ontologia di soli particolari e proposizioni, quelli che sarebbero gli effetti di una stratificazione in tipi delle funzioni proposizionali in senso ontologico e delle classi — se vi fossero entità siffatte. La teoria semantica evita i paradossi di Richard, di K6nig e di Berry con una stratificazione di linguaggi. Così entrambe le teorie sostituiscono una gerarchia di livelli a ciò che le argomentazioni intuitive che !55 V_ Russell [1906c], pp. 184-187. 156 V_ sopra, cap. 4, $ 3.2.
5” Russell [1906c], p. 185. 158 Russell [1906c], pp. 186-187. 19° Sa sopra, cap. 4, $ 3.1.
10 In proposito, v. Landini [2004a], $ 4, pp. 272-279.
capitolo 8
594
conducono ai paradossi interpretano come un unico livello. In effetti, come vedremo nel prossimo paragrafo, poco dopo “On the substitutional theory of classes and relations” Russell attribuirà esplicitamente tutti i paradossi allo stesso genere di fallacia: la violazione del “principio del circolo vizioso”.
4.2. LA CRITICA DI POINCARÉ E LA RISPOSTA DI RUSSELL 4.2.1. Tra la fine del 1905 e l’inizio del 1906, Henri Poincaré pubblicò sulla Revue de Métaphysique e de Morale tre saggi, dal titolo “Les mathématiques et la logique”,!° in cui sferrava un duro attacco al logicismo di Russell, che all’epoca era divulgato e fervidamente sostenuto, in Francia, da Louis Couturat.!° In questi articoli, Poincaré
rivendica il ruolo fondamentale e imprescindibile dell’intuizione in matematica, che per lui si incarna nel principio d’induzione (considerato, kantianamente, sintetico a priori), e sostiene l’inutilità del simbolismo peaniano che — a suo parere — non farebbe altro che rendere illeggibili le dimostrazioni, senza aprire la strada a nuove scoperte, e senza proteggere dall’insorgenza di paradossi. Nell’ultimo di questi articoli, Poincaré prende in esame le tre teorie proposte da Russell in “On some difficulties...’’ come possibili soluzioni ai paradossi logici. Egli scrive: Secondo la zigzag theory: «le funzioni proposizionali determinano classi quando sono molto semplici, mentre non sono in grado di farlo solo quando sono complicate e oscure».['®*] Chi deciderà ora se una definizione può essere considerata come sufficientemente semplice per essere accettabile? A questo problema nessuna risposta, se non la leale confessione di una completa impotenza: «gli assiomi riguardo a quali funzioni siano predicative devono essere enormemente complicati e non si possono raccomandare per alcuna plausibilità intrinseca. A questo difetto si potrebbe rimediare con una maggiore ingegnosità, o ricorrendo a qualche distinzione finora non osservata. Ma finora, nel tentativo di stabilire gli assiomi per questa teoria, non ho trovato alcun principio guida eccetto quello di evitare le contraddizioni; e questo, in sé, è un principio del tutto insufficiente, giacché ci lascia sempre esposti al rischio che ulteriori deduzioni provochino contraddizioni».[!99]
Questa teoria resta dunque ben oscura; in questa notte, una sola luce: Secondo la theory of limitation of size, una classe cesserebbe d’aver sere infinita, ma bisognerebbe che non lo fosse troppo. Ma ritroviamo sempre la stessa difficoltà; in quale momento preciso questa teoria è che non ci dice fin dove sia legittimo arrivare risalendo è risolta e Russell passa alla terza teoria.
la parola zigzag. [...] diritto all'esistenza se fosse troppo estesa. Forse potrebbe esessa comincerà ad esserlo troppo? «Una grande difficoltà di la serie degli ordinali».['°9] Ben inteso, questa difficoltà non
Nella no class theory, è proibito pronunciare la parola classe e si deve rimpiazzare questa parola attraverso varie perifrasi. Che cambiamento per 1 logisti [/ogisticiens: v. sotto, nota 167] che non parlano che di classi e di classi di classi! Bisognerà rifare tutta la Logistica [Logistique!°7]. Ci si può immaginare quale sarà l’aspetto di una pagina di Logistica quando si saranno soppresse tutte le proposizioni in cui si parla di classi? Non ci saranno che alcuni superstiti sparsi in mezzo a una pagina bianca. Apparent rari nantes in gurgite vasto.!®
La critica di Poincaré è ingiusta. È vero che Russell — nell’articolo cui si riferisce Poincaré — non sviluppa delle teorie complete, ma è abbastanza chiaro che non era questo il suo obiettivo. Il suo scopo era piuttosto quello di passare in rassegna delle possibili direzioni di ricerca e di esaminarne le implicazioni più generali. Che poi queste direzioni di ricerca non fossero fittizie è testimoniato da tutto lo sviluppo successivo delle ricerche sui fondamenti della matematica: i due sistemi assiomatici per la teoria degli insiemi oggi più diffusi — quello di Zermelo e quello di von Neumann — si possono vedere come forme di teoria della limitazione di grandezza; un sistema che si può considerare come una forma di teoria dello zigzag sarà proposto da Quine nel saggio del 1937 “New foundations for mathematical logic”;'® quanto alla teoria senza classi, essa sarà sviluppata dallo stesso Russell, prima nelle diverse forme di teoria sostituzionale (una delle quali abbiamo già considerato) e poi nella teoria ramificata dei tipi dei Principia.
‘©! V. Poincaré [1905], [1906a], [1906b]. !©° V. Couturat [1904-05], [1905a], [1906a], [1906b]. 165 V. Poincaré [1906b]. 164 Russell [1906], $ II, pp. 145-146. Le citazioni da Russell sono tutte in inglese nel testo originale francese dell’articolo.
165 Russell [1906a], $ II, p. 147. 166 Russell [1906a], $ II, p. 153.
19? “I ogistique” era il termine che Couturat propose al Secondo Congresso Internazionale di Filosofia (Ginevra, 1904) per indicare la moderna logica simbolica (v. Couturat [1905b], p. 706). Fin dall’inizio, però, la parola tendeva, più in particolare, a indicare la logica svilup-
pata da Peano e da Russell — per quanto vi era di comune tra esse. In corrispondenza a “logistique”, “logisticiens” indicava sia coloro che oggi sono detti “logicisti”, sia gli appartenenti alla scuola di Peano. 168 Poincaré [1906b], $ VIII, pp. 306-307. Le espressioni in inglese e in latino compaiono in caratteri normali nel testo originale francese.
!©° Quest’osservazione si deve originariamente a Gédel [1944], p. 453. Per il sistema di Quine menzionato, v. sotto, Gapel2y81258:
Le teorie dello zigzag, della limitazione di grandezza, e senza classi
595
Nel paragrafo successivo a quello in cui critica le teorie proposte da Russell — intitolato “La vraie Solution” — Poincaré propone la sua diagnosi sui paradossi. Approvando la soluzione che Richard aveva dato del proprio pa-
radosso (v. sopra, cap. 4, $ 3.1), Poincaré l’assume come paradigma per la soluzione di tutti i paradossi. Egli 0sserva che, secondo la spiegazione di Richard: E è l’insieme di tuzti i numeri che si possono definire attraverso un numero finito di parole, senza introdurre la nozione dell’insieme E stesso. Senza di questo la definizione di E conterrebbe un circolo vizioso; non si può definire l'insieme E attraverso se stesso.
Ora abbiamo definito N [N — ricordiamolo — è in questo contesto un numero decimale definito in modo da non poter coincidere con nessun numero dell’insieme E: tuttavia esso deve appartenere a £ perché, essendo un numero decimale definito attraverso un numero finito di parole, soddisfa la condizione di appartenenza a E] con un numero finito di parole, è vero, ma basandoci sulla nozione dell’insieme E. Ed ecco perché N non fa parte di E. [...] Ma la stessa spiegazione vale per le altre antinomie e in particolare per quella di Burali-Forti. Qui s’introduce l’insieme £ di tutti i numeri ordinali; ciò vuol dire di tutti i numeri ordinali che si possono definire senza introdurre la nozione dell’insieme £ stes-
so; il numero ordinale che corrisponde al tipo d’ordine definito attraverso quest’insieme £ si trova dunque escluso.'”°
La conclusione di Poincaré è che: «le definizioni che devono essere considerate come impredicative sono quelle che contengono un circolo vizioso».!”! Secondo quanto sostiene Poincaré nel saggio esaminato, è l'ammissione dell’esistenza di un infinito attuale — sostenuta da Cantor e dai logicisti — a dare origine alle definizioni impredicative. Egli scrive: La parola tutti ha un senso ben netto quando si tratta di un numero finito di oggetti; perché ne avesse ancora uno, quando gli oggetti sono in numero infinito, bisognerebbe che esistesse un infinito attuale. Altrimenti tuti questi oggetti non potrebbero essere concepiti come posti anteriormente alla loro definizione e allora, se la definizione di una nozione N dipende da tuzti gli oggetti A, può essere accusata di circolo vizioso, se tra gli oggetti A ce ne sono di tali che non si possono definire senza far intervenire la nozione N stessa.
Il brano riportato non è forse dei più perspicui, ma il ragionamento che Poincaré vi svolge può essere, credo, ricostruito come segue. Non vi è nessun’obiezione al definire un oggetto attraverso una totalità di cui l’oggetto stesso fa parte, se gli oggetti che fanno parte della totalità sono supposti già esistenti: la definizione non ha qui il compito di generare un nuovo oggetto basandosi sugli oggetti già definiti, ma solo quello di isolare, di determinare un oggetto che esiste già in mezzo ad altri oggetti che già esistono. Gli oggetti di una classe finita possono benissimo essere concepiti come attualmente esistenti: così non sorge nessun’obiezione di principio alla definizione di un oggetto tramite una totalità finita di cui l’oggetto fa parte. Nello stesso modo, se esistesse un infinito attuale, le definizioni in cui un oggetto è definito sulla base di una totalità infinita di cui l’oggetto stesso fa parte, non sarebbero circoli viziosi. Ma, per Poincaré, i paradossi costituiscono una prova che queste definizioni sono effettivamente circoli viziosi. Ciò conferma Poincaré nel suo rifiuto dell’infinito attuale: l’infinito è solo un modo di dire;
è solo potenziale. Dire che una totalità è infinita, per Poincaré, significa solo dire che è sempre possibile aggiungere ad essa nuovi elementi. Ma, questi nuovi elementi che si aggiungono non possono essere definiti con una definizione che dia già per acquisita l’intera totalità: ci troveremmo di fronte a un circolo vizioso. Così Poincaré conclude il suo articolo con una condanna del lavoro di Cantor e dell’opera dei logicisti che avevano accolto quel lavoro come valido: Non esiste un infinito attuale; i Cantoriani l’hanno dimenticato, e sono caduti nella contraddizione. [...] I logicisti l'hanno dimenticato come i Cantoriani e hanno incontrato le stesse difficoltà.'?
4.2.2. Nel giugno del 1906, Russell scrisse un articolo di replica a Poincaré che, tradotto in francese da Couturat, apparve nel settembre successivo, con il titolo “Les paradoxes de la logique”, sulla stessa Revue de Métaphysique e de Morale che aveva ospitato gli articoli di Poincaré. In questo saggio Russell difende la sua teoria sostituzionale — che era conosciuta da Poincaré solo nella versione appena abbozzata dell’articolo “On some difficulties...”° e non in quella più sviluppata di “On the substitutional theory of classes and relations” (che non era stato pubblicato). Inoltre, modifica questa teoria in alcuni punti, in modo da renderla adeguata al trattamento dei paradossi che oggi diremmo “semantici”.
!7° Poincaré [1906b], $ IX, p. 307. !7! Ibid.; corsivo di Poincaré.
!72 Poincaré [1906b], $ XV, p. 316. !73 Poincaré [1906b], $ XV, pp. 316-317.
capitolo 8
596
In “Les paradoxes de la logique”, Russell ammette che, in effetti, le teorie dello zigzag e della limitazione di grandezza «in tutte le forme che sono finora riuscito a dar loro, si sono dimostrate completamente inservibili», ma sostiene che la sua teoria sostituzionale si è invece rivelata in grado di risolvere iparadossi. In questo saggio, Russell conviene con Poincaré che i paradossi si originino da una violazione di quello che Russell ora chiama “principio del circolo vizioso” (vicious-circle principle). Tuttavia, al contrario di Poincaré, egli sostiene che: (1) Non vi è nessuna connessione tra i paradossi e l'affermazione dell’esistenza di un infinito attuale.
(2) Il principio del circolo vizioso dev'essere i/ risultato di una teoria corretta, e non può esso stesso rappresentare tale teoria. Le idee che l’infinito attuale non abbia nessuna connessione con i paradossi, e che questi siano dovuti a circoli viziosi non erano nuove, per Russell, sebbene non fossero mai apparse nei suoi lavori pubblicati. In una lettera a Couturat del 12 maggio 1904, Russell scriveva: «Le contraddizioni non hanno niente a che fare con la natura delle classi, né con l’infinito»;'!” poco più avanti suggeriva: «Mi sembra [...] che la soluzione debba trovarsi in un circolo vizioso [cercle vicieux] che racchiudono certe Df che non ne hanno l’aria. Ma non so ancora precisare quest’idea».!?° In un manoscritto intitolato “On functions, classes and relations”, datato “1904”, Russell precisa
però la sua idea, enunciando già quel principio del circolo vizioso che sarà pubblicato per la prima volta nel contesto del dibattito con Poincaré: Si potrebbe pensare che (@).(f‘x)‘(@° 2) [la scrittura “(@).(f‘x)“(@‘ 2)” equivale qui a “(@)(f(@ 2 ))x] sia essa stessa una funzione proposizionale di x, e quindi della forma w°x. Essa sarà spesso, sebbene non sempre, equivalente per tutti i valori di x, a qualche funzione
W°x, ma non sarà essa stessa una tale funzione. Questo si può vedere come segue [...]. [...] Se [...] (@).(ff*)(@° 2)
[cioè (9)(f(@ Z)) x ] ha come valore per l’argomento x un’asserzione su x, dev’essere essa stessa uno dei valori di @ per cui (f‘x)°(@° £) [cioè f(@ 2 )x] si dice essere vera. Ma questo porta a un circolo vizioso nella definizione: Non possiamo fare nessuna asserzione su tutte le asserzioni su x, perché secondo l’ipotesi, tale asserzione sarebbe essa stessa una delle asserzioni su x, e impli-
cherebbe che valga di se stessa. Quindi un’asserzione definibile solo in termini dell’asserzione proposta è analiticamente implicata RA
nell’asserzione proposta. Per evitare questo circolo, dobbiamo escludere (@).(f‘x)‘(@* 7) [cioè (0)(f(@ 2 ))x] dai valori
di V°x
È dunque scorretta la tesi — che si perpetua in letteratura, sebbene sia già stata conclusivamente smentita nel 1993 da Russell Wahl!" — secondo cui Russell avrebbe sviluppato l’idea che i paradossi siano dovuti a circoli viziosi dal suggerimento di Poincaré.!”° L’idea che i paradossi sorgano tutti in relazione con l’infinito attuale non era all’epoca sostenuta solo dai neokantiani come Poincaré. Dall’altra parte della barricata, anche Peano condivideva quest’opinione,'*° che sarà poi ripresa da Hilbert. Nell’agosto del 1906 Peano scrive, nel suo latino sine flexione: «Omni antinomia, antiquo et recente, depende de consideratione de “infinito’’». Ma Peano non è d’accordo con i finitisti nel risolvere il problema bandendo l’infinito attuale; egli continua, infatti, così: Consilio, que da aliquo Auctore, de non considera “infinito”, es prudente, sed non resolve problema, nam infinito es in natura de plure quaestione, et “naturam cavolo Del tamen usque recurret” [“puoi cacciare la natura con la forca, ma tornerà sempre”: il passo è di Orazio, Epistole, I, 10, 24].!*
Un brano, questo, ripreso dall’allievo di Peano Mario Pieri nel suo discorso inaugurale per l’anno accademico 1906-07 all’Università di Catania:
174 175 176 177
Russell [1906d], $ II, p. 200. In Russell [2001a], p. 498. In Russell [2001a], p. 499. Russell [1904c], $ II, p. 88.
178 V. Wahl [1993], p. 84. Wahl riporta, a supporto della sua tesi, parte del brano precedente di “On functions, classes and relations” (che non era stato ancora pubblicato, all’epoca dell’uscita dell’articolo di Wahl).
!?° V., per es., Sainsbury [1979], cap. 8, $ 6, p. 312, Hylton [1992], p. 108, e B. Linsky [2002a], p. 395. 180 Questoè stato rilevato da Erika Luciano e Clara Silvia Roero nella loro introduzione a Peano e Couturat [2005], p. xxxvi.
18! Peano [1906b], p. 346.
Le teorie dello zigzag, della limitazione di grandezza, e senza classi
597
Tutte le antiche e moderne antinomie derivano, per un verso o per l’altro, dal considerar l’infinito; che perciò appunto alcuni (i finitisti, come il Renouvier) vorrebbero escluder senz’altro dal dominio della ragione. Consiglio prudente, ma vano; atteso che l'infinito è nella natura di troppe quistioni, e “naturam expellas furca, tamen usque recurret”.!*
Pieri continua: Concetti d’una sfera così vasta, che parve già sogno il presumere di segnarne con precisione i confini, son oggi divenuti logicamente maneggevoli, e prestano ottimi servigi alla ragion deduttiva. Certi altri — come “tutto il pensabile”, “tutto ciò che non è numero”, e simili — par che abbiano in sé veramente alcun che di vago e d’indefinito; e non è meraviglia, se partoriscono equivoci. Le concezioni e operazioni matematiche si estendono a ogni classe finita di enti, e a certe classi infinite, che si posson chiamar “transfinite”: ma è fuor di dubbio che esistono ancori innumerevoli classi, a cui non sono applicabili.'**
Invece, come abbiamo visto, Russell non credeva che l’infinito attuale avesse un ruolo speciale nell’origine dei
paradossi. In “Les paradoxes de la logique” egli scrive: Degli insolubilia considerati dagli antichi, nessuno introduce l’infinito; e di questi, abbastanza stranamente, Poincaré menziona il paradosso di Epimenide come se fosse della stessa natura di quelli che sorgono nella teoria del transfinito [...]. Una semplificazione di questo paradosso è costituita dall’uomo che dice: “Io sto mentendo”; se mente, dice la verità; ma se dice la verità, mente. Ha
quest’ uomo dimenticato che non esiste un infinito attuale?!8*
Già nella citata lettera a Couturat del 24 maggio 1904, Russell si serviva del paradosso del mentitore per suffragare la tesi che l'infinito attuale non avesse nulla a che vedere con le contraddizioni.'*° L’obiezione di Russell appare fondata, in realtà, anche senza ricorrere all’antinomia del mentitore: a ben guardare, per esempio, il paradosso di Russell non dipende dall’assunzione che esista un’infinità attuale di classi, o che esistano insiemi infini+ 186
tl.
4.2.3. Come abbiamo visto qualche pagina addietro, nel 1906 Poincaré sembra sostenere che non vi sarebbe nulla da obiettare alle definizioni in cui un oggetto è definito ricorrendo a una totalità di cui quest’oggetto è parte, purché questa totalità sia finita. In un saggio pubblicato nel 1909, intitolato “La logique de l’infini”’, Poincaré rettifica parzialmente questa posizione e articola meglio le sue posizioni riguardo alla relazione tra impredicatività e infinito attuale. Poincaré comincia con l’affermare che: La logica formale non è altro che lo studio delle proprietà comuni a tutte le classificazioni; essa c’ insegna che due soldati che fanno parte dello stesso reggimento appartengono perciò alla stessa brigata, e di conseguenza alla stessa divisione, ed è a questo che si riduce tutta la teoria del sillogismo. '*”
Se è così — continua Poincaré — perché le regole della logica formale siano valide, si pone una condizione. La condizione è che: [...] la classificazione adottata sia immutabile. Noi veniamo a sapere che due soldati fanno parte dello stesso reggimento, e vogliamo concluderne che essi fanno parte della stessa brigata; ne abbiamo il diritto ammesso che, nel tempo che impieghiamo per fare il nostro ragionamento, uno dei due uomini non sia stato trasferito da un reggimento all’altro.!8*
!82 Pieri [1907], p. 37. !53 Pieri [1907], pp. 37-38. Pieri termina questa parte della sua prolusione esprimendo la fiducia che si sarebbe presto scoperto un modo per superare le antinomie senza sacrificare l'infinito attuale: «Con tutto ciò molti indizi fanno ormai presagire, che in questa parte ancora le difficoltà saranno presto appianate o rimosse, pur senza danno del patrimonio acquisito salvo forse qualche ritocco in certe novità troppo ardite. [...] Ho ferma opinione, che i metodi proposti dal Jourdain e dal Russell riusciranno a salvare (anzi a porre in miglior luce) quasi tutti i risultati del Cantor: ma, quando anche non si giungesse ad escluder da queste altezze ogni traccia di contradizione, e ci convenisse sfrondare una parte della dottrina dei numeri transfiniti, o recidere qualche altro giovane rampollo del grande albero matematico, la Critica ci ha da gran tempo avvezzi a ben altri pentimenti e a ben altre rinunzie!» (Pieri [1907], pp. 38-39). Si può supporre che con «metodi proposti dal Jourdain e dal Russell» Pieri si riferisse alle proposte contenute nell’articolo di Russell “On
some difficulties in the theory of transfinite numbers and order types”.
184 Russell [1906d], $ I, p. 197. !85 V. in Russell [2001a], pp. 498-499. Abbiamo riportato la descrizione del paradosso del mentitore offerta da Russell in questa lettera nel cap.4,$3.4. IS Un rilievo simile è stato fatto da George Kreisel ([1969], p. 98, nota 1), da Carlo Cellucci (in Cellucci (ed.) [1978], introduzione, p. 6) e da R. Mark Sainsbury ([1979], cap. 8, $ 6, p. 312).
!57 Poincaré [1909],$ 1, p. 461.
598
capitolo 8
Poincaré afferma ora che «Le antinomie che si sono segnalate provengono tutte dalla dimenticanza di questa semplice condizione: ci si è appoggiati su una classificazione che non era immutabile e che non poteva esserlo SS ]».!° Le antinomie — secondo quanto sostiene ora Poincaré — si devono quindi a una fallacia conosciuta fin dai tempi antichi: la fallacia dell’equivocazione. L'esempio scelto da Poincaré è precisamente uno in cui non entra affatto la nozione di “infinito attuale”. Si tratta del paradosso di Berry. Ecco la descrizione che ne dà Poincaré: Qual è il più piccolo numero intero che non può essere definito da una frase di meno di cento parole italiane? E innanzi tutto, esiste questo numero? Sì, perché con cento parole italiane, non si possono costruire che un numero finito di frasi, poiché il numero delle parole del dizionario italiano è limitato. Tra queste frasi, ve ne saranno alcune che non avranno alcun senso o che non definiranno nessun numero intero. Ma ciascuna di esse potrà definire a/ più un solo numero intero. Il numero degli interi suscettibili di essere definiti in questo modo è dunque limitato; di conseguenza, ci sono certamente degli interi che non possono esserlo; e fra questi interi, sicuramente ce n’è uno che è più piccolo di tutti gli altri. No; perché se quest’intero esistesse, la sua esistenza implicherebbe contraddizione, poiché esso si troverebbe definito da una frase
di meno di cento parole italiane, cioè dalla frase stessa che afferma che esso non può esserlo.!0
La soluzione del paradosso, continua Poincaré, è la seguente: Questo ragionamento riposa su una classificazione dei numeri interi in due categorie, quelli che possono essere definiti da una frase di meno di cento parole italiane e quelli che non possono esserlo. Ponendo la questione, noi proclamiamo implicitamente che questa classificazione è immutabile e che non cominciamo a ragionare che dopo averla stabilita definitivamente. Ma questo non è possibile. La classificazione non potrà essere definitiva che quando avremo passato in rivista tutte le frasi di meno di cento parole, avremo rigettato quelle che non hanno senso, e avremo fissato definitivamente il senso di quelle che ne hanno uno. Ma tra queste frasi, ve
ne sono alcune che non possono avere senso che dopo che la classificazione è fissata, sono quelle dove è in questione la classificazione stessa. Riassumendo la classificazione dei numeri non può essere fissata che dopo che la cernita delle frasi sia conclusa, e questa cernita non può essere conclusa che dopo che la classificazione sia fissata, di modo che né la classificazione, né la cernita
potranno mai essere terminate. !?!
Ora Poincaré affronta il problema dell’infinito attuale. Egli afferma che: Queste difficoltà s’incontreranno molto più spesso quando si tratta dî collezioni infinite. Supponiamo di voler classificare gli elementi di una di queste collezioni e che il principio della classificazione riposi su qualche relazione dell’ elemento da classificare con la collezione tutta intera. Una tale classificazione potrà mai essere concepita come fissata? Non esiste un infinito attuale, e quando parliamo di una collezione infinita, vogliamo dire una collezione alla quale si possono continuamente aggiungere dei nuovi elementi (come una lista di sottoscrizione che non sarà mai chiusa nell’attesa di nuovi sottoscrittori). Ora la classificazione non potrà essere fissata che quando questa lista sarà chiusa; tutte le volte che si aggiungono alla collezione dei nuovi elementi, si modifica questa collezione; si può dunque modificare la relazione di questa collezione con gli elementi già classificati; e poiché è secondo questa relazione che questi elementi sono stati sistemati in questo o quel cassetto, può accadere che una volta che questa relazione è stata modificata, questi elementi non siano più nel cassetto giusto e che si sia costretti a spostarli. Finché vi sono dei nuovi elementi da introdurre, si deve temere di dover ricominciare tutto il lavoro; ora non accadrà mai che non si abbiano più dei nuovi elementi da introdurre; la classificazione non sarà dunque mai fissata.!°?
° i qui,
Poincaré trae una distinzione tra
[...] due specie di classificazioni, applicabili agli elementi delle collezioni infinite; le classificazioni predicative, che non possono essere turbate dall’introduzione di nuovi elementi; le classificazioni non predicative che l’introduzione di nuovi elementi costringe
a rimaneggiare senza sosta.!?
Nell'ultimo paragrafo del suo articolo, Poincaré riassume così la sua posizione: Le antinomie alle quali certi logici sono stati condotti provengono dal fatto che essi non hanno potuto evitare certi circoli viziosi. Ciò è accaduto loro quando consideravano delle collezioni finite, ma ciò è accaduto loro molto più spesso quando essi avevano la pretesa di trattare delle collezioni infinite. Nel primo caso, essi avrebbero potuto evitare facilmente la trappola in cui sono caduti; 0
188 1 19° 1°! 192 193
Ibid. lbidi Poincaré [1909], $ 1, p. 462. Poincaré [1909], $ 1, pp. 462-463. Poincaré [1909], $ 1, p. 463. Ibid.
Le teorie dello zigzag, della limitazione di grandezza, e senza classi
599
più esattamente hanno essi stessi teso la trappola in cui si sono compiaciuti di cadere, e hanno dovuto fare anche molta attenzione per non cadere a lato della trappola; in una parola, in questo caso le antinomie non sono che dei trastulli. Ben differenti sono quelle generate dalla nozione di infinito; accade spesso che vi si cada senza farlo apposta, e anche quando si è avvertiti, non si è ancora del tutto tranquilli.'°*
Alla luce di questi brani, la posizione di Poincaré può essere meglio chiarita. Egli ora ammette che una definizione possa essere impredicativa anche quando non si ha a che fare con collezioni infinite. Abbiamo definizioni impredicative tutte le volte che definiamo un oggetto a partire da una totalità, di cui l’oggetto stesso fa parte, che non può essere considerata come
“già data”. Secondo Poincaré, tuttavia, quando si ha a che fare con totalità fini-
te, è facile rendersi conto di dove si trova il circolo vizioso — questo caso è dunque relativamente innocuo. Ciò che è più importante, secondo Poincaré, è rendersi conto che le definizioni impredicative sono inevitabili quando si definisce un oggetto a partire da una totalità infinita di cui esso è parte. Perché definizioni del genere fossero legittime, occorrerebbe concepire l’infinito come “già dato”, come attuale. Solo così, infatti non sorgerebbero obiezioni di principio a definire un elemento di una totalità infinita appellandosi alla totalità stessa. Ma, secondo Poincaré, non esiste un infinito attuale: i paradossi ne costituiscono una riprova. L'infinito, per Poincaré, è solo
potenziale: in altri termini, dire che una totalità è infinita, significa solo che il processo di aggiunta di nuovi elementi ad essa continua indefinitamente e non può mai immaginarsi come completato. Se l’infinito s'intende in questo modo, si vede facilmente —
secondo Poincaré — che le definizioni in cui ci si serve di una totalità infinita
per definire un oggetto che ne fa parte nascondono lo stesso tipo di circolo vizioso che si può riconoscere più facilmente nel caso, per esempio, del paradosso di Berry. Queste tesi di Poincaré individuano un modo di concepire l’infinito che sarà poi pienamente condiviso da Brouwer e dalla sua scuola, nota come “intuizionista”. 4.2.4. Sebbene Russell, per parte sua, non intenda rinunciare all’idea di un infinito attuale, egli conviene con Poincaré che i paradossi provengano dalla violazione del “principio del circolo vizioso” che, in “Les paradoxes de la logique”, egli enuncia così: [...] qualunque cosa concerna in qualche modo tutti 0 qualsiasi o qualcuno (indeterminato) [a// or any or some] dei membri di una classe non deve a sua volta essere un membro della classe. Nel linguaggio di Peano, il principio che voglio sostenere può essere enunciato così: “Qualunque cosa involga [invo/ves] una variabile apparente [cioè vincolata] non dev'essere tra i valori possibili di è 2 > 19: quella variabile”.
Poiché il quantificatore esistenziale è definibile attraverso il quantificatore universale, il principio precedente può essere enunciato anche così: «Tutto ciò che involge [invol/ves] tutti non dev'essere uno dei tutti che involge».!?° Il
principio del circolo vizioso — così come è enunciato da Russell — appare più forte di quello di Poincaré: mentre Poincaré — se lo abbiamo inteso correttamente — considera illegittime solo alcune delle definizioni in cui un 0ggetto è definito attraverso una totalità di cui esso stesso fa parte,'’” Russell sembra respingere tutte le definizioni di questo genere." La differenza principale tra Russell e Poincaré, riguardo al principio del circolo vizioso, è tuttavia un’altra. Diversamente da Poincaré, Russell ritiene che il principio del circolo vizioso debba essere i/ risultato di una teoria corretta, e non possa, esso stesso, rappresentare tale teoria. Russell ritiene che la portata del principio del circolo vizioso sia puramente negativa: ci dice che ogni teoria che conduce a circoli viziosi dev’essere sbagliata, ma non ci dice come correggerla. Russell osserva che l’idea che i paradossi derivino da circoli viziosi non è nuova, e risale perlomeno a Guglielmo di Occam."” Tuttavia, secondo Russell, Occam aveva compreso ciò che è sfuggito a Poincaré: cioè che, se si vogliono evitare circoli viziosi, occorre rielaborare i principi logici cui si fa riferimento.” Egli scrive:
!°4 Poincaré [1909], $ 7, p. 481. !°5 Russell [19064], $ I, p. 198. 96 Russell [1906d], $ ITI, p. 204. !°7 Presumibilmente, Poincaré non avrebbe avuto nulla da ridire sulla definizione di un oggetto presupponente una classe di cui l’oggetto stesso è parte, purché la classe in questione sia già data. Il punto è che, secondo Poincaré, questo non può mai avvenire quando la classe in questione è infinita. !°8 Torneremo più avanti (v. sotto, cap. 12, $ 2.2) sull’interpretazione del principio del circolo vizioso in Russell.
199 V. Russell [1906d], $ III, p. 196.
200 V. ibid.
capitolo 8
600
È importante osservare che il principio del circolo vizioso non è esso stesso la soluzione dei paradossi del circolo vizioso, ma soltanto il risultato che una teoria deve produrre se vuole darne una soluzione. E necessario, in altre parole, costruire una teoria delle
espressioni contenenti variabili apparenti che produca il principio del circolo vizioso come conseguenza. E per questo motivo che abbiamo bisogno di una ricostruzione dei primi principi logici, e non possiamo accontentarci del semplice fatto che i paradossi sono
dovuti a circoli viziosi.?0
Russell illustra il punto con un esempio: Possiamo illustrare questo con nibili con un numero finito di si può definire con un numero come “tutti inumeri definibili re che mai.?0°
ciò che dice Poincaré a proposito del paradosso di Richard. Dopo aver posto E = “tutti i numeri defiparole”, arriviamo a un paradosso dovuto, dice Poincaré, al fatto che abbiamo incluso un numero che finito di parole soltanto per mezzo di E. Egli propone di evitare questo circolo vizioso definendo E da un numero finito di parole senza menzionare E”. Ai profani, questa definizione appare più circola-
La difficoltà — per Russell — consiste nel fatto che non possiamo formulare esplicitamente la condizione che una definizione rispetti il principio del circolo vizioso senza cadere in un nuovo circolo vizioso. Come annota argutamente Russell in un articolo scritto l’anno successivo, ci troviamo nella situazione di chi, parlando di nasi con un uomo dal grosso naso, dichiarasse: «“Quando parlo di nasi, io escludo quelli che sono enormemente lunghi”, la qual cosa», commenta Russell, «non sarebbe un tentativo propriamente riuscito di evitare una penosa gaffe». La difficoltà di applicare il principio del circolo vizioso deriva — secondo Russell — dal fatto che, quando si quantifica su una variabile, questa variabile deve poter assumere qualsiasi valore: I vecchi logici simbolici[?%] avevano una dottrina dell’universo di discorso, che poneva, per così dire, limiti di convenienza, fuori
dai quali una variabile perbene non dovrebbe gironzolare. Così quando affermavano (per esempio) che @x era sempre vera, volevano soltanto dire che era sempre vera finché x era all’interno dell’universo. Chiamiamo i l’universo. Essi in realtà intendevano: “‘x è un ? implica @x”. Ma doveva ciò valere solamente quando x è un i? Se così fosse, dovremmo dire “x è un ? implica che ‘x è un ? implica gx”. E così via ad infinitum. Così un’asserzione, come @x, che è vera sotto un’ipotesi, può essere affermata come vera sotto quell’ipotesi soltanto se l’asserzione che l’ipotesi implica @x può essere fatta senza alcuna limitazione su x. Qualsiasi limitazione su x fa parte del tutto che è realmente affermato; e appena questa limitazione è esplicitamente enunciata, la proposizione implicazionale risultante resta vera quando la limitazione è falsa. Dunque una variabile dev'essere suscettibile di musi i valori.?°
Un possibile modo di eludere il precedente argomento, osserva Russell,”°° potrebbe essere cercato nella direzione di sostenere che @x deve sempre avere un certo, ambito, o campo di significanza (range of significance) — individui, classi, classi di classi, relazioni, ecc. — e quindi interpretare l’enunciato ‘“@x è sempre vera” come: “@x è vera tutte le volte che è significante”. Ma questo, secondo Russell, non risolverebbe il problema: La difficoltà di questo punto di vista sta nella proposizione (per esempio) “@x è significante solo quando x è una classe”. Questa proposizione non dev'essere ristretta, quanto al suo campo [range], al caso in cui x è una classe; poiché vogliamo che implichi “@x non è significante quando x non è una classe” [cioè: “Se x non è una classe allora @x non è significante” — in cui il campo di variazione di x non è più ristretto alle classi]. Alla fine ci troviamo così riportati a variabili il cui campo [range] è senza restrizioni.”
Quest’argomento, così com’è esposto da Russell, appare fondato su una confusione tra uso e menzione dei se+ 208 x . o TS e: Ù c o o 5 G 5 5 gni. Essere o non essere significanti è una proprietà dei simboli e non, in generale, dei loro riferimenti; quindi,
20! Russell [1906d], $ II, p. 205. 202 Russell [1906d], $ I, pp. 196-197. 203 Russell [1908], $ I, p. 63. 204 Russell allude qui alla logica simbolica sviluppata nell’ultimo quarto dell’Ottocento nella tradizione di Boole, come quella di Peirce e di Schroder.
205 Russell [1906d], $ III, p. 205. 206 V_ Russell [1906d], $ III, p. 205. 207 Russell [1906d], $ III, pp. 205-206. 208 Quest’argomento di Russell è molto probabilmente ispirato a un argomento simile, che si trova nel $ 65 del secondo volume dei Grundgesetze der Arithmetik (1903) di Frege. Frege vuol contestare la tesi che si possa limitare il dominio delle variabili, per es., ai soli numeri reali. Egli argomenta così: «Supponiamo dapprima che il concetto numero [Zahl: Frege chiama Zahlen i numeri in generale, in particolare, i numeri reali, riservando Anzahlen per i numeri cardinali] sia definito rigorosamente e si sia stabilito che le lettere latine [Frege scrive le variabili con i caratteri latini
“a”, “b”, “c”, ecc.] debbano indicare [andeuten: per Frege, una variabile non denota (bedeutet), ma indica (andeutet): precisamente indica le entità che può assumere come valori] solo numeri e che il segno di addizione sia spiegato solo per i numeri. Allora, nell’ enunciato Vado =19A di
Le teorie dello zigzag, della limitazione di grandezza, e senza classi
601
al posto di “x è significante solo quando x è una classe”, Russell avrebbe dovuto scrivere: “*@x° è significante solo quando ‘x’ denota una classe”; ma quest’ultimo enunciato non ci riporta affatto a un campo di variazione non ristretto della variabile “x”, per la semplice ragione che non contiene nessuna variabile, ma solo il nome di una variabile: l’enunciato fa un’affermazione non su un oggetto generico x, ma sul segno “x”. Si tratta, in altri termini, di un enunciato metalinguistico. L'argomento di Russell, dunque, mostra solo che le condizioni di significanza dei simboli di un linguaggio non possono essere formulate volta per volta nel linguaggio stesso. Russell, invece, ne trae la conclusione più forte che si debbano impiegare variabili la cui struttura interna garantisca che esse siano del tipo voluto.” Certamente, la teoria sostituzionale semplice realizza quest’obiettivo; lo fa simulando gli effetti di una teoria dei tipi che sistemi classi e funzioni proposizionali in una gerarchia, ma ricorrendo solo a variabili che, a loro volta, sono totalmente 66.2?
non ristrette.
4.3. LA PRIMA TEORIA SOSTITUZIONALE RAMIFICATA 4.3.1. LA SOLUZIONE DEI PARADOSSI In “Les paradoxes de la logique” — il suo articolo di replica ai saggi di Poincaré — Russell dichiara: La precedente dottrina [cioè, la teoria sostituzionale semplice] risolve, per quanto io posso scoprire, tutti i paradossi concernenti le 0 5 È s CAO s : È 00 3 DR: - 210 classi e le relazioni; ma per risolvere l’ Epimenide sembra che ci occorra una dottrina simile riguardo alle proposizioni.”'
La dottrina che si rende necessaria è suggerita, continua Russell, dall’ applicazione del principio del circolo vizio> Sr: 5 n Ò È 3 s 211 È z so nella forma: «Tutto ciò che involge tutti non può essere uno dei tutti che involge».° Applicando questo principio a un’asserzione su tutte le proposizioni, si desume che essa: [...] dev'essere priva di significato [meaningless] oppure essere un’asserzione [statement] di qualcosa che non è una proposizione [proposition] nel senso qui rilevante. Qualsiasi asserzione [statement] su tutte le proposizioni involge una proposizione come variabile apparente; dunque per evitare circoli viziosi, ci occorre un significato di proposizione secondo cui nessuna proposizione può contenere una variabile apparente.” '°
Nonostante l'ambiguità nell’uso del termine “proposizione” — che, alla fine di questo brano, sembra usato per indicare degli enunciati, piuttosto che delle entità extralinguistiche?'* — ciò che Russell vuol dire è chiaro: gli enunciati che contengono variabili apparenti non esprimono proposizioni. Questa conclusione deriva dal principio del circolo vizioso, insieme con il rifiuto russelliano delle variabili ristrette: poiché nella teoria sostituzionale le
dobbiamo in aggiunta pensare le condizioni che a e bd siano numeri; e queste, poiché inespresse, vengono facilmente dimenticate. [...] Ma proponiamoci una buona volta di non dimenticare queste condizioni! Per una nota legge di logica sappiamo che l’enunciato “se a è un numero, e se b è un numero, allora a +b = b+ a”
si converte nell’ enunciato “se a + b non è uguale a b + a, e se a è un numero, allora b non è un numero”;
e qui è impossibile mantenere la restrizione al dominio [|Gebiet] dei numeri. La situazione costringe irresistibilmente a infrangere tali barriere» (Frege [1893-1903], vol. II, $ 65, p. 78). Frege non confonde qui tra uso e menzione dei segni, ma il suo argomento, come quello di Russell, dimostra solo che la restrizione del dominio delle variabili non può essere enunciata volta per volta all’interno del linguaggio che contiene tali variabili. Forse Frege non intendeva mostrare di più. In questo punto dei Grundgesetze, infatti, Frege vuole dimostrare l'illegittimità delle definizioni parziali — come le definizioni condizionate di Peano — cioè delle definizioni che definiscono un simbolo funzionale solo nel caso che nei suoi posti di argomento entrino variabili il cui dominio sia ristretto a determinate entità che però, in generale, non sono tutte le entità ammesse nel dominio della teoria. A questo scopo, la sua argomentazione è valida. 20° In seguito, Russell non trarrà più la stessa conclusione da quest’argomento (v. sotto, cap. 9, $ 1.1).
210 Russell [1906d], $ III, p. 204.
2!! Ibid. 2! Ibid.
213 Come vedremo tra poco, le “asserzioni” (statements) sono, per Russell, enunciati dichiarativi: se questi enunciati possono involgere variabili apparenti, le stesse variabili apparenti devono essere espressioni simboliche. Ma allora, quando Russell dice che una proposizione non può contenere una variabile apparente, non può riferirsi a proposizioni in senso extralinguistico: infatti, una proposizione in senso extralinguistico può benissimo contenere delle variabili apparenti, qualora essa verta su questi simboli, senza che la sua espressione verbale contenga nessuna variabile apparente. (La sua espressione verbale conterrebbe solo un nome di una variabile apparente.)
capitolo 8
602
proposizioni sono entità, un enunciato che contiene una variabile apparente deve riguardare anche, tra le altre entità, le proposizioni, e quindi — per evitare di violare il principio del circolo vizioso — bisogna negare che quest’enunciato esprima, a sua volta, una proposizione. «Dunque», scrive Russell, per conciliare il campo [range] illimitato della variabile con il principio del circolo vizioso, cosa che poteva sembrare impossibile a prima vista, dobbiamo costruire una teoria in cui ogni espressione [expression] che contiene una variabile apparente (ossia che con: . È n Mes z È 214 tiene parole come tutti, ogni, qualche, il) si riveli come una semplice fagon de parler [...].
Secondo Russell, si può fare questo: [...] sostenendo che un’asserzione [statement] circa tutti [all] (0 circa uno qualsiasi [any], che è la medesima cosa) è realmente l’affermazione [affirmation] di una proposizione [proposition] ambigua delle diverse proposizioni ottenute da casi particolari. Per es., se asseriamo [we state]: “Qualunque cosa sia x, x = x”, asseriamo [we are stating] una proposizione ambigua delle proposizioni
della forma “x = x”; quindi, pur avendo una nuova asserzione [statement] non abbiamo una nuova proposizione [proposition]-!*
Russell non si preoccupa di spiegare che cosa intenda con “asserzione” (statement). Cocchiarella ([1980], p.
92) — seguito in ciò da Landini ([1987], p. 179) — afferma che ciò che Russell sembra avere in mente è che una “asserzione” sia: [...] un atto linguistico o mentale d’affermazione (o negazione) e che insieme con un contenuto (o stato mentale) può essere detto,
in qualche senso, contenere o non contenere una variabile apparente (definita, per esempio, attraverso l’enunciato emesso in un’esecuzione esplicita di quell’atto).?!°
Si può semplificare: la parola ‘“asserzione’” è qui usata da Russell come semplice sinonimo di “enunciato dichiarativo”. Il termine è già usato in questo senso in “On the substitutional theory of classes and relations” (1906): Le matrici non sono nient'altro che abbreviazioni verbali o simboliche; quindi qualsiasi asserzione [statement] in cui compaiono, se ha da essere un’asserzione significante e non un semplice guazzabuglio, deve poter essere formulata senza matrici.?!”
Qui Russell dice che le “asserzioni” possono contenere matrici, che sono simboli: se ne conclude che le asserzioni
stesse devono essere simboli complessi. Russell sembra fare lo stesso uso di “statement” anche negli scritti successivi; per esempio, in Theory of Knowledge (1913), Russell afferma: «L’asserzione [statement] [...] considerata in se stessa, è una serie di rumori; è solo tramite il suo “significato” che diviene vera o falsa».?!* Anche qui: di un atto linguistico non si direbbe che è una serie di rumori: si direbbe piuttosto che esso può essere eseguito emettendo una serie di rumori. Si deve osservare che l’uso del termine “statement” come sinonimo di “declarative sentence” — cioè con il significato di “enunciato dichiarativo’” —
non è per niente strano, nella prima metà del Novecento. Ritroviamo lo
stesso uso, per esempio, nei primi lavori di Quine.?!° A proposito dell’uso di “statement” nei suoi primi scritti, Quine commenterà, nel 1970: Io usavo la parola per riferirmi semplicemente agli enunciati dichiarativi [dec/arative sentences], e lo dicevo. Più tardi smisi di usare la parola di fronte alla tendenza crescente a Oxford a usare la parola per gli atti che compiamo nell’emettere enunciati dichiarati+ 220 VI. È
Russell, naturalmente senza preoccupazioni per gli usi oxoniensi di là da venire, usava il termine “statements” nello stesso senso, cioè per sottolineare che stava parlando di enunciati dichiarativi e non, per es., di domande o di
214 215 216 2!7 218
Russell [1906d], $ III, p. 206. Russell [1906d], $ III, p. 204. Cocchiarella [1980], p. 92. Russell [1906c], pp. 177-178. Russell [1913a], parte II, cap. 1, p. 109.
ZII per es., Quine [1936a] e [1936c]. Lo stesso uso si trova, per es., in Alfred Tarski [1941]: «Ogni teoria scientifica è un sistema di e-
nunciati [sentences] che sono accettati come veri e che possono essere chiamati LEGGI [/aws] 0 ASSERZIONI ASSERITE [asserted statements] o, per brevità, semplicemente ASSERZIONI [statements]» (Tarski [1941], $ 1, p. 3; maiuscoletti nell’originale). Ancora nel 1966, nel suo Ser Theory and the Continuum Hypothesis, il matematico Paul J. Cohen fornisce la seguente definizione: «Un’asserzione è una formula senza variabili libere [A statement is a formula with no free variables”]» (Cohen [1966], cap. 1, $ 2, p. 7).
220 Quine [1970], cap. 1, p. 2.
Le teorie dello zigzag, della limitazione di grandezza, e senza classi
603
comandi. Nel seguito, pur continuando a tradurre, nei brani citati da Russell, “statement” con “asserzione”, intenderò le “asserzioni” di cui parla Russell come enunciati dichiarativi. Procediamo. Russell distingue dunque tra asserzioni (statements) che contengono variabili vincolate e asserzioni che non contengono variabili vincolate. La sua tesi è che, mentre le seconde si riferiscono a proposizioni — che sono entità —, le prime, cioè le asserzioni che contengono variabili vincolate non si riferiscono a singole proposizioni — e quindi non si riferiscono a qualcosa che possa essere, a sua volta, assunto come valore di una variabile vincolata. L’idea è che, al mondo, vi siano entità cui si riferiscono “Socrate è mortale”, “Platone è mortale”, ecc., ma che non vi sia, oltre a queste entità, un’altra entità cui si riferisca, per esempio, ‘Tutti gli uomini sono morta-
Ki Questa distinzione pone Russell in grado di affrontare il paradosso di Epimenide: Ora possiamo risolvere il paradosso dell’uomo che dice “To sto mentendo”. Quest’asserzione è passibile di diverse interpretazioni; la più semplice è: “Cè una proposizione p che affermo e che è falsa”. Quest’asserzione contiene una variabile apparente p; non enuncia dunque una proposizione definita, nel senso da noi dato alla parola proposizione. Pet Dunque l’asserzione dell’uomo [che dice “Io sto mentendo”, interpretata come “C’è una proposizione p che affermo e che è falsa”] è falsa, non perché affermi una proposizione vera, ma perché, pur facendo un’asserzione, non asserisce una proposizione. Così quando egli dice che mente, mente,
e l’inferenza che egli debba pertanto affermare il vero non funziona.”°
L’obiezione in base alla quale l’asserzione di Epimenide potrebbe essere interpretata semplicemente come: “Faccio un’asserzione falsa” è respinta da Russell perché: [...] non c'è modo di parlare di asserzioni in generale: possiamo parlare di asserzioni di proposizioni, o di asserzioni contenenti una, due, tre, ... variabili apparenti, ma non di asserzioni in generale. Se vogliamo dire ciò che è equivalente a “Faccio un’asserzione
falsa contenente n variabili apparenti” dobbiamo dire qualcosa come: “C°è una funzione proposizionale @(x}, x, ..., Xn) tale che affermo [/ assert] che @(x}, x, ..., Xn) è vera per qualsiasi valore di x}, x, ..., x, € questo è falso”. Quest’asserzione contiene n + 1 variabili apparenti, ovverosia x, x, ..., Xx € @. Dunque non si applica a se stessa.?°*
Ciò che Russell intende è che, a rigore, possiamo parlare solo della verità o falsità di proposizioni, non di enunciati. Possiamo, certo, estendere il significato delle parole “vero” e “falso” a coprire il caso di ciò che è asserito da un enunciato contenente variabili vincolate, ma come semplice modo di dire, che deve comunque essere riportato, passo dopo passo, al caso della verità o falsità di proposizioni. Si viene così a creare una gerarchia di predicati di verità. Cerchiamo di illustrare il punto. Nel caso di un enunciato contenente una sola variabile apparente, della forma “(x) @(x)” asserirne la verità; sarà asserire la veritày di ciascuna proposizione espressa da un enunciato della forma “@(x)”. Nel caso di un enunciato contenente solo due variabili apparenti, della forma “@(Y)(@(x, y))”, asserirne la verità, significa asserire la verità, di tutti gli enunciati della forma “(y)(@(x, y))”, per un x fissato qualsiasi, ciascuno dei quali, a sua volta, sarà veroy se e solo se è vera ogni proposizione espressa da un enunciato della forma “@(x, y)”. E così via. Se dunque vogliamo dire che un enunciato contenente variabili vincolate è vero, non possiamo esimerci — sostiene Russell — dall’indicare la forma comune a tutte le proposizioni che sono dichiarate vere da quell’enunciato; ma, quando lo facciamo, dicendo che esiste una funzione proposizionale @(x;, X2, ---, Xn) che è vera per tutte (o alcune) le determinazioni delle sue variabili, non usiamo un enunciato che contiene ancora n variabili vincolate, ma un enunciato che ne contiene n + 1: ciOÈ x, x2, ..., x © @. Per asserire la ve-
rità o la falsità di quest’ultimo enunciato dovremo — secondo Russell — asserire l’esistenza di una funzione proposizionale contenente n + 1 variabili e dire che essa è vera per certe determinazioni delle variabili: l’ enunciato con cui faremo ciò conterrà n + 2 variabili vincolate, e così via. In sintesi — secondo la tesi qui sostenuta da Russell — il senso delle parole “vero” e ‘falso”, varia secondo il numero di variabili quantificate presenti nell’enunciato che si asserisce.°* AI posto dell’unico predicato “vero”, abbiamo quindi una gerarchia di predicati diversi “veroy”, vero”, “vero”, ecc. che si applicano, rispettivamente, a tutte le proposizioni (0, se si vuole, a tutti
gli enunciati esprimenti singole proposizioni, cioè privi di variabili apparenti), a tutti gli enunciati con una sola variabile apparente, a tutti gli enunciati con due variabili apparenti, e così via. Lo stesso accade per la parola “falso”. Il paradosso di Epimenide è dunque risolto, nell’ambito della teoria qui descritta, attraverso due idee: 22! Nell’articolo pubblicato in francese sono qui interpolati quattro enunciati assenti dal manoscritto inglese.
222 Russell [1906d], $ III, p. 207. 223 Russell [1906d], $ III, pp. 207-208. 224 V_ Russell [1906d], $ III, p. 208.
604
capitolo 8
(1) Non esistono singole entità che costituiscano il riferimento degli enunciati contenenti variabili vincolate. (2) La parola “vero” — così come la parola “falso” — ha significati diversi secondoché si applichi a enunciati esprimenti singole proposizioni o a enunciati contenenti variabili vincolate. Si ha, inoltre, una gerarchia di predicati di verità, per cui ogni asserzione della forma: “L’asserzione p è vera,” può essere vera,+10 falsan+ 1, ma non può essere, a sua volta, vera, o falsa,.
Secondo questa teoria, si ha dunque una gerarchia di asserzioni (enunciati) che si sovrappone alla gerarchia delle matrici. Otteniamo così quella che possiamo chiamare, seguendo Hylton ([1980], p. 25) e Landini ([1987], $ 4),
una teoria sostituzionale ramificata, in contrapposizione alla precedente teoria sostituzionale semplice, la quale non prevedeva nessuna gerarchia di enunciati. Come vedremo, in “Mathematical logic as based on the theory of types” (1907), Russell sosterrà una seconda versione di teoria sostituzionale ramificata: per evitare confusioni,
chiameremo quella sostenuta in “Les paradoxes de la logique” prima teoria sostituzionale ramificata. Nella prima teoria sostituzionale ramificata, la gerarchia delle matrici e la gerarchia degli enunciati sono simmetriche: non sono gerarchie di entità di diversi tipi logici, ma sono entrambe gerarchie di simboli: così come le matrici sono solo simboli, e non nomi di entità, le asserzioni (enunciati) che contengono variabili vincolate sono solo simboli e non denotano singole proposizioni. Russell rileva ora l’analogia tra la proposta soluzione del paradosso di Epimenide e quelle che suggerisce per gli altri paradossi oggi detti “semantici”.?°° Riguardo al paradosso di Richard, Russell osserva che “definibile” si comporta come “vero” o “falso”: non esiste cioè un unico predicato “definibile” ma una gerarchia “definibile”, “definibile;”?, “definibile”, e così via, secondoché nella definizione figurino 0, 1, 2, ecc. variabili vincolate. Data la collezione E, di tutti i numeri definibili, — con un numero finito di parole — attraverso definizioni contenenti
n variabili vincolate, sarà sì possibile definire un nuovo numero con un numero finito di parole, ma per fare ciò sarà necessario descrivere l’insieme E,, dicendo che ad esso appartiene qualsiasi definizione con n variabili vincolate, e con ciò la definizione del nuovo numero —
secondo Russell — dovrà contenere almeno n + 1 variabili vin-
colate, e il numero non sarà definibile,, ma definibile, . Russell conclude dicendo che non esiste una totalità E di
tutti inumeri definibili con un numero finito di parole «non soltanto nel senso in cui tutte le classi devono essere non-entità [nonentities], ma nel senso che non c’è una proprietà comune e peculiare ai membri di E».??° Le stesse considerazioni devono essere applicate, sostiene Russell, al paradosso di K6nig — dove “Il più piccolo numero ordinale indefinibile” sembra definito proprio attraverso l’espressione che dice che esso è indefinibile — e alla parola “nominabile” usata nel paradosso di Berry — dove “Il più piccolo intero non nominabile in meno di ventisei sillabe” sembra nominato in ventiquattro sillabe proprio dall’espressione che dice che esso non è nominabile in meno di ventisei sillabe.” Si deve però rilevare che la prima teoria sostituzionale ramificata non è, come la presenta Russell in “Les paradoxes de la logique”, solo un modo di neutralizzare il paradosso di Epimenide. Essa blocca anche i paradossi collegati con l’argomento di Cantor.??* Ricordiamo che una formulazione del paradosso di Cantor sorgeva, nella teo225 V. Russell [1906d], $ III, p. 209. 226 Russell [1906d], $ III, pp. 209-210. 227 V. Russell [1906d], $ III, p. 210. 228 C’è qui una divergenza di interpretazione tra Landini e altri studiosi come Graham Stevens (v. Stevens [2003b]) e Jolen Galaugher (v. Galaugher [2013b]) Landini ritiene che, all’epoca, Russell separasse nettamente i cosiddetti paradossi “semantici” da quelli “logici” (v., per es., Landini [2004a] e [2004b], $ 2), e che sviluppasse la teoria di “Les paradoxes de la logique” non per evitare il paradosso di Epimenide — un paradosso che, secondo Landini (v. per es., [1998a], $ 4.5, pp. 125-126, e $ 8.1, p. 201), non può essere formulato nella teoria
sostituzionale senza aggiungere ad essa un predicato semantico (per es. “asserire’’), e dunque un paradosso semantico —, ma solo per evitare il paradosso p/a, — un paradosso logico, caratteristico della teoria sostituzionale. Secondo Landini, Russell avrebbe menzionato solo il paradosso del mentitore, in “Les paradoxes de la logique”, solo per ragioni di semplicità (v., per es., Landini [2004b], $ 2, p. 377). Stevens ([2003b], pp. 175-176) e Galaugher ([2013b], pp. 15-17, 19 e 28), invece, ritengono che Russell non operasse una distinzione netta tra paradossi logici e semantici, e avesse anzi rilevato un’analogia strutturale tra i paradossi proposizionali che sorgono nella teoria sostituzionale, e il paradosso del mentitore (formulato nella stessa teoria sostituzionale), cercando quindi una teoria che rilevasse la fallacia comune a tutti questi paradossi. Nella sua recensione a Landini [1998a], Stevens ([2003b], pp. 173-175) obietta a Landini che solo una certa forma
del paradosso del mentitore — che Stevens, come Landini, chiama (paradosso del) “mentitore proposizionale” (“Sto mentendo”, o “Questa proposizione è falsa”) — si rivela non formulabile nella teoria sostituzionale, ma ce n’è una forma — che Stevens chiama (paradosso di) ‘“Epimenide” o “del mentitore Cretese” (“Tutti i Cretesi sono bugiardi” detto da Epimenide il Cretese) — che è formulabile nella teoria so-
stituzionale, e che manifesta un’evidente analogia di struttura con la versione sostituzionale del paradosso delle proposizioni dell’appendice B dei Principles (v. Stevens, [2003b], p. 175). In effetti, laddove la versione sostituzionale del paradosso delle proposizioni dell’ appendice B dei Principles sorge dalla proposizione:
Le teorie dello zigzag, della limitazione di grandezza, e senza classi
605
ria sostituzionale semplice, assumendo che ogni sottoclasse della classe degli individui fosse rappresentata da una
matrice della forma “p/a” dove p e a sono
individui.’
La prima teoria sostituzionale
ramificata
blocca
quest’ultima assunzione. Questo si vede forse più chiaramente considerando la seguente derivazione del parados-
so di Cantor nella teoria sostituzionale semplice, proposta da Landini in un articolo del 1987: Replicando l’argomento diagonale di Cantor, sia 9/{b, (p/a)} una matrice che definisce una funzione uno-uno f dalla classe degli
individui alla classe delle sottoclassi d’individui definite da una coppia d’individui ‘p/a’. Possiamo allora definire diagonalmente la classe degli individui r/x, che deve riprodurre quella di Cantor {x : x € f(x)}, per mezzo della matrice, (4p’)(4a”) [9A{b, (p/a)}'x, p', a' A —p/a"x}/x. [Questa matrice definisce la classe degli individui che non appartengono alla classe cui sono correlati dalla funzione 9/{b, (p/a)}.] Ora è chiaro che la classe determinata dalla matrice r/x è nel codominio della funzione 9/{b, (p/a)} solo se la matrice r/x è formata per mezzo di una coppia d’individui, r e x. Ma se la classe r/x è nel codominio di 9/{b, (p/a)}, allora
(3y) {4/{b, (p/a)}'y, r,x A (W)(4Ab, (p/a)}'w, r,x=w=y)}. [In parole: “Esiste uno e un solo y che è nella relazione 9{b, (p/a)} con r/??.] Quindi r/x'y se e solo se —r/x'y, e otteniamo una contraddizione.??°
Come osserva Landini, tuttavia, se si ammette che gli enunciati che contengono variabili vincolate non denotino proposizioni, allora, nella matrice “7/x° sopra definita, “°° non rappresenta una vera proposizione, poiché sta al posto di un enunciato contenente variabili vincolate; in altre parole, nella matrice “7/x° non è affatto menzionata
una coppia di individui. Pertanto, (il surrogato sostituzionale del)la classe r/x non è nel codominio della funzione g/{b, (p/a)} e il paradosso è bloccato. Con lo stesso meccanismo sono bloccati anche il paradosso delle proposizioni e il paradosso py/@ (v. sopra, $ 4.1.3) — che erano derivabili nella teoria sostituzionale semplice e che, lo ricordiamo, non sono paradossi semantici, perché riguardano entità della teoria senza coinvolgere nessuna nozione semantica, come “verità”, “designazione”, “definizione”. Se, infatti, le proposizioni generali non sono considerate entità, all’interno della seguente definizione: tei
(13
p*/a* =y {Ga)@Ep)(a*= (2) (plaix > x) A -(pla'a*))}/a*, che dava origine al paradosso delle proposizioni, “a*= (x)(p/a'x 2 x)” non è più una formula ben formata, perché “() (p/a'x > x)” non denota un’entità. Per lo stesso motivo, anche la definizione
p*= Ga) (Ap)(a*= (x) (p/a'x > x) A -(p/a'a*)), che afferma che c’è una classe p/a, tale che la proposizione a*, che asserisce la verità di tutte le proposizioni appartenenti a p/a, non appartiene a p/a (che conduce al surrogato sostituzionale di classe p*/a*= {(2a)(Ap)(a*= (x) (p/a'x > x) A —(p/a'a*))}/a*, cioè la classe di tutte
le proposizioni che asseriscono la verità di tutte le proposizioni appartenenti a una classe p/a, cui non appartengono), il paradosso di Epimenide sorge dalla proposizione seguente, che ha evidentemente una struttura simile a quella di p*:
pî = Ba) (Ap) (af = (2) (pla'x > -x) A pla'a' ), che afferma che c’è una classe p/a (intuitivamente, la classe di tutte le proposizioni asserite da Cretesi), tale che la proposizione a” (intuitivamente, quella asserita da Epimenide), che asserisce la falsità di tutte le proposizioni appartenenti a p/a, appartiene a p/a (perché Epimenide è egli stesso Cretese). Da p”, e dalla premessa possibile “(x) ((p/a'x A x # a°) > —x))”, che tutte le proposizioni appartenenti a p/a diverse da a’ (intuitivamente, tutte le proposizioni asserite da Cretesi diverse dalla proposizione a” asserita da Epimenide) siano false, si ricava la contraddizione “a” x — a”. In effetti, nel manoscritto “On substitution” (v. Russell [1906f]) Russell rileva che il paradosso del mentitore può essere «posto in una
forma puramente logica» (Russell [1906f], p. 159), e ne fornisce una formulazione simbolica nel linguaggio sostituzionale (v. ibid.), che ne mostra l’affinità di struttura con la versione sostituzionale del paradosso delle proposizioni dell’appendice B dei Principles (v., in proposito, Galaugher [2013b], pp. 16-17). La posizione di Stevens e Galaugher, in proposito, appare più convincente di quella di Landini. Alle considerazioni già svolte, si aggiunga che, come osserva Stevens ([2003b], p. 175), in My Philosophical Development, Russell «sembra riconoscere esplicitamente che non aveva visto la distinzione [tra paradossi logici e semantici] che vide poi Ramsey», scrivendo: «C'erano paradossi più antichi, alcuni dei quali noti ai Greci, che sollevavano ciò che mi parevano problemi simili, anche se scrittori a me successivi li considerarono di un genere diverso. Il più noto di questi era quello su Epimenide, il Cretese, che disse che tutti i Cretesi erano bugiardi» (Russell [1959], p. 77; riportato in Stevens [2003b], p. 172].
Si consideri anche che non solo in “Les paradoxes de la logique”, ma anche nella sua corrispondenza privata (v. per es., la lettera di Rus-
sellaJourdain del 14 giugno del 1906, in Grattan-Guinness [1977], p. 89) Russell indica come ragione della revisione della prima teoria sostituzionale il paradosso del mentitore. 201 sopra, $ 4.1.3.
230 Landini [1987], pp. 185-186.
capitolo 8
606
tia )PYVa*x5%) è illegittima, perché non esiste un’entità denotata da “(x)(p*a*x > x)”. Il paradosso p;/a, è bloccato dallo stesso meccanismo: la definizione
Po sa Fa) (Ap)(ay= p/a'b!q n -(pla' a), è illegittima, perché (4a) (Ap) (a, = p/a'b! q A -(p/a'a.;)) non è un’entità.
4.3.2. LA PRIMA VERSIONE DELL’ASSIOMA DI RIDUCIBILITÀ Fin qui tutto bene, sembra. Ma la teoria sostituzionale ramificata presenta un inconveniente, che sarà comune
anche alla teoria sostituzionale del 1907 e a quella ramificata dei tipi dei Principia: insieme con i paradossi, blocca anche la desiderata derivazione dell’aritmetica dalla logica. Consideriamo, per esempio, il principio di induzione matematica. Se si tengono presenti le definizioni russelliane dei numeri cardinali come classi di classi, la trascrizione simbolica completa del principio d’induzione nel linguaggio della teoria sostituzionale diviene, per la verità, complessa in modo scoraggiante.”?! Ma per comprendere il punto che c’interessa è sufficiente trascrivere il principio d’induzione considerando, provvisoriamente, i numeri naturali come individui: questo modo di procedere è lo stesso che adotta Russell in “Les paradoxes de la logique” per spiegare la medesima questione.” Nella versione così semplificata, il principio di induzione si scriverebbe come segue:
(1)
M(ap40 1) (pa'y> pla 4+1)) > (©) (a è un numero cardinale finito/a’x D P/@'x)),
cioè: “Per ogni p e per ogni a, se 0 appartiene alla classe p/a e, per ogni y, y+ 1 appartiene alla classe p/a ammesso che vi appartenga y, allora ogni x che sia un numero finito appartiene alla classe p/a”. Un primo problema — che Russell non rileva — è che in (1) abbiamo un enunciato generale che segue il segno d’implicazione. Come avevamo visto nel $ 4.1.1, nella teoria sostituzionale i connettivi sono segni che devono essere fiancheggiati da nomi di proposizioni. Simboli come “2”, “A”, ecc., indicano, per il Russell pre-Principia, delle relazioni tra entità. Ma, nella prima teoria sostituzionale ramificata gli enunciati con quantificatori non corrispondono a entità. Quindi, così come sta, (1) diviene privo di significato. Questo problema si può risolvere, secondo un suggerimento di Landini,” fornendo opportune definizioni contestuali che trasformino le implicazioni tra enunciati con quantificatori in enunciati con quantificatori in forma prenessa (cioè con quantificatori aventi come ambito solo l’intera formula). Per esempio, si può porre:
B> MA =s 1) (B > A), dove “A” e “B” sono lettere schematiche che stanno al posto di formule, e non vi sono occorrenze libere di “x” nella formula rappresentata da “8”. Con tale definizione, la formula (1) può essere trasformata in:
(2)
Pd
(p/a0 1) p/a y > pla’ (y+1)) > (a è un numero cardinale finito/a'x > p/a'x)),
dove non compare nessun enunciato contenente quantificatori dopo il segno d’implicazione. Ma rimane una difficoltà insormontabile — che Russell rileva. A proposito della formula (1), egli osserva che, con la nuova teoria delle proposizioni, la variabile “p’ può essere sostituita solo da formule prive di variabili vincolate. Questo comporta che «le proprietà interessate nell’enunciazione dell’induzione devono essere solo quelle che possono essere enunciate senza usare parole come ogni, tutto, qualche, il».?3* Ma ciò è intollerabile:
23! Una formulazione esplicita, proposta in Landini [1987], p. 181, presenta alcuni errori, senza dubbio tipografici.
232 V. Russell [1906d], $ III, pp. 210-211. 233 V. Landini [1998a], $ 8.3, p. 215. 234 Russell [1906d], $ III p. 211.
Le teorie dello zigzag, della limitazione di grandezza, e senza classi
607
Ma se questa restrizione non è attenuata [mitigated] da un assioma, renderà fallace la maggior parte degli usi usuali dell’induzione; e inoltre distruggerà molte porzioni dell’usuale ragionamento matematico. Prendiamo una proposizione come: “Se m e n sono numeri finiti, o m n”. Se consideriamo questa una proprietà di m, n sarà una variabile apparente; così l’induzione non autorizza la conclusione che questo vale per tutti i numeri finiti dal fatto che vale per 0, e che, se vale per m, vale per m + 1.°°°
L'assioma blema non è così, in “Les tutti i valori
attenuativo attraverso il quale Russell, in “Les paradoxes de la logique”, propone di risolvere il proaltro che la prima versione pubblicata”? del suo celebre assioma di riducibilità (non ancora chiamato paradoxes de la logique”’): «ogni asserzione contenente x e una variabile apparente è equivalente, per di x, a qualche asserzione @x che non contiene variabili apparenti».’” “Equivalente”, naturalmente,
non significa “identica”: nei contesti estensionali, come quelli matematici, l’assioma giustifica la sostituzione di
asserzioni che contengono variabili vincolate con asserzioni che non ne contengono; nei contesti non estensionali, invece, l’assioma non giustifica la stessa sostituzione; pertanto, l'assioma non annulla la soluzione che la gerarchia delle asserzioni aveva offerto ad alcuni paradossi. In “Les paradoxes de la logique”, Russell scrive: Nella maggior parte delle asserzioni che vogliamo fare in matematica, se una proposizione p compare [occurs] altrimenti che in una matrice, può essere sostituita da un’altra proposizione equivalente qualsiasi, [...] senza alterare la verità o la falsità della nostra asserzione. E se compare [occurs] una funzione @x, dove l’argomento x è una variabile apparente, @ può essere usualmente sostituita da qualsiasi altra funzione w avente la medesima estensione, ossia vera per gli stessi valori di x. E lo stesso vale per una matrice p/a. Ma nel caso dell’ Epimenide, questo non vale. Sono rilevanti le effettive asserzioni da lui fatte e non serve sostituire asserzioni equivalenti non contenenti lo stesso numero di variabili apparenti. Quindi il nostro assunto che un’asserzione contenente x e una variabile apparente ha sempre la stessa estensione di qualche asserzione contenente x e nessuna variabile apparente non ci consente di sostituirle luna all’altra nell’ Epimenide, ma ci consente di fare questa sostituzione in tutti i casi ordinari.?**
La frase con cui si apre questo brano sembra aver fuorviato Cocchiarella ([1980], pp. 94-95). Russell osserva che,
in un contesto estensionale: «se una proposizione p compare altrimenti che in una matrice [corsivo mio], può essere sostituita da un’altra proposizione equivalente qualsiasi [...]».?? Russell pone questa limitazione poiché l’equivalenza delle proposizioni p e p' non comporta affatto che p/a'x equivalga a p/a'x (per esempio, p potrebbe avere a tra i suoi costituenti e p' no). Ma, con tale limitazione — afferma Cocchiarella —: [...] non è chiaro come Russell possa portare a termine il suo programma di rappresentare i numeri come classi di classi di entità — cioè attraverso matrici del secondo tipo, nel modo in cui, per es. 0 è rappresentato da “(x)-(p/a'»/p, a)'(p', a)" — DAS
olo
af
SS
ts
7
5
R
"
5
È
dino
che sono esse RR
DA
stesse membri di classi di classi di classi di entità, nel modo in cui 0 è un membro della classe dei numeri cardinali induttivi.?!°
Il motivo è che — secondo Cocchiarella — tale rappresentazione richiede l’intercambiabilità di asserzioni equivalenti all’interno di una stessa matrice. Landini ([1987], p. 183), obietta però che l’assioma di riducibilità che sembra avere in mente Russell non ri-
chiede l’intercambiabilità di asserzioni equivalenti all’interno di una matrice. Landini richiama l’attenzione sul fatto che, nell’ultimo brano di “Les paradoxes de la logique” che abbiamo riportato, dopo aver detto che due proposizioni equivalenti possono essere sostituite l'una all’altra al di fuori di una matrice, Russell continua: E se compare una funzione @x, dove l’argomento x è una variabile apparente, @ può essere usualmente sostituita da qualsiasi altra funzione w avente la medesima estensione, ossia vera per gli stessi valori di x. E lo stesso vale per una matrice p/a.
Secondo Landini, con “E lo stesso vale per una matrice p/a” Russell intende:
235 Russell [1906d], $ III, p. 211-212. 256 Già nel manoscritto del 1904 “On functions, classes and relations”, dopo aver introdotto il principio del circolo vizioso, secondo cui (@)(f(@î)x non può essere uno dei valori di gx, Russell ammette che, in alcuni casi (tra i quali si può supporre che egli intendesse far rientrare tutti i casi in cui si rendono necessarie, in matematica, funzioni proposizionali definite quantificando su funzioni proposizionali), una funzione di forma “(@(f(@2))x” sia riducibile [reducible], ossia che esista una funzione della forma “x” estensionalmente equivalente
ad essa (v. Russell [1904c], $ IV, p. 89). Che Russell impiegasse la nozione di riducibilità prima di adottare la teoria dei tipi, e in connessione con l’adozione del principio del circolo vizioso, è rilevato in Wahl [1993], p. 84.
237 Russell [1906d], $ III, p. 212. 238 Russell [1906d], $ III, pp. 212-213. 239 Si noti — incidentalmente — l’uso di “proposizione”, da parte di Russell, per indicare degli enunciati che esprimono proposizioni (in senso extralinguistico). Una proposizione, in senso extralinguistico, non può infatti comparire in una matrice (che è solo un simbolo).
240 Cocchiarella [1980], p. 95.
capitolo 8
608
[...] non lo scambio di una proposizione g che sia equivalente, per esempio, a un’asserzione @ nella matrice @/p, a, ma il rimpiazzamento della matrice @/p, a con un’altra matrice g/r, b che sia coestensiva, [...] e il cui prototipo [Russell chiama “prototipo” la proposizione p designata da “p’ nella matrice “p/a”] sia una proposizione.?*!
Landini quindi ritiene che l’assioma (in realtà un insieme di schemi d’assiomi) che Russell intende proporre nell’articolo in esame sia il seguente:
DEAD) «dove
@ è una
«L'assioma»,
lettera
continua
DOOR) schematica
Landini,
che
ammette
0A) asserzioni
con
«assicura che qualsiasi matrice,
0 variabili
vincolate
come
sostituendi».”*
@/21, ..., z,, di qualsiasi tipo e contenente
un’asserzione come prototipo è coestensiva con qualche matrice il cui prototipo è una proposizione». Nei casi più semplici, avremmo dunque:
(36) (Ab) (2) (Y/b'x = p/a'x), dove @ è un qualsiasi enunciato, anche con quantificatori, in cui le variabili ‘“?° e “b” non sono libere, e:
(dd) (Ar) (Ab) (MY) Ur, b)'(x, y) = PAP, Ax, Y)), dove @ è un qualsiasi enunciato, anche con quantificatori, in cui le variabili “?°, “7° e “5” non sono libere.” L’ultimo schema d’assiomi assicura, per esempio, che la matrice “(x)-(p/a'x)/p, a)” (che, come sappiamo, defini-
sce il numero 0 delle entità) sia coestensiva con un’altra matrice ‘“/(r, b)” il cui prototipo f è una proposizione. Ritengo che quella di Landini sia la corretta interpretazione delle tesi avanzate da Russell nell’articolo “Les paradoxes de la logique”, sia perché ne stabilisce la coerenza, sia perché fa questo rendendo conto dell’ultimo passo di Russell che abbiamo riportato, altrimenti destinato a rimanere misterioso. Tramite quello che Russell chiama “assioma” (in realtà schemi d’assiomi) di riducibilità, sono ripristinati nella prima teoria sostituzionale ramificata quegli usi dell’induzione matematica che altrimenti sarebbero perduti a causa della gerarchia di enunciati. Questo però non risolve il problema della plausibilità degli schemi d’assiomi di riducibilità come principi logici. È vero che, come nota Russell, la loro validità può essere verificata in alcuni casi
particolari. Per esempio: [...] per quanto loquace [Epimenide] possa essere stato, egli può aver affermato [affirmed] solo un numero finito di proposizioni non contenenti alcuna variabile apparente. Se le neghiamo a una a una, otteniamo un’asserzione [statement] che non contiene variabili apparenti ed è equivalente all’asserzione [statement] che tutti i suoi asserti [assertions] di questa forma sono menzogne.?*
Ma questo — Russell lo riconosce — non costituisce una prova che la riducibilità sia valida sempre. Russell nell’articolo in esame, non fornisce una discussione dell’‘“assioma” di riducibilità, limitandosi ad affermare che,
contro di esso, «per quanto ne so, non esistono obiezioni serie». Ma egli non fu ne mai soddisfatto. Già nel manoscritto “The paradox of the liar° — del settembre 1906 (con correzioni del 1907), e quindi scritto nello stesso mese in cui fu pubblicato “Les paradoxes de la logique” — Russell dichiara: «Un tale assioma è, tuttavia, assai indesiderabile [highly undesirable], ed è molto auspicabile che si possa trovare qualche modo di evitarlo».?9 Il problema, per il logicista, è che gli assiomi di riducibilità non sembrano potersi qualificare come assiomi /ogici. Ma questa difficoltà, sulla quale torneremo nei prossimi capitoli, è secondaria, all’interno della prima teoria sostituzionale ramificata. La difficoltà principale è che l’aggiunta degli schemi d’assiomi di riducibilità alla prima
24! 1 andini [1987], p. 183.
24 Ibid.
24 V. anche Landini [1998a], $ 8.7, p. 230, e Landini [2004b], p. 393. 24 Russell [1906d], $ III, p. 212. 245 Russell [1906d], $ III, p. 211. 24 V. Russell [1906g], p. 329. Una descrizione di questo manoscritto, pubblicato per la prima volta in Russell [2014], pp. 320-368, si trova in Rodrfguez-Consuegra [1989a], $ 6, pp. 148-153 (l’espressione «highly undesirable», riferita all’assioma di riducibilità, è già ri-
portata (dal f. 25 del ms.) a p. 149 di quest'articolo).
Le teorie dello zigzag, della limitazione di grandezza, e senza classi
609
teoria sostituzionale ramificata ha l’effetto di ripristinare il conflitto con il teorema di Cantor che aveva già dimostrato contraddittoria la teoria sostituzionale semplice. Come nota Landini, ciò accade perché [...] l'introduzione dell’assioma di riducibilità annulla l’effetto della distinzione tra proposizioni e asserzioni nei contesti estensionali. L'assioma di riducibilità di Russell provvede al rimpiazzamento delle matrici i cui prototipi contengono asserzioni con matrici coestensive (e “predicative”) i cui prototipi sono proposizioni.”
Il paradosso delle proposizioni continua ad essere bloccato, nella prima teoria sostituzionale ramificata, anche con l’aggiunta degli schemi d’assiomi di riducibilità, per lo stesso motivo per cui rimane bloccato il paradosso di Epimenide. Infatti, nella definizione che dava origine al paradosso delle proposizioni nella teoria sostituzionale semplice:
p*/a*=x {Ga)Ep)(a*= (0) (p/a'x > x) A-(pla'a*))}/a*, l’uguaglianza “a*= (x)(p/a'x > x)” rappresenta un contesto intensionale, e gli assiomi di riducibilità non annullaROSE 21 : x È 5 Egne 7 $ C = 5 248 no la distinzione tra proposizioni e asserzioni nei contesti intensionali. Ma non è così con il paradosso py/do. Sebbene, infatti, non si possa assumere direttamente:
Po =ar (da) (Ap)(a, = p/a'b!q A -(p/a'a;)), perché l’enunciato “(4a)(Ap)(a= p/a'b!q A —(p/a'a;))”?, contenendo un'entità, la formula
(1)
variabili quantificate,
non
si riferisce a
@MP/ax= (da) (Ap)(x = (pla'b!q) A —(p/a'x)))
è un’istanza dello schema d’assiomi di riducibilità seguente:
Ad)
(/wx= p/v'x), 29 &
(dove @ è un enunciato non contenente “?° o “wu? libere, e ‘“v” è una costante) con
0 = (da)(Ap)(v= (p/a'b!q) A -p/a'v)); ma ora, istanziando “x”, in (1) con “(p/a b!q) — che, si osservi, è legittimo, perché “(p/a b!qg)”, non contenendo variabili vincolate, si riferisce a un’autentica entità della prima teoria sostituzionale ramificata —, si ottiene:
(2) p/a (p/ab!q)=(da)Ap)((p/ab!q)= (p/la'b!q) A -(p/a'(p/ab!q)), che riporta direttamente alla contraddizione (v. sopra, $ 4.1.3).
La prima teoria sostituzionale ramificata o è troppo debole per derivare l’aritmetica 0, con l’aggiunta degli schemi di riducibilità, si rivela di nuovo inconsistente.
4.4.
L'ABBANDONO DELLA TEORIA SOSTITUZIONALE
4.4.1. Nel 1909, all’epoca della fine della redazione dei Principia Mathematica, Russell aveva sicuramente abbandonato la teoria sostituzionale. Sui motivi e sul momento di quest’abbandono si trovano, in letteratura, varie
ipotesi. Passiamole in rassegna.
247 Landini [1987], p. 187. 248 V. Landini [1993], p. 374, e [1998a], $ 8.9, pp. 232-233.
610
capitolo 8
4.4.2. Douglas P. Lackey ([1976], $ 4) ritiene «impossibile stabilire precisamente perché Russell abbandonò la teoria sostituzionale a favore di quella che compare nei Principia», ma considera una ragione possibile la ferma opposizione di Alfred North Whitehead — che all’epoca collaborava con Russell alla stesura di un progettato secondo volume dei Principles of Mathematics il quale si sarebbe trasformato, strada facendo, nei Principia Mathematica. Lackey menziona una lettera a Russell del 21 febbraio del 1906 in cui Whitehead protesta contro il complicato formalismo della teoria sostituzionale, esortando Russell a cambiare idea, e un’altra lettera, del giorno succes-
sivo, in cui Whitehead obietta che la teoria sostituzionale «fonda l’intera matematica su un artificio tipografico e contraddice così le principali dottrine del Vol. I».°*° Lackey osserva che non c’è nulla nell’Introduzione della versione pubblicata dei Principia che contraddica la teoria sostituzionale, e ipotizza che la “principale dottrina” cui si riferisce Whitehead fosse «l’idea che il reale scopo dei Principia sia di sistematizzare il ragionamento effettivo [actual] dei matematici»,”°° non quello di criticarlo;” una posizione di cui Lackey trova conferma in una precedente lettera di Whitehead a Russell, del 30 aprile 1905, «che sembra riferirsi a un altro dei periodici tentativi di Russell di fare a meno delle classi»,”° in cui si legge: Bisogna temperare quest’estremo rigore con considerazioni pratiche. Le classi possono essere accettate nel loro impiego comune considerando che il nostro scopo è di dare una sistemazione del ragionamento matematico effettivo, e questo ragionamento effettivo in realtà usa le classi anche se non ne avrebbe bisogno. Così il nostro obiettivo [nei Principia Mathematica] è di dare una sistemazione del ragionamento riguardante le classi, sebbene questa sia un’idea primitiva che si potrebbe benissimo evitare. ci
Ritengo tuttavia che con «le principali dottrine del Vol. I» Whitehead non intendesse riferirsi alle dottrine fondamentali esposte nel primo volume dei Principia, ma a quelle dei Principles, che all’inizio del 1906 erano ancora considerati il primo volume dell’opera cui egli stava collaborando con Russell. L’obiezione di Whitehead potrebbe forse essere interpretata come un’obiezione generale a un orientamento nominalista ravvisato nella teoria sostituzionale, considerato in contraddizione con l’impianto platonista dei Principles. Se è così, Whitehead aveva torto: la teoria sostituzionale non contraddice in nulla le dottrine fondamentali dei Principles, né si tratta di una teo-
ria nominalista: nella teoria sostituzionale, solo le classi e le funzioni proposizionali — che sono considerate problematiche già nei Principles — sono interpretate nominalisticamente; ma proposizioni e universali sono entità nella teoria sostituzionale quanto nei Principles. Un'altra possibile ragione suggerita da Lackey per l’abbandono della teoria è la complicazione del simbolismo che essa comporta: Se si considera l’enorme estensione dei Principia con il loro simbolismo relativamente semplice, può essere che le difficoltà nota. . . . . . . . . 302 zionali del sistema sostituzionale si dimostrassero schiaccianti.?°*
Queste motivazioni addotte da Lackey per spiegare l’abbandono della teoria sostituzionale non convincono. Data l’importanza e la difficoltà filosofica dell’argomento, è impossibile credere che Russell avrebbe abbandonato una teoria che riteneva capace di risolvere tutti i problemi fondazionali che l’avevano assillato fin dal 1901 — consentendo anche un’economia ontologica — solo per il suo aspetto inusuale o per le complicazioni derivanti da un simbolismo poco maneggevole. Si fosse trattato solo di questo, Russell avrebbe potuto raccogliere il suggerimento di Whitehead di «temperare quest’estremo rigore con considerazioni pratiche», utilizzando un simbolismo usuale per lo sviluppo della matematica e limitandosi a mostrare come questo simbolismo fosse riducibile a quello della teoria sostituzionale, la quale ne avrebbe fornito sia i limiti di significanza sia le implicazioni ontologiche. Russell aveva proprio un’idea simile. Infatti, già in una lettera a Couturat datata 23 ottobre 1905, dopo aver illustrato per la prima volta al suo corrispondente il meccanismo della teoria sostituzionale, Russell commenta: «Questo, ben inteso, è un metodo per i principi: non c’è bisogno di tirarsi dietro tutto ciò attraverso lo sviluppo della matematica». °° Nel 1907, l’idea di Russell era proprio quella di relegare la teoria sostituzionale in un’ Appendice ai Principia. 20 Lackey [1976], p. 77; v. anche Lackey [1972], pp. 15-16, e l’introduzione di Lackey alla parte IV di Russell [1973], p. 131. 25° Lackey [1976], p. 77.
2! 2° 253 254 255 250
V. Lackey [1972], pp. 15, e l’introduzione di Lackey alla parte IV di Russell [1973], p. 131. Lackey [1976], p. 77. Riportato in Lackey [1976], pp. 77-78, e in Lackey [1972], p. 15. Lackey [1976], p. 78. In Russell [2001a], p. 543. V. Russell [1907e], p. 516. In proposito, v. anche Landini [1998a], $ 6.8, p. 175.
Le teorie dello zigzag, della limitazione di grandezza, e senza classi
611
Lackey menziona il fatto che il manoscritto russelliano “The paradox of the liar”, del settembre 1906, «contiene diversi argomenti, favorevoli e contrari, concernenti la teoria sostituzionale», ma aggiunge che «Russell non . . . SRO D sembra considerare nessuno di essi come definitivo». 4.4.3. Ivor Grattan-Guinness ([1974a], pp. 398-401) ipotizza che il rifiuto della teoria sostituzionale sia derivato da un importante mutamento intervenuto nella teoria della verità di Russell. Sappiamo che, nei Principles e negli anni immediatamente successivi, Russell sosteneva una teoria della verità
non corrispondentista — che aveva mutuato fin dal 1898 da George E. Moore — secondo cui esistono, allo stesso titolo, sia proposizioni vere sia proposizioni false, ed esse non sono vere o false in virtù di qualche “corrispondenza”, o mancata “corrispondenza”, con i fatti, ma solo perché le prime hanno una certa qualità primitiva (l’esser vere) di cui mancano le seconde. Questa teoria è ben compendiata in un passo di un articolo, scritto nel 1903, intitolato “Meinong’s theory of complexes and assumptions”: Si può dire — e questa è, io credo, la posizione corretta — che non c’è proprio nessun problema nella verità e nella falsità; che alcune proposizioni sono vere e alcune sono false, proprio come alcune rose sono rosse e alcune sono bianche; che la credenza è un certo atteggiamento [azttitude] nei riguardi delle proposizioni, che si chiama conoscenza quando esse sono vere, errore quando sono false. 258
Come rivelano diversi manoscritti russelliani,”°° dal 1906 Russell cominciò a dubitare dell’esistenza di falsità
oggettive — la designazione degli enunciati falsi — e a cercare di elaborare una teoria corrispondentista della verità. La teoria in gestazione era quella teoria del giudizio come relazione multipla che Russell avrebbe sostenuto, nei suoi scritti destinati alla pubblicazione, a partire dal 1909.?°° Secondo questa teoria, le espressioni che in apparenza si riferiscono a proposizioni sarebbero in realtà simboli incompleti, che acquistano significato solo nel contesto di un giudizio — termine con il quale Russell indica la stessa cosa della credenza.”°' Il giudizio (1a credenza) non consisterebbe in una relazione diadica tra una mente che crede e un'entità detta “proposizione”, ma in una relazione multipla — cioè una relazione n-adica — tra una mente e gli oggetti che, in precedenza, Russell considerava i costituenti della proposizione giudicata. Per esempio, il giudizio che Desdemona ama Cassio sarebbe, in realtà, una relazione poliadica J tra una mente giudicante S, Desdemona, l’ amare e Cassio, cioè avrebbe la forma:
ISSDTARC), dove D, A e C rappresentano, rispettivamente, Desdemona, l’amare e Cassio. Secondo la teoria del giudizio come relazione multipla, un giudizio è vero se e solo se, nella realtà, esiste un complesso formato dagli oggetti del giudizio — cioè da quegli oggetti, di cui almeno uno dev'essere una proprietà o una relazione, che entrano, oltre alla mente giudicante, nella relazione multipla del giudicare — sistemati nella stessa disposizione in cui essi sono relazionati nel giudizio. Così, il giudizio che Desdemona ama Cassio è vero se e solo se esiste, nella realtà, un complesso come l’amore di Desdemona per Cassio — complesso che potremmo denotare con “D-A-C° — altrimenti è falso. Secondo questa teoria, solo i costituenti ultimi delle proposizioni — particolari o universali — sono entità reali, mentre le proposizioni stesse divengono pseudoentità, cioè, non sono più considerate parte dell’arredo ontologico del mondo. La teoria del giudizio come relazione multipla è quindi incompatibile con la teoria sostituzionale, la quale richiede che le proposizioni siano entità che possano essere assunte come valori delle variabili quantificate. Secondo Grattan-Guinness questo cambiamento di prospettiva sulla natura della verità e delle proposizioni sarebbe stato all’origine dell’abbandono della teoria sostituzionale, all’inizio del 1907.
4.4.4. In contrasto con Grattan-Guinness, Peter HyIton ([1980]) sostiene che l'abbandono della teoria sostituzio-
nale non sia stato dovuto alla reiezione delle proposizioni come entità. HyIton rileva ([1980], p. 23) che, mentre Russell non lavora più con la teoria sostituzionale dopo la fine del 1906, egli, ancora nella prima metà del 1907, si dichiara incerto riguardo all’esistenza delle proposizioni — che rifiuterà solo nel 1909. La tesi di HyIton è che:
7 Lackey [1976], p. 78. 258 Russell [1904a], $ III, p. 75. 22m proposito, v. anche Grattan-Guinness [1977], pp. 91-94, e Rodrîguez-Consuegra [2005], $ 6.
260 Per un’esposizione più accurata di questa teoria, v. sotto, cap. 10, $ 1. 2A, V., per es., Russell [1913a], parte II, cap. 4, p. 136.
612
capitolo 8
L’abbandono da parte di Russell della teoria sostituzionale dev’essere spiegato non in termini di un Sono tra questa teoria e altre parti della sua filosofia, ma piuttosto in termini che siano interni alla teoria e alle sue ragioni per adottarla.
Hylton afferma che, per far fronte ai paradossi semantici, Russell dovette modificare la teoria esposta On the substitutional theory of classes and relations” con quella propugnata in “Les paradoxes de la logique”. * Secondo Hylton, in quest’ultimo articolo, Russell propone di evitare i paradossi semantici [...] distinguendo tipi di proposizioni. La distinzione è effettuata secondo il numero di variabili vincolate che esse contengono. Le proposizioni del livello più basso non contengono variabili vincolate. Quindi abbiamo proposizioni contenenti una variabile che va-
ria sugli individui, proposizioni contenenti due variabili che variano sugli individui, e così via. Le proposizioni che contengono variabili che variano sulle proposizioni formano un ordine distinto e più alto, il cui livello più basso consiste di proposizioni contenenti una variabile che varia sulle proposizioni contenenti una variabile che varia sugli individui (le proposizioni che non contengono variabili sembrano essere contate tra gli individui), e così via. Tutto ciò che possiamo dire di una proposizione di un tipo non può essere detto in modo sensato di una proposizione di qualsiasi altro tipo: parole come “vero” che appaiono violare questo requisito sono considerate ambigue. [...] Questa versione della teoria sostituzionale (teoria sostituzionale ramificata, come la chiamerò) non
ci permette di quantificare su tutte le proposizioni, ma solo su tutte le proposizioni di un tipo dato.294
Quest’interpretazione della prima teoria sostituzionale ramificata non è tuttavia corretta: si tratta, semmai, di un resoconto (solo parzialmente corretto) della teoria che Russell difende in “Mathematical logic as based on the theory of types” (1907), non — come vuol essere — di una descrizione di quanto sostenuto in “Les paradoxes de la logique”. Infatti, nella prima teoria sostituzionale ramificata, le proposizioni, come entità extralinguistiche, non sono affatto disposte in una gerarchia di tipi; ad essere disposte in una gerarchia di tipi sono invece le asserzioni, che però, in generale, sono solo simboli che non si considerano denotare entità: un’asserzione (un enunciato di-
chiarativo), secondo tale teoria, denota un’entità — una proposizione in senso ontologico — solo quand'è priva di variabili vincolate, e dunque solo in questo caso designa un possibile valore delle variabili vincolate. Proprio come non esiste un'entità (una classe) che sia denotata da una matrice, nella prima teoria sostituzionale ramificata non esiste un’entità (una proposizione) che sia denotata da un’asserzione contenente variabili vincolate. Ciò è stato giustamente sottolineato da Landini ([1987]): [...] le proposizioni generalizzate non sono considerate come singole entità fino al 1908 [cioè, fino all’anno dopo la redazione di ‘Mathematical logic as based on the theory of types”]. La gerarchia degli ‘ordini’ nella teoria di Russell [1906d] non è affatto una gerarchia di soggetti logici, poiché le asserzioni contenenti variabili apparenti non erano ritenute, a quell’epoca, designare singoli soggetti logici.?°°
Hylton si serve della sua interpretazione della prima teoria sostituzionale ramificata per spiegarne l’abbandono: Per capire perché Russell abbandonò la teoria sostituzionale ramificata, dobbiamo volgerci indietro alla ragione che [...] spiega perché egli dapprima adottò la teoria sostituzionale [semplice]. Se facciamo distinzioni di tipo tra le entità assunte dalla nostra logica, allora dobbiamo esser in grado di asserire le risultanti restrizioni sui tipi. Ma tali asserzioni violano esse stesse le restrizioni di tipo. Così qualsiasi logica con l’universalità che Russell assunse come essenziale alla logica non può essere soggetta a restrizioni di tipo. La teoria sostituzionale [semplice] sembra in grado di accogliere quest’argomento senza contraddizione, perché non vi sono distinzioni di tipo tra le entità che essa assume (le matrici non sono entità).?°
La difficoltà menzionata da HylIton è quella (citata sopra, $ 4.2.4) di cui Russell parla nell’articolo “Les paradoxes de la logique” (pp. 182-183): è impossibile formulare le restrizioni sui tipi di entità all’interno di una teoria senza violare le restrizioni stesse. La conclusione di Russell era che le variabili della teoria debbano avere una “struttura interna” che garantisca che siano del tipo voluto; la gerarchia delle matrici della teoria sostituzionale semplice realizza quest’obiettivo: in essa non vi è, infatti, nessuna distinzione di tipo tra entità; le distinzioni di ti-
po tra i simboli che tengono il posto di quelli che in una teoria intuitiva sarebbero considerati nomi di classi o di funzioni proposizionali emergono semplicemente dal fatto che, nel linguaggio della teoria sostituzionale semplice,
202 Hylton [1980], p. 23. 263 Hylton [1980], pp. 24-25. 2% Hylton [1980], p. 25. 2° Landini [1987], p. 190; la citazione bibliografica è adattata alla bibliografia del presente studio.
266 Hylton [1980], pp. 25-26.
Le teorie dello zigzag, della limitazione di grandezza, e senza classi
613
è impossibile costruire enunciati che vìolino le restrizioni di tipo perché, se si prova a farlo, si ottengono espressioni prive di senso.
Fin qui, l’interpretazione di Hylton è corretta, ma egli ora procede affermando che, poiché nella prima teoria sostituzionale ramificata la gerarchia delle proposizioni è una gerarchia di entità, i vantaggi che la teoria sostituzionale semplice presenta sarebbero del tutto perduti: Ma questo pregio cruciale [di non richiedere una formulazione esplicita delle restrizioni di tipo] appartiene soltanto alla teoria sostituzionale semplice, perché nella versione ramificata dobbiamo ammettere distinzioni di tipo tra le proposizioni che la teoria assume esistere. 267
Ma allora — secondo Hylton — non vi è più nessun vantaggio nel continuare a operare nell’ambito della teoria sostituzionale piuttosto che in una teoria, più semplice, che assuma funzioni proposizionali distinte in una gerarchia di tipi. Questo sarebbe — secondo Hylton — il motivo dell’abbandono della teoria sostituzionale. Sebbene la sua interpretazione della prima teoria sostituzionale ramificata sia scorretta, la tesi di Hylton mantiene, a mio parere, una sua validità come plausibile spiegazione dell’abbandono della teoria sostituzionale dopo la redazione di “Mathematical logic as based on the theory of types”, perché, come risulterà chiaro nel prossimo capitolo, la teoria di “Mathematical logic...” ha in realtà proprio le principali caratteristiche che Hylton attribuisce alla prima teoria sostituzionale ramificata. 4.4.5. Come già Nino Cocchiarella ([1980], $ 8), Gregory Landini ([1987], [1989], [1998a], cap. 9, [2003]) — seguito in ciò da Kevin C. Klement ([2004a], pp. 21-22), Graham Stevens ([2005], cap. 2, pp. 49-50, e cap. 3, 6263), Jan Proops ([2011], pp. 193-194) e Jolen B. Galaugher ([2013b], pp. 26-27) — sostiene che la teoria sostituzionale non sia abbandonata, ma solo modificata, nell’articolo “Mathematical logic as based on the theory of
types”: solo dopo la redazione di quest'articolo, completato nel giugno o all’inizio di luglio del 1907, Russell avrebbe abbandonato la teoria sostituzionale. Seguendo Cocchiarella ([1980], p. 90), che aveva rilevato il conflitto tra teoria sostituzionale semplice e teore-
ma di Cantor, Landini osserva che il paradosso di Cantor è formalmente derivabile in questa teoria:”° sia infatti “q/(b, p/a)” una matrice che definisce una funzione uno-uno f dalla classe degli individui alla classe delle sottoclassi di individui definite da una coppia d’individui p/a. Definiamo la classe, r/x, degli individui che non appartengono alla classe cui sono correlati dalla funzione g/(b, p/a):
r/x =ar (Ap”) Fa’) (9G/b, p/a)'(x, p', a’) A -(p/a"x)/x. Poiché la correlazione tra individui e classi d’individui è uno-uno,
r/x dev'essere correlata dalla funzione g/(b,
p/a) a uno e un solo individuo wu; ma allora abbiamo:
r/x'u= g/(b, p/a) (u, r, x) A -(r/x'u): da cui si ricava che r/x'u (v appartiene a r/x) se e solo se —(7/x'u) (u non appartiene a r/x).
Landini nota che la soluzione a questo paradosso potrebbe essere la prima teoria sostituzionale ramificata, in cui si fa una distinzione tra proposizioni autentiche, che sono entità, e asserzioni. Se infatti si ammette che gli enunciati che contengono variabili vincolate non denotino proposizioni, allora, in ‘“7/x” “7° non rappresenta una proposizione, poiché sta al posto di un enunciato contenente variabili vincolate. Dunque r/x non è nel codominio della funzione 9/(b, p/a) e quindi il paradosso non sorge. Landini osserva tuttavia che il paradosso è ripristinato quando, in aggiunta alla prima teoria sostituzionale ramificata, si assumano gli schemi d’assiomi di riducibilità — cosa che Russell è costretto a fare affinché la teoria stessa possa servire a fondare la matematica classica. Scrive Landini: Evidentemente,
nel
1906,
Russell
non
era cosciente
del conflitto tra la teoria sostituzionale
e il teorema
di Cantor.
Perché
l’introduzione dell’assioma di riducibilità annulla l’effetto della distinzione tra proposizioni e asserzioni nei contesti estensionali. L’assioma di riducibilità di Russell provvede al rimpiazzamento delle matrici i cui prototipi contengono asserzioni con matrici coe-
2°? Hylton [1980], p. 26. 268 V. Landini [1987], pp. 185-186.
capitolo 8
614
stensive (e “predicative”) i cui prototipi sono proposizioni. Per mezzo dell’assioma ci si garantisce che esiste una proposizione eleÈ Me a 269
mentare r* tale che r/x = r*/x. Ma allora r*/x è nel codominio di gb, (p/a)}, e ciò reintroduce il paradosso.
La prima teoria sostituzionale ramificata è contraddittoria. Per questo, Russell — secondo Landini — la modificò nella teoria di “Mathematical logic as based on the theory of types”: La nuova teoria evita il problema ponendo “limitazioni” ai valori possibili delle variabili apparenti. Otteniamo una gerarchia di proposizioni (che ora possono contenere variabili apparenti). Ciascuna è ora considerata come un singolo soggetto logico di un tipo dato (o “ordine”) definito dal campo delle sue variabili apparenti. Gli “individui” sono ora definiti come entità «destituite di complessità» (Russell [1908], $ IV, p. 76). Così, anche le proposizioni elementari sono di tipo differente dagli individui, e non sono so-
stituendi legittimi delle variabili individuali.??°
Per Landini, il fatto che la teoria dei tipi di “Mathematical logic...” risolva il problema del conflitto della prima teoria sostituzionale ramificata (con riducibilità) con il teorema di Cantor, [...] fornisce un’evidenza indiretta del fatto che Russell prese coscienza del conflitto tra la sua teoria sostituzionale e il teorema di Cantor. Si deve al conflitto con il teorema di Cantor e alla necessità dell’assioma di riducibilità, il fatto che [in “Mathematical
logic...”] le proposizioni elementari debbano essere di un tipo (o ‘“ordine’) diverso dagli individui. La variabile apparente Na Bi tAKO, < , + ala Sb Ste SIAE SGhi dev’essere limitata, e nessuna variabile può variare sia sugli individui sia sulle proposizioni elementari.
In un articolo pubblicato due anni dopo ([1989]), Landini esamina tre manoscritti di Russell,” trovandovi te-
stimonianza diretta che Russell si fosse reso conto, già nel 1906, del conflitto della sua prima teoria sostituzionale ramificata (con riducibilità) con il teorema di Cantor.??* Un’altra conferma della correttezza di questa tesi si trova nella menzionata lettera di Russell a Hawtrey del 22 gennaio 1907. In questa lettera,” Russell fornisce una versione simbolica del paradosso p/a, che, egli dice, «pilled the substitutional theory» (“ha bocciato la teoria sostituzionale”)?”? e aggiunge di aver sperimentato diverse soluzioni, ma inutilmente, perché esso si era costantemente ripresentato «in forme sempre più complicate». All’epoca, Russell aveva già proposto la sua prima teoria sostituzionale ramificata con riducibilità ed è dunque inevitabile concludere che egli includesse anche questa forma della teoria tra le diverse soluzioni da lui sperimentate inutilmente. Se non fosse stato così, se cioè egli fosse già stato in grado di risolvere il paradosso in una forma di teoria sostituzionale, egli non avrebbe certamente detto a Hawtrey che esso aveva «bocciato» questa tearia, né che nessuna delle soluzioni da lui tentate riusciva a bloccarlo. Ma nonostante la frase di condanna della teoria sostituzionale, apparentemente senza appello, nella lettera a Hawtrey, Russell tentò ancora, in “Mathematical logic...”, di salvarla, modificandola — come vedremo nel prossimo capitolo — in modo da non consentire più, neppure con l’aggiunta degli schemi d’assiomi di riducibilità, la derivazione dei paradossi connessi con l’argomento di Cantor. La modifica della teoria sostituzionale di “Mathematical logic...” non consente più, tuttavia, di avere variabili totalmente non ristrette, come nelle prime due teo-
rie sostituzionali.?”° Questo fu — secondo Landini — il motivo della reiezione della teoria sostituzionale a favore della teoria dei Principia, che invece — sostiene Landini — ammette solo variabili (oggettuali) non ristrette???
209 Landini [1987], p. 187. 270 Landini [1987], pp. 187-188. 27! Landini [1987], p. 189. 272 Si tratta dei manoscritti seguenti: “Logic in which propositions are not entities” (v. Russell [1906e]), datato aprile-maggio 1906 — dunque redatto nel periodo intercorso tra “On the substitutional theory of classes and relations” (dove Russell espone la teoria sostituzionale semplice) e “Les paradoxes de la logique” (dove Russell espone la prima teoria sostituzionale ramificata) —; “On Substitution” (v. Russell [1906f]), sempre dell’aprile-maggio 1906; e “The paradox of the liar? (v. Russell [1906g]), del settembre 1906 — quindi scritto subito do-
po la pubblicazione di “Les paradoxes de la logique” e prima di “Mathematical logic as based on the theory of types”. 273 Con ciò, Landini rettifica la tesi, sostenuta in Landini [1987] (p. 187), secondo la quale nel 1906 Russell non sarebbe stato consapevole del conflitto tra la prima teoria sostituzionale ramificata e il teorema di Cantor (v. Landini [1989], p. 315). sil Riprodotta sull’antifrontespizio di Landini [1998a], in B. Linsky [2002b], p. 160, e in Landini [2011a], cap. 3, p. 149.
275 Sembra che quest’uso del verbo “to pill” sia risultato ostico a diversi interpreti. Pelham e Urquhart ([1994], p. 321) — in un’epoca in cui la lettera di Russell ad Hawtrey non era ancora stata pubblicata — riportano la frase di Russell in modo errato: «[...] the paradox which killed [corsivo mio] the substitutional theory». Landini ([1998a], $ 9.0, p. 234) considera “to pill” come sinonimo, nel contesto, di “to de-
spoil”, ma l’uso di “to pill” per “to pillage” è arcaico (attestato nel Dizionario delle lingue italiana ed inglese di Giuseppe Baretti, 1771); esiste invece un uso colloquiale — oggi desueto, ma attestato all’inizio del Novecento (v. Oxford English Dictionary, vol. XI, 1989) — di “to pill” nel significato di “bocciare”, che si adatta molto meglio al contesto (v. anche, in proposito, B. Linsky [2002b], p. 157, nota 12).
27 Che le uniche variabili delle prime due teorie sostituzionali siano variabili individuali è una cosa che Russell rileva esplicitamente. In “Les paradoxes de la logique” si legge: «[...] dobbiamo assumere che una singola lettera, come x, può stare solo per un individuo; e può es-
Le teorie dello zigzag, della limitazione di grandezza, e senza classi
615
4.4.6. Francisco Rodrîguez-Consuegra ([1989a], $$ 5 e 6, e [2005], $ 6) esamina alcuni manoscritti russelliani del
periodo 1905-1907,” ricavandone la conclusione che già nel 1906 Russell aveva respinto la tesi secondo cui le proposizioni sono entità, e accettato la teoria del giudizio come relazione multipla. La ragione per cui Russell avrebbe abbandonato le proposizioni come entità derivò, secondo Rodriguez-Consuegra, da difficoltà provenienti dalla distinzione tra le proposizioni come complessi e i loro costituenti, presupposta dalla teoria sostituzionale. Poiché Russell non credeva più che le proposizioni fossero entità — come esige la teoria sostituzionale — egli avrebbe abbandonato la teoria sostituzionale già nel 1906. Uno dei passi riportati da Rodrfguez-Consuegra, in posizione preminente, a suffragio della sua tesi non convince. Si tratta del seguente argomento da “The paradox of the liar”: È necessario per la precedente teoria sostenere che una credenza, se non, al massimo, quando non compare nessuna variabile apparente, non sia un singolo stato mentale, ma un complesso, presumibilmente implicante una transizione [involving transition).[?°]
Infatti, se ci fosse una credenza per ciascuna proposizione, allora, poiché le credenze devono essere individui, ci sarebbero almeno tanti individui quante proposizioni, la qual cosa è impossibile. Quindi una credenza in una proposizione complicata [complicated ti
non dev’essere considerata come uno stato mentale, ma come una successione [sequence] o compresenza [coexistence]
di molti.
Rodrfguez-Consuegra, interpreta questo brano così: L’argomento di Russell, che sembra ispirato da Dedekind,[?*!] [...] è chiaro: la distinzione tra individui e proposizioni (resa necessaria da motivi logici) conduce a considerare il giudizio piuttosto come una relazione multipla tra la mente e ciascun costituente della proposizione (individui), piuttosto che una relazione unica [unique relation] tra la mente e un oggetto (proposizione). Le proposizioni devono essere considerate come combinazioni d’individui e, pertanto, più numerose di essi; altrimenti anche le proposi-
zioni dovrebbero essere individui [...]. Questo sembra il principale argomento che effettivamente conduce Russell alla nuova teoria
del giudizio già nel 1906*° Ma, naturalmente, se le proposizioni non sono più considerate entità, la teoria sostituzionale crolla. RodriguezConsuegra conclude: Conseguentemente, possiamo accettare l’intuizione originale di Grattan-Guinness ([1974a]), secondo cui la nuova teoria del giudi-
zio portò infine all’abbandono della teoria sostituzionale, ma con un’importante correzione: l’accettazione della nuova teoria del giudizio [...] fu una conseguenza di qualcosa di presupposto nella teoria sostituzionale (la distinzione tra proposizione e costituente), che portò anche ad altri problemi. Così l’accettazione della nuova teoria [della verità] non fu una decisione indipendente motivata solo da problemi filosofici generali, ma in particolare dalle difficoltà di un’ontologia di proposizioni nel contesto dei paradossi semantici, e fu senza dubbio facilitata dal metodo eliminativo che in precedenza aveva portato a fare a meno delle descrizioni e delle classi.?83
Credo che questa tesi non sia suffragata dal precedente passo di Russell; ritengo anzi che, in quel passo, Russell non stia affatto parlando della teoria del giudizio come relazione multipla. Si noti che, all’inizio, Russell esclude sere così solo se gli individui sono realmente tutte le entità, e le classi, ecc., sono solamente una facon de parler. Così la nostra variabile x ha adesso ancora un campo non ristretto, poiché può essere qualsiasi individuo, e non c’è realmente nulla che non sia un individuo» (Russell [1906d], $ III, p. 206). In modo meno diretto, Russell afferma la stessa cosa al termine di “On the substitutional theory of classes and relations”, osservando che la teoria ivi difesa «aderisce con drastica pedanteria alla vecchia massima che, “qualsiasi cosa ci sia, è una” [cioè un individuo: non ci sono oggetti molteplici, come le classi dei Principles]» (Russell [1906c], p. 189).
27 V,, per es., Landini [1996a], p. 323 e 328. 278 In Rodrfguez-Consuegra [1989a], sono esaminati solo due dei manoscritti di Russell considerati da Landini nel suo articolo del 1989 — “On substitution” (v. Russell [1906f]), dell’aprile-maggio 1906, e “The paradox of the liar” (v. Russell [1906g]) del settembre 1906. Rodriguez-Consuegra dichiara invece (v. Rodriguez-Consuegra [1989a], p. 148, nota 19) di non aver preso visione del manoscritto di Russell
“Logic in which propositions are not entities” (Russell [1906e]), sempre dell’aprile-maggio del 1906 — il terzo di quelli menzionati in Landini [1989]. In Rodriguez-Consuegra [2005] sono invece considerati tutti i manoscritti esaminati in Landini [1989], insieme con alcuni
altri (v. Rodriguez-Consuegra [2005], p. 280). 2 fi probabile che, con “involving transition”, Russell intenda dire che una credenza è, nel caso considerato, un complesso di stati mentali
in cui vi è il passaggio della mente da uno stato all’altro. 280 Russell [1906g], p. 346. Il passo (ms., f. 63) è riportato in Rodriguez-Consuegra [1989a], p. 152, e in Rodrîguez-Consuegra [2005], p.
268. si Rodriguez-Consuegra che abbiamo descritto nel 282 Rodriguez-Consuegra 283 Rodriguez-Consuegra
si riferisce evidentemente all’argomento di Dedekind ([1888], $ 5, punto 66) per provare l’esistenza dell’infinito, cap. 2, $ 6.3. [1989a], p. 152. [1989a], p. 153.
capitolo 8
616
dall’argomentazione quelle asserzioni che non contengono variabili apparenti: il brano è un’argomentazione a s0stegno del fatto che credere, per esempio, “Ogni uomo è mortale” non può consistere nel credere una proposizione, ma consiste nel credere tutte le proposizioni della forma “x è mortale” — cioè le proposizioni espresse da “Platone è mortale”, “Socrate è mortale”, ecc. —: ma che non esistano proposizioni, in senso ontologico, corrispondenti agli enunciati generali è esattamente ciò che Russell sostiene ne/ contesto della sua prima teoria sostituzionale ramificata.** Nel complesso, i manoscritti russelliani rivelano certamente che, dalla metà del 1906, Russell aveva cominciato
a muoversi con sempre maggiore convinzione verso una teoria del giudizio come relazione multipla, che implicava il rifiuto della teoria sostituzionale.?*° Dopo la metà del 1906, Russell è oscillante sulla validità della teoria sostituzionale. Se in una lettera a Jourdain del 14 giugno 1906, Russell scriveva: «Mi sento sempre più sicuro che questa teoria [sostituzionale] sia giusta», 75° in una lettera allo stesso Jourdain del 10 settembre dello stesso anno
ritratta: «Propendo adesso per la dottrina dei tipi, così come appare nell’ Appendice B del mio libro [i Principles]».?®” Ma alla tesi che la teoria sostituzionale sia stata abbandonata da Russell nella seconda metà del 1906 si frappongono alcuni ostacoli. Innanzitutto: Russell non sostiene la teoria del giudizio come relazione multipla negli scritti destinati alla pubblicazione fino al 1909. Ciò indica, a mio parere, che nel periodo 1906-1908 Russell era ancora incerto sulla sostenibilità di questa dottrina. Per es., nel seguente passo di “The paradox of the liar”, riportato da Rodriguez-Consuegra, Russell difende senza dubbio la teoria del giudizio come relazione multipla: La prima difficoltà in tale punto di vista [che solo le proposizioni vere sussistono oggettivamente] è spiegare a che cosa ci riferiamo [what we mean] con una credenza in ciò che è falso. Per spiegare questo non dovremo considerare ciò che si chiama credenza in una proposizione come un pensiero riguardo alla proposizione, ma piuttosto come un pensiero riguardo ai costituenti della proposizione. Cioè, se io credo che A è B io ho un pensiero riguardo ad A e a B, ma non alla proposizione “A è B” [E465
Ma nell’articolo “On the nature of Truth”, scritto per la pubblicazione nello stesso periodo di “The paradox of the liar’,® dopo aver abbozzato la possibilità di questa teoria, aggiunge: Non voglio effettivamente difendere [/ do not wish positively to advocate] la precedente teoria della credenza, che molto probabilmente [very likely] può essere aperta a obiezioni fatali [fasal objections]. Voglio semplicemente [merely] suggerirne la possibili290 tà.
284 Nel brano in esame, Russell non spiega il motivo per cui afferma che «è impossibile» che vi siano almeno tanti individui quante proposizioni — né lo fa Rodrfguez-Consuegra —, ma è plausibile che alla base di quest’asserzione ci sia un argomento basato sul teorema di Cantor simile a quello esposto nell’appendice B dei Principles; riportiamo il passo: «Nel caso delle proposizioni, sembra che esista sempre un nome verbale associato che è un individuo. Abbiamo “x è identico a x° e “l’autoidentità di x”, “x differisce da y” e “la differenza tra x e y”; e così via. Il nome verbale, che è ciò che abbiamo chiamato il concetto
proposizionale, appare all’indagine essere un individuo, ma ciò è impossibile, perché “l’autoidentità di x” ha tanti valori quanti sono gli 0ggetti, e quindi più valori di quanti sono gli individui. Ciò risulta dal fatto che ci sono proposizioni riguardo a ogni oggetto concepibile, e la definizione di identità mostra [...] che ogni oggetto riguardo al quale vi sono proposizioni, è identico a se stesso. Il solo metodo di sfuggire a questa difficoltà è negare che i concetti proposizionali siano individui [...]. [...] Il concetto proposizionale sembra, in effetti, non essere altro che la proposizione stessa, la differenza essendo semplicemente quella psicologica che noi non asseriamo la proposizione in un caso, e la asseriamo nell’ altro» (Russell [1903a], $ 499, pp. 526-527).
L'argomento dei Principles è il seguente: se ogni concetto proposizionale (proposizione) è un individuo, i concetti proposizionali (le proposizioni) non possono essere più degli individui; d’altra parte, per ogni classe c'è un concetto proposizionale (una proposizione) che dice che questa classe è uguale a se stessa: dunque, le classi non possono essere più dei concetti proposizionali (proposizioni). Da ciò, tuttavia,
seguirebbe che le classi non possono essere più degli individui, cosa che è in contraddizione con il teorema di Cantor, il quale assicura che devono esserci più classi d’individui che individui. Da quest’argomento, secondo Russell, si deve inferire che i concetti proposizionali (le proposizioni) non possono essere individui. In “The paradox of the lia” l'argomento russelliano sembra essere: se ciascuna possibile asserzione esprimesse una singola credenza, in maniera che asserzioni diverse esprimano credenze diverse, poiché ogni singola credenza è un individuo, le possibili asserzioni non potrebbero essere più degli individui; ma poiché per ogni classe c’è la possibile asserzione che questa classe sia identica a se stessa, le classi non possono essere più delle possibili asserzioni. Da ciò, tuttavia, segue che le classi non possono essere più degli individui, cosa che è in contraddizione con il teorema di Cantor. La conclusione di Russell è che devono esserci asserzioni che non esprimono singole credenze, ma insiemi di credenze. 285 V. Rodrîguez-Consuegra [2005], $ 6. 286 In Grattan-Guinness [1977], p. 89.
287 In Grattan-Guinness [1977], p. 91. 288 Russell [1906g], p. 321. Il passo (ms., f. 4) è riportato in Rodriguez-Consuegra
[1989a], p. 153, e, in parte, in Rodrfguez-Consuegra
[2005], p. 268. Sal Questo è provato dalla presenza di un riferimento, in una nota al testo (v. Russell [1907d], $ III, p. 46, seconda nota), alla pubblicazione
di “Les paradoxes de la logique” sulla Revue de Métaphysique et de Morale del settembre 1906.
Le teorie dello zigzag, della limitazione di grandezza, e senza classi
617
Inoltre, se nella lettera a Hawtrey del 22 gennaio 1907, Russell descrive la difficoltà che, nelle sue parole, «ha bocciato la teoria sostituzionale», in “Mathematical logic...” — completato nel giugno o luglio dello stesso anno,” Russell sostiene ancora una variante di teoria sostituzionale. Rodrîguez-Consuegra lo nega: coerentemente con la sua tesi dell’abbandono della teoria sostituzionale nel 1906, egli sostiene che in “Mathematical logic...” la teoria sostituzionale è respinta. Abbiamo qui una fondamentale divergenza interpretativa tra Rodriguez-Consuegra e Landini. Per il primo, la teoria di “Mathematical logic...” è basata sull’assunzione di funzioni proposizionali come entità, e non sull’assunzione di proposizioni come entità extralinguistiche; per il secondo, invece, la teoria di “Mathematical logic...” è ancora basata sull’assunzione delle proposizioni come entità, mentre le funzioni proposizionali sarebbero considerate eliminabili con il metodo delle matrici e sarebbero assunte nell’esposizione per mera comodità notazionale. Secondo Landini, la teoria del giudizio come relazione multipla è definitivamente adottata da Russell solo negli scritti pubblicati nel 1910, ed è solo da quel momento che le proposizioni come entità sono rifiutate e la teoria sostituzionale definitivamente abbandonata.?”° Come vedremo nel prossimo capitolo, è vero che la teoria di “Mathematical logic...” è formalmente basata sulla nozione primitiva di “funzione proposizionale”, ma in quest'articolo Russell sostiene esplicitamente che le funzioni proposizionali sono eliminabili con il metodo della sostituzione, a favore di un’ontologia di proposizioni. L’abbandono della teoria sostituzionale non fu dunque, per Russell, una svolta improvvisa. Essa maturò nel corso del 1906 e 1907, ma fu definitiva solo dopo la redazione di “Mathematical logic...”°. La gestazione relativamente lunga rende verosimile che le ragioni dell’abbandono della teoria sostituzionale siano state molteplici, sia esterne sia interne alla teoria stessa. Per quanto riguarda le ragioni esterne, si deve convenire con GrattanGuinness che esse risiedevano nell’adozione di una nuova teoria della verità. Nel 1906, a Russell non sembrava più molto plausibile l’esistenza di proposizioni false, come riferimento degli enunciati falsi, né la caratterizzazione della verità come una proprietà primitiva e inanalizzabile di alcune proposizioni. Russell cominciò quindi a esplorare la possibilità di una teoria corrispondentista della verità, secondo la quale gli enunciati veri corrispondono a fatti, mentre quelli falsi non corrispondono a nulla. Ma l’eliminazione del riferimento per gli enunciati falsi implica il rifiuto di una teoria, come quella sostituzionale, basata sull’assunzione di corrispettivi ontologici degli enunciati — veri o falsi che siano. Nello stesso periodo, le difficoltà interne della teoria sostituzionale condussero Russell a modificarla, dapprima negando un riferimento gli enunciati con quantificatori, e poi — in “Mathematical logic...” — suddividendo in tipi le proposizioni. Ma, in tal modo, il vantaggio della primitiva teoria sostituzionale di sortire gli effetti di una teoria dei tipi senza ammettere realmente tipi distinti di entità era perduto.”
290 Russell [1907d], $ III, p. 47, nota. V. anche ibid., $ III, p. 49. 29 V. Russell [2014], p. 585 (introduzione a Russell [1908]). 292 V. Landini [1987], p. 196. 293 Qui non entriamo nel merito della questione se ciò abbia favorito l'abbandono della teoria sostituzionale solo perché essa non aveva alcun vantaggio, rispetto a una teoria più semplice (quella dei Principia Mathematica), basata su una gerarchia di tipi di funzioni proposizionali come entità non linguistiche (secondo una variante dell’idea di Hylton), o se lo abbia favorito perché (come ritiene Landini) la teoria dei Principia permette di avere un solo tipo di variabile oggettuale (la partizione delle funzioni proposizionali in tipi dei Principia, secondo Landini, non stabilisce una gerarchia di entità, ma di simboli). Discutere questo punto richiede un esame della teoria dei Principia, che
svolgeremo più avanti, nel cap. 11.
CAPITOLO 9 LA TEORIA DEI TIPI DEL 1907
Nell'articolo “Mathematical logic as based on the theory of types”, completato nel giugno o all’inizio di luglio del 1907, ma pubblicato nel luglio dell’anno successivo, Russell propose una prima versione della sua teoria logica matura. Essa fu ripresa — con importanti cambiamenti nella sua base filosofica, ma immutata dal punto di vista tecnico — nei Principia Mathematica (1910-13) e oggi è nota con il nome di teoria ramificata dei tipi di Russell. Il nome deriva dalla circostanza che, in essa, i termini individuali e i predicati (e/o i simboli di classe) sono siste-
mati in una gerarchia in cui ai primi è assegnato il livello più basso e ai secondi livelli sempre più alti in dipendenza: (1) del livello delle loro variabili argomentali (0, nel caso delle classi, in dipendenza del livello dei simboli che ne designano i possibili membri); (2) del livello delle variabili quantificate che vi compaiono. Naturalmente, se si assume che i termini individuali e i predicati (e/o i simboli di classe) denotino entità, la gerar-
chia di simboli corrisponde a una gerarchia ontologica. L’interpretazione dell’ontologia sottostante alla teoria ramificata dei tipi, così come fu concepita originariamente da Russell, è uno dei punti più difficili dello studio di ‘Mathematical logic...” e dei Principia. Dopo Chwistek [1924-25] e Ramsey [1926a] si sono distinte, in generale, teorie che riconoscono solo una gerarchia dipendente da (1) e teorie che riconoscono sia una gerarchia dipendente da (1) sia una gerarchia che dipende da (2): una teoria del primo genere è comunemente detta teoria semplice dei tipi, una del secondo genere teoria ramificata dei tipi.' La teoria ramificata dei tipi sostenuta in “Mathematical logic...” rappresenta una transizione fra la prima teoria sostituzionale ramificata e la teoria ramificata dei tipi dei Principia. Tutte e tre sono “teorie senza classi” (noclass theories), secondo la terminologia adottata da Russell alla fine del 1905," cioè teorie in cui non si assume
l’esistenza di classi, né di relazioni in estensione:’ le espressioni che contengono simboli di classe e di relazione in estensione vi sono reinterpretate in modo da non rinviare a nessun’ontologia di classi o relazioni in estensione. La teoria di “Mathematical logic...” rappresenta anche una seconda forma di teoria sostituzionale ramificata: le dif! Questa terminologia non si trova in Russell. Ivor Grattan-Guinness ([1984], p. 74) afferma che la sua origine risalirebbe a Chwistek, il quale avrebbe chiamato una teoria dei tipi senza suddivisione in ordini — come quella già tentativamente proposta nell’appendice B dei Principles of Mathematics — “primitive”, “simplified” o “simple” e quella dei Principia “pure”, “branched” o ‘“‘constructive”’; secondo Grattan-Guinness, il termine inglese “branched” sarebbe stato reso in tedesco da Carnap con “verzweigte”, e “verzweigte” sarebbe poi stato tradotto nuovamente in inglese con “ramified” — “ramificata”. Grattan-Guinness afferma (v. Grattan-Guinness [1984], p. 74, GrattanGuinness [1998], p. 827, e Grattan-Guinness [2000], $ 8.8.4, p. 496, e $ 8.9.3, p. 501) che la parola “branched” è usata in Chwistek [1924-
25], ma all’esame non ne ho trovato traccia: la teoria dei tipi vi è chiamata “pure” o “constructive” (per es., p. 13) se ramificata, e “simplified’” (per es., pp. 49-50) se semplice; si trova anche “simple” (per es., p. 12), ma in riferimento alla gerarchia (semplice) dei tipi, mentre “simple”, riferito alla teoria dei tipi, si trova in Ramsey [1926a]. L’uso della locuzione “simple theory of types” non risale dunque a Chwi-
stek, ma a Ramsey. I termini “ramified” e “branched” compaiono nella traduzione inglese di un’opera pubblicata da Chwistek in polacco nel 1935 (v. Chwistek [1948]), ma solo “branched” compare una volta nel testo di Chwistek; per il resto, i termini si trovano solo nell’introduzione e nell’appendice di Helen Charlotte Brodie, dove sono adoperati come termini correnti, la cui origine non è ascritta a Chwistek. In tutto il libro, Chwistek continua a usare la medesima terminologia di Chwistek [1924-25], con la teoria dei tipi “pure” o “con-
structive” contrapposta a quella “simplified”. L’unica occorrenza del termine “branched” nel testo di Chwistek si trova nel cap. 6, in un paragrafo che comincia con le parole: «Vorrei ora dire qualche parola sulla teoria pura dei tipi logici» (Chwistek [1948], cap. 6, $ 7, p. 155; corsivo di Chwistek). Dopo aver descritto la teoria, Chwistek osserva: «Questa teoria è stata chiamata teoria ramificata [branched] dei tipi,
perché, come è chiaro, i tipi non formano una sequenza» (ibid.). E dunque evidente, nel contesto, che parlando di “branched theory of types”, Chwistek non sta proponendo la propria terminologia, ma una terminologia corrente all’epoca. Poiché “verzweigte Typentheorie” è adoperato da Carnap già nel 1929 (v. Carnap [1929], $ 9, p. 21), e ripreso all’inizio degli anni 30 (v. Carnap [1931a], $ II, p. 96, e Carnap
[1931b], p. 74) si può concludere che la terminologia attuale derivi dallo stesso Carnap — oltre che, in parte, da Ramsey.
° V. Russell [19062].
3 Né, come vedremo, di funzioni proposizionali, in senso ontologico.
La teoria dei tipi del 1907
619
ferenze fondamentali, rispetto alla prima teoria sostituzionale ramificata, sono due: (1) gli individui sono ora considerati entità di tipo diverso rispetto alle proposizioni; (2) anche gli enunciati generali rinviano ora a proposizioni in senso ontologico, ma tali proposizioni sono considerate di un tipo logico superiore a quello delle proposizioni nella cui espressione verbale non sono presenti variabili quantificate, e sono stratificate in tipi, dipendenti dai tipi delle variabili quantificate che compaiono nei rispettivi enunciati. Infine, la teoria di “Mathematical logic...” è una teoria ramificata dei tipi in due sensi: (1) lo sviluppo tecnico della teoria, attraverso simboli di funzione proposizionale stratificati in tipi, secondo il tipo delle variabili argomentali e delle variabili vincolate che vi compaiono, è identico a quello della teoria dei Principia; (2) le entità della teoria (proposizioni) sono stratificate in tipi che dipendono dai tipi delle variabili vincolate che compaiono nei simboli che le rappresentano. In questo capitolo prenderemo in esame la teoria ramificata dei tipi così com’è proposta da Russell nell’articolo del 1907; nei capitoli seguenti ci volgeremo alla teoria dei Principia.
1. IL PRINCIPIO DEL CIRCOLO VIZIOSO “Mathematical logic as based on the theory of types” comincia con un elenco di sette paradossi,' di cui è fornita una rapida descrizione: (1) (2) (3) (4) (5) (6) (7)
IH Il Il Il Il Il Il
paradosso paradosso paradosso paradosso paradosso paradosso paradosso
di di di di di di di
Epimenide. Russell riferito alle classi. Russell riferito alle relazioni. Berry. K6nig. Richard. Burali-Forti.
Russell afferma che, in tutti questi paradossi «(che sono semplicemente una selezione da un numero indefinito) c’è una caratteristica comune, che si può descrivere come autoreferenza [self-reference] o riflessività [reflexiveness|]»;
5
.
e continua:
L’osservazione di Epimenide deve includere se stessa nel suo ambito [scope]. Se tutte le classi, ammesso che non siano membri di se stesse, sono membri di w, questo deve anche applicarsi a w; e similmente per l’analoga contraddizione relazionale. Nei casi dei nomi e delle definizioni, i paradossi risultano dal considerare la non nominabilità e l’indefinibilità come elementi di nomi e defini-
zioni. Nel caso del paradosso di Burali-Forti, la serie il cui numero ordinale causa la difficoltà è la serie di tutti inumeri ordinali.°
Russell passa quindi in rassegna i paradossi (1)-(7) in modo più analitico: (1) Quando qualcuno dice “Sto mentendo”, possiamo interpretare la sua asserzione come “C°è una proposizione che sto affermando e che è falsa”. Tutte le asserzioni con “C'è” così e così possono essere considerate come negazioni che l’opposto sia sempre vero; così “Sto mentendo” diviene “Non è vero di tutte le proposizioni che o non le sto affermando o esse sono vere”; in altre parole, “Non è vero per tutte le proposizioni p che se affermo p, p è vero”. Il paradosso risulta dal considerare quest’asserzione come affermante una proposizione, la quale deve pertanto trovarsi nell’ambito dall’asserzione. Questo, in ogni caso, rende evidente che la nozione di “tutte le proposizioni” è illegittima; infatti, in caso contrario, dovrebbero esserci proposizioni (come la precedente) che riguardano tutte le proposizioni e tuttavia non possono, senza contraddizione, essere incluse tra le proposizioni che riguardano. Qualunque supponiamo essere la totalità delle proposizioni, le asserzioni riguardo a questa totalità generano nuove proposizioni che, sotto pena di contraddizione, devono restare fuori della totalità. È inutile allargare la totalità, perché questo allarga ugualmente l’ambito delle asserzioni riguardanti la totalità. Quindi non deve esserci una totalità di proposizioni, e “tutte le proposizioni” dev'essere un’espressione senza senso. (2) In questo caso, la classe w è definita attraverso un riferimento a “tutte le classi” e inoltre risulta essere una tra le classi. Se cerchiamo aiuto decidendo che nessuna classe è un membro di se stessa, allora w diviene la classe di tutte le classi, e dobbiamo decide4 Gli stessi sette paradossi sono elencati nei Principia (vol. I, introduzione, cap. 2, $ VIII pp. 60-61)
— dove sono descritti esattamente con
le stesse parole. L'unico cambiamento è che nei Principia il paradosso di Burali-Forti è riportato nell’elenco come quarto paradosso, invece che come settimo, cosicché i paradossi di Berry, K6nig e Richard si trovano menzionati, rispettivamente, come quinto, sesto e settimo paradosso. Il paradosso di Grelling non è menzionato né in “Mathematical logic...” né nei Principia.
° Russell [1908], $ I, p. 61.
° Ibid.
620
capitolo 9 re che questa non è un membro di se stessa, cioè, non è una classe. Questo è possibile solo se non esiste una classe di tutte le classi
nel senso richiesto dal paradosso. Che non vi sia una tale classe risulta dal fatto che, se supponiamo che vi sia, la supposizione dà immediatamente origine (come nella contraddizione precedente) a nuove classi che restano al di fuori della supposta totalità di classi. (3) Questo caso è esattamente analogo al (2) e mostra che non possiamo legittimamente parlare di “tutte le relazioni”. (4) “Il più piccolo intero non nominabile in meno di ventisei sillabe” [nel testo originale: “The least integer not nameable in fewer than nineteen syllables”] involge la totalità dei nomi, perché è “il più piccolo intero tale che tutti i nomi o non si applicano ad esso oppure hanno più di ventisei sillabe” [nel testo originale: “nineteen syllables”]. Qui assumiamo, nell’ottenere la contraddizione, che un'espressione contenente “tutti inomi” sia essa stessa un nome, sebbene dalla contraddizione risulti evidente che esso non può essere uno dei nomi che si erano supposti essere tutti i nomi che ci sono. Quindi “tutti i nomi” TLESè una nozione illegittima. (5) Questo caso, similmente, mostra che “tutte le definizioni” è una nozione illegittima. (6) Questo si risolve, come (5), osservando che “tutte le definizioni” è una nozione illegittima. Così il numero E non è definito in un numero finito di parole, non essendo, in realtà, definito affatto. (7) La contraddizione di Burali-Forti mostra che “tutti gli ordinali” è una nozione illegittima; perché, se non fosse così, tutti gli or-
dinali in ordine di grandezza formerebbero una serie ben ordinata, che dovrebbe avere un numero ordinale più grande di tutti gli ordinali. Così tutte le nostre contraddizioni hanno in comune l’assunzione di una totalità tale che, se fosse legittima, sarebbe immediata-
mente allargata da nuovi membri definiti in termini della totalità stessa.”
Russell non traccia nessuna distinzione fondamentale tra paradossi logici (o insiemistici) e paradossi semantici: da un lato, egli è convinto che sia compito della logica risolvere tutte le antinomie; dall’altro, ritiene che tutte le antinomie derivino da un’unica fallacia: la violazione del “principio del circolo vizioso”. Russell lo formula pressappoco negli stessi termini che aveva usato nel 1906: “Tutto ciò che involge [involves] tutti di una collezione non può essere uno della collezione”, o, inversamente: “Se, ammesso che una certa collezione abbia un totale, essa avesse membri definibili soltanto in termini di quel totale, allora la detta collezione non ha un totale”. 99
8
Il principio del circolo vizioso riceve, in “Mathematical logic...”, solo una giustificazione pragmatica: la sua violazione conduce a paradossi. Il meccanismo per il quale entità indipendenti dall’uomo ammesse nell’ontologia di “Mathematical logic...’ — come vedremo essere il caso delle proposizioni — non potrebbero essere definite in termini di una totalità che le presuppongono non è esplorato. Molti studiosi hanno obiettato che caratterizzare un’entità non è farla esistere: in una prospettiva realista, non è chiaro perché un'entità non potrebbe essere caratterizzata in termini di una totalità che richiede, come presupposto ontologico, l’esistenza di tale entità. Per riprendere un celebre esempio di Quine: che cosa ci sarebbe di scorretto nell’individuare un tizio che sia “il tipico uomo di Yale” attraverso misurazioni e statistiche che coinvolgano tutti gli uomini di Yale, incluso il tizio in questione?” Sicuramente, in “Mathematical logic...” Russell assume una prospettiva realista nei confronti delle proposizioni: perché allora una proposizione non potrebbe essere caratterizzata in termini di una totalità che presuppone l’esistenza di tale proposizione? Se si prende sul serio il “soltanto” che compare in “definibili soltanto in termini di quel totale”, l’idea di Russell potrebbe essere l’ipotesi metafisica che, se qualcosa è realmente un'entità, debbano esistere anche modi di definirla che non ricorrano a una totalità di cui l’entità stessa è parte. Questo sarebbe il caso, per es., del tipico studente di Yale, che ha anche proprietà — per es., un certo nome e cognome, una certa data di nascita, un certo aspetto fisico — che lo caratterizzano in modo indipendente da un intero gruppo di cui è parte. L'effetto dell’assioma di riducibilità — sostenuto in “Mathematical logic...’ come lo sarà nei Principia — consiste proprio nel postulare che, per ogni definizione impredicativa, cioè che definisce un oggetto in dipendenza di una totalità di cui esso stesso è un membro, ne debba esistere una, estensionalmente equivalente, che sia predicativa — cioè che definisca l’oggetto senza ricorrere a totalità di cui l’oggetto stesso sia parte. In “Mathematical logic...” Russell riafferma la tesi già sostenuta in “Les paradoxes de la logique” secondo cui il principio del circolo vizioso non può essere considerato, per se stesso, una soluzione alle contraddizioni;'° non si può evitare di menzionare un’entità illegittima — egli ribadisce — menzionando l’entità stessa che si vuole evitare di menzionare:
? Russell [1908], $ I, pp. 61-63. * Russell [1908], $ I, p. 63. Cfr Russell [1906d], $ III, p. 204. Va per esempio, Quine [1969a], $ 34, p. 243, e Quine [1987], “Impredicativity”, p. 94.
!© V. sopra, cap. 8, $ 4.2.4.
La teoria dei tipi del 1907
621
Non possiamo dire: “Quando parlo di tutte le proposizioni, io intendo tutte eccetto quelle in cui sono menzionate tutte le proposizioni”, perché in questa spiegazione abbiamo menzionato le proposizioni in cui sono menzionate tutte le proposizioni, cosa che non Eo
(v3),
esso è equivalente a:
Ma (Py
vr).
Qui — secondo Russell — si potrebbero eliminare le variabili vincolate, a favore di variabili libere. Ma si prenda ora quest'altro caso:
M(Ppy= M(V0); esso non equivale a:
MA (Py= Vv, né è possibile trasformarlo in un enunciato equivalente che contenga solo quantificazioni universali aventi come o
a
ambito l’intera formula.”
D8
3
7
SIA
5
5
Un caso del genere si presenta, per esempio, con la definizione russelliana di “numero
naturale”:
xe NC induct=(@(0€e
a1M)je
a3yt+. le QIxe
d:
se trasformiamo questa formula in: (W(x e NC induct= (0e ae
dD>Dy+ le DIE
0),
non otteniamo più un significato costante per “x e NC induct”, ma un significato che varia al variare di &, identificando, di volta in volta, l'appartenenza a NC induct con l’appartenenza a ciascuna classe che abbia tra i suoi e-
20 V. Russell [1908], $ II, p. 66. 2! Russell [1908], $ II, pp. 66-67. 22 V_ Russell [1908], $ II, p. 67. 23 Infatti, se si pone l’enunciato “()(@y= (x)(vx)” in forma prenessa — cioè se lo si trasforma in un enunciato equivalente contenente
solo quantificatori aventi come ambito l’intero enunciato — si ottiene una formula contenente anche un quantificatore esistenziale, che quindi non può essere eliminato con il metodo proposto.
La teoria dei tipi del 1907
623
lementi 0 e il successore di ogni suo elemento. Russell porta un esempio simile, ma formulato in termini di pro-
prietà, anziché di classi: Se si deve usare l’induzione per definire gli interi finiti, l’induzione deve specificare una proprietà definita degli interi finiti, non una proprietà ambigua. Ma, se @ è una variabile reale, l’asserzione “n ha la proprietà @ ammesso che questa proprietà sia posseduta da 0 e dai successori dei possessori” assegna a n una proprietà che varia al variare di 9, e una tale proprietà non può essere usata per definire la classe degli interi finiti. Noi vogliamo dire: “‘n è un intero finito’ significa: ‘Qualsiasi proprietà @ possa essere, n ha la proprietà 9 ammesso che @ sia posseduta da 0 e dai successori dei possessori”. Ma qui @ è divenuta una variabile apparente. Per mantenerla una variabile reale, dovremmo dire: “Qualsiasi proprietà @ possa essere, ‘n è un intero finito’ significa: n ha la proprietà 9 ammesso che @ sia posseduta da 0 e dai successori dei possessori”. Ma qui il significato di ‘n è un intero finito’ varia al variare di 9, e quindi una tale definizione è impossibile.?*
La conclusione di Russell è che le variabili apparenti sono indispensabili. Russell sostiene che la distinzione tra variabili apparenti e variabili reali concili il principio del circolo vizioso con la formulazione delle leggi della logica. Egli scrive: La distinzione tra tutti e uno qualsiasi è, quindi, necessaria al ragionamento deduttivo e ricorre in tutta la matematica [...]. Per i no-
stri scopi essa ha un’utilità diversa, che è molto grande. Nel caso di variabili per proposizioni o proprietà, “un valore qualsiasi” è
legittimo, sebbene “tutti i valori” non lo sia. Così possiamo dire: “p è vera o falsa, dove p è una proposizione qualsiasi”, sebbene non possiamo dire: “Tutte le proposizioni sono vere o false”. La ragione è che, nel primo caso, affermiamo soltanto una proposizione indeterminata della forma “p è vera o falsa”, mentre nel secondo affermiamo (se affermiamo qualcosa) una nuova proposizione, differente da tutte le proposizioni della forma “p è vera o falsa”. Così possiamo ammettere “un valore qualsiasi” di una variabile nei casi in cui “tutti i valori” avrebbe condotto a fallacie riflessive; poiché l'ammissione di “un valore qualsiasi” non crea nuovi valori nello stesso modo. Quindi le leggi fondamentali della logica si possono formulare riguardo a una qualsiasi proposizione, sebbene non possiamo dire in modo significante che esse valgano di tute le proposizioni. Queste leggi hanno, per così dire, un’enunciazione particolare, ma non un’enunciazione generale. Non c’è una proposizione che è la legge di contraddizione (per dirne una); ci sono solo 1 vari esempi della legge. Di una qualsiasi proposizione p, possiamo dire: “p e non-p non possono essere entrambe vere”: ma non c’è una proposizione come: “Ogni proposizionep è tale che p e non-p non possono essere entrambe vere”. Una spiegazione simile si applica alle proprietà.”
È evidente che Russell confonde qui la distinzione tra variabili e lettere schematiche con quella tra variabili vincolate e variabili libere. Nel brano riportato, Russell pensa, in realtà, alla distinzione tra “p’ intesa come variabile e “p” intesa come lettera schematica. Se “p” è considerata una variabile di un certo linguaggio L che varia su proposizioni, allora ‘“p Vv —p” sarà un enunciato aperto di L, contenente una variabile libera, e “(p)(p Vv —p)” sarà un enunciato chiuso di L, contenente una variabile vincolata, che dice che ogni proposizione è vera o falsa. Si può tuttavia concepire ‘“p’ non come un simbolo appartenente a L, ma come una lettera schematica che tiene il posto Ce__9?
(L90662)
C6__99
6.99
di qualsiasi enunciato di L; in questo caso, “p v , Sa - 55 data è priva di significato [meaningless], cioè, non ha valori.
Ma, se le funzioni proposizionali, in “Mathematical logic...”, sono talora intese come simboli si può sostenere che esse siano anche, talvolta, intese come entità? A volte, il termine “funzione proposizionale” sembra usato per
indicare entità non linguistiche. Per esempio, nel brano riportato nel paragrafo precedente Russell dice che «Una funzione del primo ordine di un individuo x sarà denotata [denoted] da @!x» (32). Più avanti, Russell scrive che «una funzione predicativa di un argomento x (dove x può essere di qualsiasi tipo) sarà denotata da @!x (dove v, X. 0. f. g. F 0 G possono rimpiazzare @)» (40) e che «una funzione generale di x sarà denotata da @x, e una fun-
zione generale di x e y da @(x, y)» (41). Qui una funzione sembra essere la denotazione di un enunciato aperto.
°2 93 % °°
Russell Russell Russell Russell
[1908], [1908], [1908], [1908],
$ III, p. 72, seconda nota. $ V, pp. 82-83. $ VIII, p. 92. $ III, pp. 74-75.
capitolo 9
630
Che le funzioni proposizionali debbano essere intese (anche) come entità non linguistiche — stavolta non corrispondenti ontologici degli enunciati aperti, ma corrispondenti ontologici dei simboli funzionali in isolamento — sembra ancora suggerito dall’uso, che si trova in diverse parti dell’articolo in esame, di “proprietà” (property) come sinonimo di “funzione proposizionale”; si prenda, a titolo d’illustrazione, il seguente passo del $ II: Una spiegazione simile si applica alle proprietà [properties]. Possiamo parlare di qualsiasi [any] proprietà di x, ma non di tutte [all] le proprietà, perché in tal modo si genererebbero nuove proprietà. Così possiamo dire: “Se n è un intero finito, e se 0 ha la proprietà @ em+1 hala proprietà @ qualora ce l’abbia m, ne segue che n ha la proprietà @”. Qui non abbiamo bisogno di specificare @; @ sta per “qualsiasi [any] proprietà”. Ma non possiamo dire: “Un intero finito è definito come ciò che ha ogni [every] proprietà @ posseduta da 0 e dai successori dei possessori”. Perché qui è essenziale considerare ogni proprietà [in una nota inserita a questo punto, Russell dice: «Questo è indistinguibile da “tutte [a//] le proprietà”»], non qualsiasi proprietà; e usando una simile definizione assumiamo che essa costituisca una proprietà distintiva degli interi finiti, che è proprio il genere di assunzione da cui, come abbiamo visto, scaturiscono le contraddizioni riflessive.
Ma che le funzioni proposizionali di “Mathematical logic...” non siano entità è evidente dai passaggi 21-27 del brano riportato nel paragrafo precedente, laddove Russell dice che è «possibile rimpiazzare le funzioni con le matrici» (27) della teoria sostituzionale. Le matrici della teoria sostituzionale — come “p/a”, 0 “p/a, b)” — sono solo simboli che non rinviano a nessuna entità.” Se le matrici possono prendere il posto delle funzioni proposizionali, intese ovviamente come simboli, allora la teoria di ‘Mathematical logic...” non richiede il riferimento a funzioni proposizionali in senso ontologico non linguistico, né come riferimenti degli enunciati aperti, né come riferimenti dei simboli funzionali in isolamento; tutti gli enunciati in cui compaiono simboli di funzione proposizionale, infatti, sono considerati parafrasabili in termini di enunciati che si riferiscono —
via teoria sostituzionale —
esclusivamente a proposizioni e a termini di proposizioni elementari, nel senso dei Principles, cioè nel senso di soggetti logici di proposizioni elementari. Queste sono /e uniche entità riconosciute nell’ontologia di “Mathematical logic...” Quando Russell dice che «una funzione predicativa di un argomento x (dove x può essere di qualsiasi tipo) sarà denotata da @!x (dove w, Y, 0, f. g, F 0 G possono rimpiazzare @)», intende semplicemente spiegare che, nel simbolismo di “Mathematical logic...”, “@’(0 “W?°, “XY, ecc.) seguita da un punto esclamativo è una variabile di funzione proposizionale; mentre quando dice «una funzione generale di x sarà denotata da @x», intende dire che ‘“@” non seguita da un punto esclamativo è una lettera schematica che tiene il posto di un’espressione di funzione proposizionale a piacere.
5° Russell [1908], $ II, p. 68. 57 In “On the substitutional theory of classes and relations” (1906) — laddove egli espone la sua teoria sostituzionale semplice — Russell è del tutto esplicito nel dire che le matrici sono solo simboli; riportiamo, in proposito, il passo seguente: «Quando una formula [formula] contiene matrici, la prova se essa sia significante o no è molto semplice: è significante se può essere formulata [stated] interamente in termini di entità. Le matrici non sono altro che abbreviazioni verbali o simboliche; quindi qualsiasi asserzione [statement] in cui occorrono, se ha da essere un’asserzione significante e non un semplice guazzabuglio, deve poter essere formulata senza matrici» (Russell [1906c], pp. 177-178). °8 Gli attributi (concetti), nell’ontologia di “Mathematical logic...”, sono senza dubbio considerati individui. Questa era la posizione sostenuta nei Principles, laddove “termine” e “individuo” sono considerati sinonimi (v. Russell [1903a], $ 47, p. 43) —
cosa che implica che i
concetti, i quali nei Principles sono considerati termini (v. Russell [1903a], $ 48, p. 44), siano individui. Una posizione che Russell conser-
va nel contesto della teoria dei tipi esposta nell’appendice B dei Principles: «Un termine [term] o individuo [individual] è qualsiasi oggetto [object] che non sia un decorso di valori [range]. Questo è il tipo più basso
di oggetti. Se un tale oggetto [...] compare in una proposizione, qualsiasi altro individuo può sempre essergli sostituito senza perdita di significato. [...] Sembrerebbe che tutti gli oggetti designati da singole parole, siano essi cose 0 concetti [corsivo mio], siano di questo tipo» (Russell [1903a], $ 497, p. 523).
In “Mathematical logic...”, Russell sostiene una concezione delle proposizioni simile a quella dei Principles: «In una proposizione elementare possiamo distinguere uno o più termini [terms] da uno o più concetti [concepts]; i termini sono qualunque cosa possa essere riguardata come il soggetto [subject] della proposizione, mentre i concetti sono i predicati o le relazioni asserite [asserted] di questi termini» (11). In una nota a piè di pagina, Russell rinvia qui al $ 48 dei Principles, in cui tra l’altro si dice che i concetti sono caratterizzati, rispetto alle “cose” (cioè, ai particolari), dalla possibilità di comparire in una proposizione come termini di essa o come concetti — per es., nella proposizione espressa da “L’umanità appartiene a Socrate” il concetto umano comparirebbe come termine (v. Russell [1903a], $ 48, p. 45). Dunque, secondo la posizione espressa nel paragrafo dei Principles richiamato in “Mathematical logic...”, i concetti possono essere termini delle proposizioni elementari. Poiché in “Mathematical logic...” gli individui sono definiti come «[i] termini delle proposizioni elementari» (12), è evidente che anche qui i concetti (gli universali) sono considerati individui, come i particolari.
La teoria dei tipi del 1907
631
Ma che dire, allora, dei punti in cui Russell identifica le funzioni con proprietà? Non implica questo che “funzione proposizionale” sia anche adoperato per designare attributi?” No. Semplicemente, sebbene le funzioni proposizionali di “Mathematical logic...” non siano reali entità, il parlare come se lo fossero è preso come una convenienza tecnica. «In pratica [In practice), una gerarchia di funzioni è più conveniente che una di proposizioni» (21). «Tecnicamente [Technically]», dice Russell, «è conveniente rimpiazzare il prototipo p con ga e rimpiazzare p/a'x con @x; così dove, se si fossero impiegate le matrici, p e a comparirebbero come variabili apparenti, ora abbiamo @ come variabile apparente» (28). Ma Russell è chiaro nell’ affermare che, nella teoria in esame, «possiamo evitare variabili apparenti diverse dagli individui e dalle proposizioni dei vari ordini» (22). La situazione ha un preciso parallelo nel modo in cui — in “Mathematical logic...” — sono trattate le classi: parlare di classi è comodo, e lo sviluppo simbolico dei fondamenti della matematica si svolge qui usando dei simboli come “@?, “8, ecc., che sembrano nominare classi; ma, come vedremo più avanti, la teoria di “Mathematical
logic...”, non suppone affatto l’esistenza di classi. Ebbene, Russell descrive l'introduzione di simboli che si suppone esprimano proprietà, al posto delle matrici della teoria sostituzionale, come «tecnicamente [...] conveniente» (technically convenient) (28); proprio nello stesso modo, definendo contestualmente i simboli di classe, egli dice che, sebbene la funzione f{ Z(w2)} sia, in realtà una funzione di w 2, «è tecnicamente conveniente [technically convenient] trattare f{ î (wz)} come se avesse un argomento £(w2), che chiameremo “Ila classe definita da y°».° Il riferimento alla riducibilità delle funzioni proposizionali (in senso non linguistico) alle proposizioni e ai loro soggetti logici non è affatto un’aggiunta posticcia alla teoria di “Mathematical logic0e®:9 l’intera gerarchia delle funzioni proposizionali è, infatti, filosoficamente giustificata solo sulla base del principio del circolo vizioso applicato alle proposizioni cui esse sono ridotte per mezzo della teoria sostituzionale. Infatti, poco dopo aver detto che in pratica, una gerarchia di funzioni è più conveniente di una gerarchia di proposizioni (21), Russell chiarisce che, perché «@ possa essere legittima come variabile apparente, è necessario che i suoi valori siano confinati a proposizioni di un certo tipo» (29), spiegando che «il tipo di una funzione è determinato dal tipo dei suoi valori [che sono proposizioni] e dal numero e dal tipo dei suoi argomenti» (21). 2.2.3. Il termine “individuo” è usato ambiguamente, in “Mathematical logic...”, talora per riferirsi a entità non linguistiche, talora per riferirsi a simboli che si riferiscono a queste entità. Da un lato, infatti, Russell dice che tutte
le volte «che una variabile apparente compare [occurs] in una proposizione [proposition], il campo dei valori della variabile apparente è un tipo, il tipo essendo fissato dalla funzione della quale sono interessati “tutti i valori» (2); ora, i valori di una variabile non sono, in generale, entità linguistiche, quindi gli “individui”, che, secondo
Russell, formano il primo tipo (12), non sono entità linguistiche. Inoltre, Russell dice che gli individui sono termini costituenti le proposizioni elementari, e sono i soggetti di queste proposizioni, in una spiegazione in cui egli rinvia apertamente alla trattazione del $ 48 dei Principles (11) — dove le proposizioni sono intese come entità non linguistiche contenenti fermini come entità costituenti. Ma la parola “individuo” è usata anche in un altro senso, secondo cui gli “individui” sono piuttosto simboli,
cioè variabili o costanti individuali. Per esempio, Russell dice: «Le proposizioni elementari, insieme con quelle che contengono solo individui come variabili apparenti, le chiameremo proposizioni del primo ordine» (17); oppure «Una funzione del primo ordine di un individuo x sarà denotata [denoted] da @! x» (32); oppure: «Se una tale proposizione [cioè, una proposizione del second’ordine] contiene un individuo x, non è una funzione predicativa di x» (36). In questi passaggi, è chiaro che “individuo” sta per “variabile individuale”. Nello stesso modo si deve intendere l’asserzione di Russell che le proposizioni generalizzate si ottengono «[a]pplicando il processo di generalizzazione agli individui che compaiono nelle proposizioni elementari» (15): Russell vuol dire che, dato un enunciato che esprime una proposizione elementare, possiamo ottenere un enunciato esprimente una proposizione generalizzata trasformando una costante individuale in una variabile e poi facendo entrare la variabile in un quantificatore. 2.2.4. Parallelamente a “individuo”, anche “proposizione” e “funzione” sono usati, oltre che per indicare entità, 0 pseudoentità, non linguistiche anche per indicare variabili proposizionali e funzionali. Per esempio: «Possiamo [...] formare nuove proposizioni in cui le proposizioni del primo ordine compaiono come variabili apparenti» 9 William Demopoulos trae effettivamente questa conclusione in Demopoulos [2007], p. 163, nota).
9 Russell [1908], $ VII, p. 89. © Come sostiene, per esempio, Rodrîguez-Consuegra in [1989a] (p. 158). In proposito, v. sotto, $ 4.
632
capitolo 9
(18); oppure: «L’(n + 1)-esimo tipo logico consisterà di proposizioni di ordine n, che saranno tali da contenere proposizioni di ordine n — 1, ma non di ordine più alto, come variabili apparenti» (20); oppure: «Una funzione che involge una funzione del primo ordine o una proposizione come variabile apparente sarà chiamata funzione del second’ordine» (30). Si noti che qui sono le variabili ad avere un certo ordine, non i loro valori, come sembra da
2. Lo scivolamento è palese in 13: qui, ad avere un tipo sono sia gli oggetti, sia le variabili.
2.2.5. Ma se un tipo logico è costituito dagli argomenti possibili di una funzione proposizionale (1) e se gli argomenti di una funzione proposizionale non sono altro che i valori possibili di una variabile (2), come può una variabile avere un tipo logico? La spiegazione è che Russell usa in modo ambiguo anche la parola “argomento”: da un lato, essa indica i valori assegnabili alle variabili argomentali, come, per esempio, in 1: «Un tipo è definito come il campo di significanza di una funzione proposizionale, cioè, come la collezione degli argomenti per i quali la detta funzione ha valori». Dall’altro, indica le variabili argomentali stesse, come, per esempio, in 30: «Una
funzione il cui argomento è un individuo e il cui valore è sempre una proposizione del primo ordine sarà chiamata funzione del primo ordine»; oppure in 40: «una funzione predicativa di un argomento x (dove x può essere di qualsiasi tipo) sarà denotata da @! x». 2.2.6. In conclusione, possiamo dire che, in “Mathematical logic...”, Russell intende presentare sia di una gerarchia di entità, sia di una gerarchia di simboli, senza distinguere bene tra le due gerarchie, e usando spesso gli stessi termini per riferirsi a entrambe. Da una parte abbiamo una gerarchia delle uniche vere entità che fanno parte dell’arredo ontologico del mondo: individui e proposizioni di vari ordini; specularmente a questa gerarchia, c’è una gerarchia di simboli appropriati per riferirsi a queste entità: costanti, variabili individuali ed enunciati di vari ordini. In corrispondenza con queste gerarchie, abbiamo una gerarchia di pseudoentità — le “funzioni proposizionali” o “proprietà”, assunte per mera comodità tecnica — e dei simboli che le rappresentano.
2.3. LA GERARCHIA DEGLI ORDINI: UNA PRIMA INTERPRETAZIONE 2.3.1. Cerchiamo ora di stabilire come sia strutturata, precisamente, la gerarchia degli ordini delle proposizioni e delle funzioni proposizionali proposta nel passo riportato nel $ 2.1. L’interpretazione più letterale della spiegazione di Russell sembra la seguente. Le entità presenti nell’universo — individui e proposizioni — sono suddivise in diversi tipi. Gli individui, cioè le entità non complesse (16), costituiscono il primo tipo (12). Le proposizioni elementari — che, a differenza degli individui, sono, dice Russell, entità complesse (16) — fanno parte di un tipo più alto, il secondo tipo (17). Del secondo tipo, oltre alle proposizioni elementari, fanno parte le proposizioni ottenute da queste mediante un processo di generalizzazione (7). Il processo sembra questo: si parte dall'espressione verbale di una proposizione elementare — chiamiamola ‘enunciato elementare” — contenente, oltre alle eventuali costanti logiche (che Russell, in realtà, non menziona), solo costanti per i termini della proposizione — cioè, per gli oggetti intorno ai quali verte la proposizione — che Russell chiama anche individui della proposizione,” e costanti per concetti. Se trasformiamo in variabili individuali alcune o tutte le costanti che designano individui della proposizione espressa dall’enunciato, e quindi le vincoliamo con dei quantificatori, otteniamo un nuovo enunciato, che si può considerare come esprimente una nuova proposizione. Le proposizioni così ottenute costituiscono, insieme alle proposizioni elementari, le proposizioni del primo ordine, esse formano, come si diceva, il secondo tipo logico (17). Il processo appena descritto può essere reiterato, per ottenere proposizioni del secondo ordine:
°2 Si osservi che la parola “individuo” ha qui la stessa ambiguità della parola “termine” nei Principles, laddove occorre distinguere tra i termini, in senso generale, e i termini di una proposizione. Secondo i Principles, qualsiasi costituente di una proposizione è un termine nel primo senso — cioè un’entità —, ma i termini di una proposizione sono solo i suoi soggetti logici, cioè le entità su cui la proposizione verte. Analogamente, in “Mathematical logic...” tutte le entità non complesse sono individui, in senso generale, ma gli individui di una proposizione elementare sono solo i suoi soggetti logici. © Non è netta qui — né lo sarà nella prima edizione dei Principia — la distinzione che Russell pone tra “ordine” e “tipo”. Spesso “tipo” è usato anche per distinzioni che seguendo l’uso oggi invalso, derivato dalla seconda edizione dei Principia e da Ramsey [1926a], si chiamerebbero
distinzioni di ordine. Tuttavia, in riferimento alla determinazione completa della posizione di un’entità, o di un simbolo, nella ge-
rarchia logica, nei testi menzionati è sempre usato il termine “tipo”.
La teoria dei tipi del 1907
633
Abbiamo così una nuova totalità, quella delle proposizioni del primo ordine. Possiamo allora formare nuove proposizioni in cui le proposizioni del primo ordine compaiono come variabili apparenti. Chiameremo queste proposizioni del second’ordine; esse for-
mano [form] il terzo tipo logico. [18]
Il processo inteso da Russell sembra essere il seguente. Una volta che si è stabilito che le proposizioni del primo ordine sono entità legittime, un enunciato esprimente una tale proposizione come, per esempio:
(Pa v —Pa) A (4x)(0x), dove “P” e “Q” sono costanti predicative e “a” è una costante individuale, può essere considerato come contenente delle costanti per proposizioni del primo ordine. Trasformando alcune di queste costanti in variabili, possiamo ottenere, per esempio, l’enunciato aperto:
I
]
(X vex)A(A0(0x, ENER
dove “x”
NOTE
RaCla
È
:
.
;
è una variabile per proposizioni del primo ordine. Possiamo ora vincolare
vole
“x”
pre
con un quantificatore u-
niversale; in questo modo otteniamo l’enunciato chiuso:
(x)e cv x) A Av) (0x), che esprime una proposizione del second’ordine. Questo processo, dice Russell, può essere iterato indefinitamente: Il suddetto processo si può continuare indefinitamente. L’(n + 1)-esimo tipo logico consisterà di proposizioni di ordine n, che saranno tali da contenere proposizioni di ordine n — 1, ma non di ordine più alto, come variabili apparenti. I tipi così ottenuti sono mutuamente esclusivi, e perciò le fallacie riflessive non sono possibili finché ci rammentiamo che una variabile apparente deve
sempre essere confinata entro un certo tipo. [20]
Secondo questa spiegazione, un enunciato che esprime una proposizione di ordine n, dovrà sempre, se n è maggiore di 1, contenere almeno una variabile quantificata per proposizioni di ordine n — 1, e nessuna variabile quantificata per proposizioni di ordine superiore. Russell dice che una gerarchia di funzioni proposizionali è tecnicamente più conveniente di una gerarchia di proposizioni (21, 27). La gerarchia delle funzioni è fondata sull’ipotesi che i simboli funzionali debbano essere interpretati, in realtà, come matrici. Più specificamente, un simbolo funzionale come “@” dovrebbe essere interpretato come “p/a” (se monadico) o come “p/a, b)” (se diadico), ecc., laddove “p/a” significa: “il risultato della sostituzione del termine a in p con...”, e “p/a, b)” significa “il risultato della simultanea sostituzione dei termini a e b in p con...”; un’espressione come “@x” dovrà essere interpretata come “p/a'x”, che significa: “il risultato della sostituzione del termine a in p con x”, mentre, per esempio, un’espressione come ‘“@(x, y)”? dovrà essere interpretata come “p/(a, b)'(x, y)”, che significa: “il risultato della simultanea sostituzione dei termini a e b in p con xey” (22). Poiché l’ordine di una matrice è identificato con l’ordine del suo prototipo p (23), la gerarchia delle funzioni proposizionali è formata sulla base della gerarchia delle proposizioni che costituiscono i valori di queste funzioni. Così, una funzione che ha come valori proposizioni del primo ordine sarà una funzione del primo ordine; una funzione che ha come valori proposizioni del second’ordine sarà del second’ordine; una funzione che ha come valori proposizioni del terzo ordine sarà del terzo ordine (30-37). Poiché le proposizioni del primo ordine (continuiamo a usare, per esse, la variabile “x!”) sono espresse da enunciati che non contengono variabili apparenti, oppure che contengono solo variabili apparenti per individui, ne segue che le espressioni designanti funzioni del primo ordine saranno tali da non contenere variabili apparenti, o da contenere solo variabili apparenti per individui. Una funzione del second’ordine ha come valori proposizioni del second’ordine; poiché queste proposizioni (usiamo, per esse, la variabile “x°”) devono essere espresse da enunciati contenenti variabili apparenti per proposizioni del primo ordine, e nessuna variabile apparente per proposizioni di ordine superiore, un’espressione funzionale designante una funzione del second’ordine deve contenere una variabile apparente per proposizioni del primo ordine. Una generica funzione del primo ordine monadica, secondo la teoria sostituzionale, è rappresentata da una
634
capitolo 9
matrice della forma “x'/x”, dove “x” rappresenta un individuo, e una quantificazione su funzioni del primo ordine
è interpretata come una quantificazione su “x! e su “x?. Dunque, un’espressione funzionale designante una funzione del second’ordine, dovendo contenere “x!” come variabile quantificata, può esprimere una quantificazione su proposizioni del primo ordine, o anche su funzioni del primo ordine (30). Se si usano — per convenienza tecnica, come dice Russell — lettere funzionali al posto delle matrici, una funzione del second’ordine con un posto d’argomento può avere come argomento una funzione del primo ordine. Una funzione del terzo ordine ha come valori proposizioni del terzo ordine. Poiché gli enunciati esprimenti proposizioni del terzo ordine (usiamo, per esse, la variabile “x}) devono contenere almeno una variabile quantificata per proposizioni del second’ordine (e nessuna variabile quantificata per proposizioni di ordine superiore), un’espressione funzionale designante una funzione del terzo ordine dovrà contenere una variabile apparente per proposizioni del second’ordine. Ora, secondo la teoria sostituzionale, una funzione del second’ordine di un individuo è rappresentata da una matrice della forma “x°/x”; una funzione del second’ordine di funzioni del primo ordine è invece rappresentata da una matrice della forma “x°/(x'/x)”. Dunque, una quantificazione su funzioni del second’ordine è — secondo questa teoria — una quantificazione su “2 e sufi; o.su i asuliite suio Pers tanto, un’espressione funzionale designante una funzione del terzo ordine, dovendo contenere “XY” come variabile
quantificata, può esprimere non solo una quantificazione su proposizioni del second’ordine, ma anche una quantificazione su funzioni del second’ordine. Anche qui, se si usano lettere funzionali al posto delle matrici, si ha come risultato che una funzione del terzo ordine con un solo posto d’argomento può avere come argomento una funzione del second’ordine, senza che s’incorra nella fallacia del circolo vizioso.
Si può procedere così indefinitamente. In ogni caso — secondo la presente interpretazione — un’espressione funzionale designante una funzione di ordine n, con n maggiore di 1, dovrà sempre contenere almeno una variabile quantificata per proposizioni o funzioni di ordine n — 1, e nessuna variabile quantificata per proposizioni o funzioni di ordine superiore. Questo, sembra essere, in effetti, quanto Russell esplicitamente dichiara in 30. Russell chiama predicativa una funzione di una variabile se essa è di ordine immediatamente superiore all’ordine dei suoi argomenti (31). Una funzione di più variabili è detta predicativa se «c’è una fra queste variabili rispetto alla quale la funzione diviene predicativa quando si assegnano dei valori alle altre variabili» (31). Questo è come dire che una funzione di più variabili è predicativa se è di ordine immediatamente superiore all’ordine dei suoi argomenti possibili di ordine più alto. Le funzioni del primo ordine non possono, ovviamente, essere altro che predicative (32). Le funzioni del second’ordine sono predicative se possono avere per argomenti funzioni o proposizioni del primo ordine, mentre non lo sono se possono avere come argomenti solo degli individui (36). Le funzioni del terzo ordine sono predicative se e solo se hanno come argomenti possibili delle proposizioni del second’ordine oppure delle funzioni del second’ordine che siano, a loro volta, predicative (37) — cioè siano funzioni del second’ordine che possono prendere come argomenti funzioni o proposizioni del primo ordine. Per indicare che una funzione è predicativa, Russell si serve di un punto esclamativo a seguire una lettera funzionale. Così, se “x” varia su individui, @!% è una
funzione predicativa di individui, e “@!x” dice che @! % è soddisfatta da x; analogamente, f!(@! £) è una funzio-
ne predicativa di funzioni di individui, e ‘“f!(@! *)” dice che f!(@! {) è soddisfatta da @! £.. Dal fatto che un’espressione funzionale designante una funzione di ordine n, con n maggiore di 1, debba sem-
pre contenere almeno una variabile quantificata di ordine n — 1, segue che un’espressione funzionale designante una funzione predicativa di una variabile di ordine n — 1 deve sempre contenere anche una variabile vincolata di ordinen—1.
2.3.2. Sebbene la descrizione della gerarchia delle proposizioni e delle funzioni che abbiamo appena fornito sia sviluppata aderendo strettamente a quanto Russell sembra dire nel brano che abbiamo riportato nel $ 2.1, essa non appare coerente con quanto lo stesso Russell afferma in altri punti della sua spiegazione, né con l’effettivo sviluppo della teoria sostenuta nell’articolo. Stabilirò questa tesi argomentandola in quattro punti.
(1) Quale ordine — secondo la teoria sopra esposta — bisognerebbe assegnare a una funzione come quella espressa da:
(1) Ev(p!»),
La teoria dei tipi del 1907
635
dove ‘“” è una variabile? La (1) esprime una funzione di @! î, che ha come valori proposizioni del primo ordine. Ma la (1) non può esprimere una funzione del primo ordine, perché nessuna funzione del primo ordine può avere come argomento una funzione (33); né può esprimere una funzione del second’ordine, perché un’ espressione fun-
zionale designante una funzione del second’ordine deve contenere una variabile apparente per funzioni del primo ordine (30), mentre nella (1) non è presente nessuna variabile funzionale quantificata. Per lo stesso motivo, la (1) non può esprimere funzioni di ordine superiore al secondo. Quando menziona la teoria sostituzionale, Russell dice che l’ordine di una funzione, qualora essa sia simboleggiata attraverso il metodo delle matrici, dev'essere il medesimo del prototipo (23). Poiché, nel nostro esempio, la (1) si può scrivere, nel linguaggio della teoria sostituzionale
a» p/a »)/pÈ, a); il prototipo è qui (3x)(p'/a'x), che — non contenendo, nella sua espressione verbale, altre variabili quantificate che variabili individuali — è una proposizione del primo ordine. Quindi la funzione espressa dalla (1) dovrebbe essere del primo ordine. Ma, come abbiamo visto, essa non può essere del primo ordine. Questo si può vedere anche così: se tale funzione fosse del primo ordine, essa non potrebbe essere una funzione predicativa del primo ordine, perché una funzione predicativa del primo ordine può avere come argomenti solo individui e non funzioni. Ma, secondo l’esposizione di Russell, tutte le funzioni del primo ordine devono essere predicative. (II) Un problema simile si verifica considerando una funzione di proposizioni del primo ordine come quella espressa da:
pra dove “p!” è una costante proposizionale del primo ordine e “x!” è una variabile per proposizioni del primo ordine. La (2) esprime una funzione di x', ma non può esprimere una funzione del primo ordine, perché le funzioni del primo ordine possono avere come argomenti solo degli individui — e le proposizioni, secondo ciò che dice Russell, sono di tipo diverso dagli individui. La (2) non può però neppure esprimere una funzione del second’ordine, perché non contiene nessuna variabile apparente che vari su funzioni o su proposizioni del primo ordine. Per la stessa ragione, la (2) non può esprimere una funzione di ordine superiore al secondo. Eppure, la (2) dovrebbe essere un’espressione funzionale legittima, perché, secondo Russell, un enunciato esprimente una proposizione del second’ordine come:
(DI)
(EV)
dovrebbe derivare da essa per generalizzazione (7). Consideriamo il problema da un altro punto di vista. Russell afferma che non ha importanza stabilire quale sia il tipo degli individui, perché sono solo i tipi relativi che contano, e dice che si può considerare come tipo degli individui il tipo più basso che compare in un contesto qualsiasi (13 e 14). Ma prendiamo, per esempio, la proposizione espressa da:
(piva dove “p!” e cl) “q'” sono costanti. Se consideriamo IA “p'”CE) e “q'” come costanti individuali, allora la (2) — ottenuta sostituendo la variabile “x!” alla costante “p'” — dev'essere interpretata come esprimente una funzione di individui, e (3) dev'essere interpretato come un enunciato ottenuto generalizzando su variabili individuali: ne consegue che — considerando solo tipi relativi — la (3) dovrebbe esprimere una proposizione dello stesso ordine di quella espressa dalla (4). Ma, se consideriamo invece i tipi assoluti, la proposizione espressa dalla (4) è una proposizione del primo ordine, mentre quella espressa dalla (3) è del second’ordine. Dunque, considerando i tipi relativi e quelli assoluti si ottengono risultati diversi, cosa che è in contrasto con quanto esplicitamente affermato da Russell.
636
capitolo 9
(II) Nella sua esposizione, Russell assume
che una funzione possa avere argomenti solo di ordine inferiore
all’ordine della funzione stessa (25, 36): tuttavia, la sua spiegazione implica, all’opposto, che una funzione possa avere anche argomenti dello stesso ordine della funzione stessa. Questo deriva dalla tesi di Russell secondo cui un enunciato contenente una variabile apparente ne presuppone altri da cui esso possa essere ottenuto per generalizzazione, ossia sostituendo a una delle costanti dell’enunciato originario una variabile, e quindi vincolando la variabile stessa per mezzo di un quantificatore universale. Così, per esempio, per ottenere la (3) occorre partire da un’espressione come la (4) e, in essa, trasformare dapprima “ql” in una variabile “x'”, ottenendo la (2); poi si ottiene la (3) dalla (2) vincolando “xl”. Quindi, la (2), che rappresenta una funzione di xl, è indispensabile per otte-
nere la (3): ma la (2) dovrebbe esprimere una funzione del primo ordine (perché non contiene variabili quantificate di ordine superiore a quelle per individui) che ha per argomenti proposizioni dello stesso ordine. (IV) Infine, la spiegazione della gerarchia delle funzioni proposta da Russell sembra essere in conflitto con quanto egli afferma più avanti, nello stesso testo, in connessione con la sua spiegazione dell’assioma di riducibilità. Russell scrive: Data una qualsiasi funzione proposizionale @x, di ordine qualsiasi, essa si assume essere equivalente, per tutti i valori di x a un’asserzione della forma “x appartiene alla classe @?. Ora, quest’asserzione è del primo ordine, poiché non fa allusione a “tutte le funzioni di tipo così e così”. In realtà il suo solo vantaggio pratico sull’asserzione originale @x è che essa è del primo ordine. [...] To credo che lo scopo principale cui servono le classi, e la principale ragione che le rende linguisticamente convenienti, è che esse forniscono un metodo per ridurre l’ordine di una funzione proposizionale. Non assumerò, dunque, nulla di quanto può sembrare implicato nell’ammissione delle classi fatta dal senso comune, eccetto questo: che ogni funzione proposizionale è equivalente, per tutti i suoi valori, a qualche funzione predicativa.®
Russell sostiene che l'assunzione dell’esistenza delle classi implica l'assioma di riducibilità per le funzioni monadiche: implica cioè che, data una qualsiasi funzione proposizionale monadica non predicativa, ne esiste una predicativa estensionalmente equivalente. Ma questo sarebbe falso attenendosi scrupolosamente alla precedente spiegazione della gerarchia delle funzioni; infatti, un’ espressione funzionale designante una funzione predicativa di una variabile di ordine n — 1, per n maggiore di 1, dovrebbe sempre contenere anche una variabile vincolata di ordine n — 1. Dunque, se ‘“° è una variabile di ordine n — 1, dove n è maggiore di 1, la funzione espressa da 66-22
(5)
ue a
non sarebbe una funzione predicativa di u poiché non contiene nessuna variabile vincolata dello stesso ordine di “u”. Ne segue che l’esistenza delle classi non implicherebbe l'assioma di riducibilità.
2.4. LA GERARCHIA DEGLI ORDINI: SECONDA INTERPRETAZIONE 2.4.1. L'origine comune di queste difficoltà risiede nel fatto che, seguendo le spiegazioni di Russell, abbiamo supposto che l’ordine di una proposizione dipenda solo dalle variabili vincolate che compaiono nella sua espressione verbale, e non dalle eventuali costanti. Per conseguenza, l’ordine di una funzione proposizionale viene a dipendere solo dall’ordine delle variabili vincolate che compaiono nella sua espressione verbale (enunciato aperto), e non dalle variabili libere. È possibile che Russell intendesse dire qualcosa di un po’ diverso da quanto, di fatto, sembra dire? È possibile che intendesse dire che l’ordine di una proposizione non dipende solo dall’ordine delle variabili vincolate che compaiono nell’enunciato che la esprime, ma anche dall’ ordine delle costanti che si trovano in esso? Esploriamo questa possibilità, tornando a prendere in esame il modo in cui — secondo l’esposizione di Russell — gli enunciati generalizzati si ottengono da enunciati semplici. Riprendiamo in considerazione, per esempio, l’enunciato seguente:
° Nel $ VI di “Mathematical logic...” Russell afferma esplicitamente che «gli argomenti di una funzione sono sempre di tipo più basso della funzione» (p. 88).
© Russell [1908], $ V, pp. 81-82.
La teoria dei tipi del 1907 (1)
637
(Pav-Pa) AK (4x(0x),
dove “P” e “O” sono costanti predicative e “a” è una costante individuale. Quest’enunciato, senza dubbio, esprime una proposizione del primo ordine. Nel $ 2.3.1, avevamo interpretato il processo di generalizzazione, applicato a quest’enunciato, come segue: si considera “Pa” come una costante che denota una proposizione del primo ordine; trasformando questa costante in variabile, otteniamo l’enunciato aperto:
(2) (e v-x)) A (An(0x), dove
(3
“x”
CO
3) a
è una variabile proposizionale del primo ordine. Possiamo ora vincolare I
.
DI
.
.
.
.
.
.
“x”, ottenendo:
(13
1a»
v- x!) A A”)(0x),
che — contenendo una variabile apparente per proposizioni del primo ordine — esprime una proposizione del second’ordine. Si deve tuttavia osservare che parte delle spiegazioni fornite da Russell sono incompatibili con il considerare “Pa”, in (1), come una costante che designa un termine della corrispondente proposizione lasciando, nel contempo, immutato l’ordine della proposizione espressa. Russell, infatti, afferma che gli enunciati del primo ordine devono essere enunciati elementari, oppure enunciati derivati da questi per generalizzazione (17), e quindi possono contenere, come costanti non logiche, solo le costanti non logiche che possono essere contenute in un enunciato elementare, ossia costanti individuali (12); ma nessun individuo — afferma Russell — è una proposizione (16), e quindi gli enunciati elementari non possono contenere costanti per proposizioni. Si deve concludere — seguendo questa linea di ragionamento — che gli enunciati che contengono costanti che designano proposizioni del primo ordine non possono essere del primo ordine, ma devono essere di ordine superiore. Se l’idea di Russell era questa, allora (1) sarebbe un enunciato del primo ordine; ma l’enunciato in cui “Pa” è considerato come una costante designante termini della corrispondente proposizione non sarebbe, a sua volta, un enunciato del primo ordine, ma del secondo. In altre parole, se “p'” è una costante proposizionale del primo ordine,
(4) (p'v = p') A Av(0v) sarebbe — per Russell — un enunciato del second’ordine. Di conseguenza, (2) esprimerebbe una “funzione proposizionale” (una proprietà) del second’ordine. Infatti, la (2) si scriverebbe, nel linguaggio delle matrici, come segue:
(5) (pv pi) A Av(0)p'x: dove il prototipo è del second’ordine; e, siccome l’ordine di una funzione, dice Russell, dev'essere il medesimo dell’ordine del suo prototipo (23), ne segue che la funzione espressa da (2) dovrebbe essere una funzione del second’ordine. Si può dunque supporre che Russell intendesse sostenere una teoria come la seguente: l’ordine di un enunciato dev'essere superiore non solo all’ordine delle sue variabili vincolate, ma anche all’ordine delle sue costanti; di conseguenza, l’ordine di un’espressione funzionale dev'essere superiore non solo all’ordine delle sue variabili vincolate, ma anche all’ordine delle sue variabili libere; se è così, un'espressione funzionale di ordine n non deve
necessariamente contenere variabili vincolate di ordine n — 1, ma può essere anche un’espressione funzionale che contiene variabili libere (reali) di ordine n — 1. Quest’interpretazione della teoria di Russell sembra rimuovere le difficoltà (I-IV) sopra menzionate. Attenendosi ad essa diviene chiaro il motivo per cui Russell, nel corso di tutta la sua spiegazione (25, 36), non prenda in considerazione la possibilità che una funzione possa avere argomenti dello stesso ordine di se stessa: infatti, che una funzione debba avere sempre un ordine superiore ai suoi argomenti, deriva, in quest’interpretazione, semplicemente dal fatto che l’ordine della proposizione che costituisce il prototipo della funzione dev'essere superiore non solo all’ordine delle eventuali variabili vincolate che compaiono nella sua espressione verbale, ma anche all’ordine dei suoi termini, ovvero all’ordine delle costanti non logiche che compaiono nella sua espressione verbale.
638
capitolo 9
Una volta interpretata in questo secondo modo, la teoria dei tipi del 1907 diviene virtualmente identica, nel suo sviluppo tecnico, alla teoria dei tipi del 1910. Questo sembra essere un ulteriore argomento a favore di tale interpretazione: infatti, quando, in “La théorie des types logiques” (1910),°° Russell espone la teoria dei tipi adottata nei Principia, la presenta, nelle poche parole introduttive all’inizio dell’articolo, come una semplice spiegazione migliore della teoria esposta nel 1907 in “Mathematical logic...”. 2.4.2. Restano tuttavia alcune difficoltà, in quest’interpretazione della teoria di “Mathematical logic...”. cipale è che il principio secondo cui l’ordine di una proposizione dovrebbe essere superiore all’ordine termini non sembra giustificato dal principio del circolo viziuso; infatti, l’uso di un nome non richiede mento alla totalità delle entità cui appartiene l’entità nominata. Un’altra difficoltà è che, in quest’interpretazione, occorre distinguere tra la proposizione espressa, per da: (6)
La prindei suoi un riferiesempio,
Pav-Pa,
dove ‘“P” è una costante predicativa e “a” è una costante individuale, e la proposizione espressa da: DI
GG
29
&
(Donini anche laddove “p!” è una costante per la stessa proposizione espressa da “Pa”. Ma non sembra possibile dare nessun senso a una tale distinzione, all’interno della semantica russelliana. Il problema è che una proposizione (in senso ontologico) come quella espressa da (6) ha come costituenti delle proposizioni (in senso ontologico) che hanno, a loro volta, come costituenti “cose” (things) e qualità. Considerarla come costituita di proposizioni o di costituenti di proposizioni appare come chiedersi se si deve considerare, per esempio, un mucchio di sassi come costituito di atomi o molecole: dipende solo di dove ci si ferma nell’analisi. Dobbiamo dire che, per esempio, «199 Lola «1 ‘p” compare in “p” come costante? Se sì, “p ” dovrebbe essere di ordine superiore a se stesso; se no, non si riesce più a dare un senso a sostituzioni come:
(8) pp'iq', dove
‘“q ”, come
(13
13»
“p ”’, è una costante per proposizioni del primo ordine, o come:
(43
13
ES
(O). co
139 x
dove “x” è una variabile per proposizioni del primo ordine. Eppure, la sostituzione (8) è necessaria per affermare l’identità p' = g', secondo la definizione della teoria sostituzionale (infatti, GGssil=a “p' = 9g!” dovrebbe essere interpretato come: “p'/p''q'!p" (“I risultato della sostituzione di p! in p' con q! è p’’))” —; mentre la (9) appare necessaria per ottenere un enunciato della forma “(x') x!”, affermante che tutte le proposizioni del primo ordine sono vere?
— infatti, ‘(x')x!” dovrebbe essere: “(x1) (pp! x)? 2.4.3. La conclusione parrebbe dunque questa. In “Mathematical logic...”, Russell dà una spiegazione della gerarchia degli ordini delle proposizioni e delle funzioni proposizionali — basata sul principio del circolo vizioso — secondo la quale l’espressione verbale di una proposizione di ordine n (maggiore di 1) deve sempre contenere variabili vincolate di ordine n — 1 (18, 20), e, di conseguenza, l’espressione verbale di una funzione proposizionale di ordine n deve sempre contenere variabili vincolate di ordine n — 1 (posizione, questa, che appare confermata in 30). Tale spiegazione, tuttavia, non si armonizza con lo sviluppo della teoria dei tipi in “Mathematical logic...”,
°© V. Russell [1910c]. Il testo di quest'articolo corrisponde quasi parola per parola a quello dell’introduzione dei Principia, da p. 37 a p. 60.
9? V_ Russell [1906c], p. 169. x
° I ’espressione “(p)p” è considerata legittima da Russell, che ne fa uso in “The theory of implication” (v., per es., Russell [1906b], p. 193), uno scritto pubblicato l’anno precedente a quello della stesura di “Mathematical logic...”. SIAVA sopra, cap. 8, $ 4.1.1.
La teoria dei tipi del 1907
639
che sembra far riferimento a una gerarchia di proposizioni formata anche tenendo conto delle costanti che compaiono nella loro espressione verbale — sebbene questo non scaturisca dal principio del circolo vizioso. Come ha messo in luce Landini ([1998a], $ 9.0, pp. 234-240), i manoscritti dell’epoca rivelano un Russell 0scillante riguardo all’attribuzione di ordini alle proposizioni. Landini riporta che uno degli approcci presi in considerazione da Russell nel manoscritto “The paradox of the liar”, del settembre 1906, è il seguente:
La regola è: In p—!g a
[variante notazionale di “p/a'b! g”, cioè “Il risultato della sostituzione di a in p con b è 97], p e qg sono di or-
dine più alto di 5 e a, e p — ! q è dell’ordine immediatamente successivo a p e g.”° a
Qui Russell sembra sostenere la tesi secondo cui:
(A) L'ordine di una proposizione dev'essere superiore non solo all’ordine delle variabili vincolate che compaiono nella sua espressione verbale, ma anche all’ordine dei suoi termini (ovvero all’ordine delle costanti che compaiono nella sua espressione verbale). Ma, in un manoscritto del 1907 intitolato “On types”, Russell riconsidera questa decisione: [...] nel ms. “Paradox of the liar”, adottai il punto di vista che p' Sg q' [variante notazionale di “p'/a'x! g!”, cioè “Il risultato della a
sostituzione di a in p' con x è g!”] fosse una proposizione del 2° ordine. Penso che questo fosse un errore. L'ordine di una proposizione deve dipendere solo dalle v. a. [variabili apparenti] che contiene. Se è così, abbiamo tuttavia una difficoltà. Abbiamo stabilito che in p/a, p dev'essere di ordine più alto di a. Pertanto (p—!g9)—
[cioè “Il risultato della sostituzione di p con r nella proposizioa P ne espressa da ‘Il risultato della sostituzione, in p, di a con x è g’”] sarà un nonsenso. Forse ciò non è importante. Un argomento AO. , è r 3 simile si applica a p > g. Così (p > g) — sarà un nonsenso. p
Penso che sia un errore dire che p dev'essere di ordine più alto dell’a: tutto ciò che è davvero necessario è che esso non sia di or-
dine più basso. Allora p/p sarà significante [significant], e così saranno (p > 9g) Sa (p 2A q) Z.m p a 5
7
y
È
colle
cet,
1
1
,
Qui Russell rifiuta la tesi secondo cui la proposizione espressa da “p /a'x! qg 7°, dove p, g e a sono costanti, debba essere del second’ordine; egli sostiene adesso che: 1a»
(A’) L’ordine di una proposizione deve dipendere solo dalle variabili apparenti contenute nella sua espressione verbale. Egli è però consapevole che sostenere (A.’) e anche: (B)
Una proposizione dev'essere di ordine più alto dei termini che, in essa, possono essere sostituiti con altri termini,
ha conseguenze apparentemente inaccettabili: data un'espressione come “(p' > g')/p''r!” (“Il risultato della sostituzione, nella proposizione espressa da ‘p' > g!”, di p' con r”), dove “p! “q!” e “r” siano costanti per proposizioni del primo ordine, avremmo che la proposizione espressa da “p' > q'” — non contenendo, nella sua espressione verbale, nessuna variabile apparente — dovrebbe essere, per (A”), del primo ordine; ma tale proposizione dovrebbe essere, per (B), del second’ordine — poiché in essa è possibile sostituire un termine del primo ordine con un altro. Quindi l’espressione “(p! > q')/p!'r!” dovrebbe essere un nonsenso. Si noti che qui Russell nota precisamente una difficoltà dello stesso genere di quelle che abbiamo rilevato nel $ 2.3.2. La soluzione offerta da Russell consiste nel rimpiazzare il principio (B) con: 153
70 Russell [1906g], pp. 354. Il passo dal ms. di Russell (f. 77) è riportato in Landini [1998a], $ 9.2, p. 237. 7 Russell [1907e], pp. 516-517. Il passo dal ms. di Russell (f. 5) è riportato in Landini [1998a], $ 9.2, p. 238.
capitolo 9
640
(B’) Una proposizione non dev'essere di ordine più basso dei termini che, in essa, possono essere sostituiti con altri termini. q'/p''r!”, esprimerà una proposizione del primo ordine, e il Sulla base delle regole (A) e (B?), “p' > GOT problema sarà eliminato. Russell resta tuttavia incerto: solo alla pagina successiva dello stesso manoscritto, egli ritorna alla tesi (B). Landini ne riporta il brano saliente: Ò % i Sa ARR ; PRETE ig E Penso che sia meglio dire che in p — ! q il p e il qg devono essere di ordine più alto di x e a, e che p — ! q dev'essere dello stesso ora a
dine di p e qg.”° Russell sostiene qui che la proposizione espressa da “n'/a'x!q'” dovrebbe essere del primo ordine; quindi egli ritiene che l’ordine di una proposizione non debba essere superiore all’ordine dei suoi termini, ma solo all’ordine delle variabili quantificate contenute nella sua espressione verbale. Russell continua dunque a respingere (A) e a sostenere (A ’); ma ora preferisce (senza indicarne i motivi) (B) a (B”). Naturalmente, il sostenere (A) e (B) contemporaneamente, riconduce alla conseguenza che espressioni come “(' > q'Y/p'r” tornano ad essere assurde, e questo è un problema per il quale Russell non ha nessuna soluzione. In “Mathematical logic...”, Russell oscilla tra una spiegazione ufficiale basata su (A’) e (B) e una posizione ufficiosa basata su (A) e (B) la quale rende lo sviluppo tecnico della teoria dei tipi indistinguibile da quello dei
Principia.” 3. LA SOLUZIONE DEI PARADOSSI “SEMANTICI” Dopo aver esposto la teoria dei tipi, nel brano che abbiamo riportato nel $ 2.1, e prima di aver discusso l’argomento delle classi, Russell è già in grado di proporre, nell’ultima parte del $ IV di “Mathematical logic...”, una soluzione di alcuni paradossi che — secondo il modo di vedere divenuto standard — sarebbero definiti “semantici”.?* Russell non riscontra, in paradossi come quelli di Epimenide, Berry, e Richard, una natura sostanzial-
mente diversa da quella delle antinomie che, oggi, si definiscono usualmente “logiche” (o insiemistiche): essi sono, per lui, paradossi che riguardano la logica, in senso pieno, e che devono pertanto essere risolti nello stesso
quadro teorico che consente di far fronte i paradossi “logici”. Com'era già stato accennato da Russell in 19, il paradosso di Epimenide è risolto ricorrendo alla gerarchia degli ordini di proposizioni.” Secondo la soluzione prospettata, Epimenide non può affermare semplicemente: “C'è una proposizione che sto affermando e che è falsa”, perché ciò implicherebbe un riferimento alla totalità delle proposizioni di tutti gli ordini, in violazione del principio del circolo vizioso. Epimenide deve dunque specificare l’ordine delle proposizioni cui si riferisce, ma con ciò il paradosso scompare. Per esempio, se Epimenide afferma: “C'è una proposizione del primo ordine che sto affermando e che è falsa”, egli non asserisce una proposizione del primo ordine, ma del secondo, perché la proposizione da lui affermata contiene una quantificazione su proposizioni del primo ordine. Quindi Epimenide sta affermando una proposizione falsa; ma da ciò non si può concludere che egli sta, al tempo stesso, dicendo il vero, proprio perché questa proposizione falsa è del second’ordine, non del primo ordine come egli afferma. Russell passa quindi a trattare il paradosso di Berry, cioè il paradosso relativo al “più piccolo intero non nominabile con meno di ventisei sillabe”. A questo proposito, Russell osserva, in primo luogo, che la parola “nomina-
7? Russell [1907e], p. 517. Il passo dal ms. di Russell (f. 6) è riportato in Landini [1998a], $ 9.2, p. 240.
î3 Nei Principia, i problemi filosofici cui dà origine il principio (A) sono superati grazie al fatto che — come vedremo — la gerarchia degli ordini degli enunciati chiusi è basata sulla gerarchia degli enunciati aperti e non viceversa: nei Principia, l’ordine di un enunciato aperto dev’essere superiore sia all’ordine delle variabili quantificate che occorrono in esso, sia all’ordine delle sue variabili libere; un enunciato chiuso di ordine n è ciò che si deriva da un enunciato aperto di ordine n vincolando tutte le variabili libere contenute in esso con quantificatori universali.
74 V. Russell [1908], $ IV, pp. 79-80. 75 V. Russell [1908], $ IV, p. 79.
La teoria dei tipi del 1907
641
bile” deve significare “nominabile per mezzo di tali e tali nomi dati”, e che il numero di questi nomi dev'essere finito, perché «se non è finito, non vi è ragione per cui dovrebbe esserci un qualsiasi intero non nominabile in meno di ventisei sillabe [nel testo originale “nineteen syllables”] e il paradosso crolla».”° Quindi, Russell prosegue: Possiamo quindi supporre che “nominabile in termini di nomi della classe N° significhi “che è l’unico termine che soddisfa qualche funzione composta interamente di nomi della classe N”. La soluzione di questo paradosso risiede, io penso, nella semplice osservazione che “nominabile in termini di nomi della classe N° non è mai esso stesso nominabile in termini di nomi di quella classe. Se allarghiamo N aggiungendo il nome “nominabile in termini di nomi della classe N”, il nostro apparato fondamentale di nomi è allargato; chiamando il nuovo apparato N', “nominabile in termini di nomi della classe N” rimane non nominabile in termini di nomi
della classe N'. Se cerchiamo di allargare N fino ad abbracciare tutti i nomi, “nominabile” diviene (per ciò che si è detto sopra) “che è il solo termine soddisfacente qualche funzione composta interamente di nomi”. Ma qui c’è una funzione come variabile apparente; quindi siamo confinati a funzioni predicative di un certo tipo (perché le funzioni non predicative non possono essere variabili apparenti). Quindi dobbiamo solo osservare che la nominabilità nei termini di tali funzioni è non predicativa per sfuggire al para-
dosso.” La soluzione del paradosso di Berry non è esposta con molta chiarezza.’ Suppongo che Russell intendesse dire che un nome “a”, o una descrizione ‘“( 1) (0x7, “nominano”, in senso lato, un'entità x se esiste qualche espressione funzionale della forma “(7x)(@x)= 2”, o “a= 2” soddisfatta solo da x. Ritengo cioè che con «funzione composta interamente di nomi della classe N» Russell intendesse una funzione proposizionale, soddisfatta da
un'unica entità, nella cui espressione verbale compaiano — oltre alle costanti logiche e alle variabili — solo nomi o descrizioni di una classe N di nomi e descrizioni definite. Se è così, allora Russell interpreta “x è nominabile
(con nomi della classe N)” come “x soddisfa una funzione nella cui espressione verbale compaiono solo nomi (della classe N) e simboli logici”. L'espressione funzionale che dà origine alla contraddizione, cioè quella espressa da “2 è il più piccolo intero non nominabile con meno di ventisei sillabe”, si dovrebbe quindi parafrasare: (*)
2 è uguale al più piccolo intero tale che non esiste una funzione soddisfatta solo da 7 la cui espressione verbale contenga, come uniche costanti non logiche, solo nomi o descrizioni definite più brevi di ventisei sillabe.
(*) può essere soddisfatta da un unico numero e, se è così, l’espressione “il più piccolo intero non nominabile con meno di ventisei sillabe” — cioè “il più piccolo intero tale che non esiste una funzione, ecc.” — “nomina” (in senso lato: nomina o descrive) effettivamente un numero. Tuttavia, per la teoria dei tipi, (*) esprime una funzione di un ordine superiore a quelle su cui varia la sua variabile funzionale quantificata. Dunque, nell’espressione verbale di queste ultime funzioni non può comparire la descrizione “il più piccolo intero non nominabile in meno di ventisei sillabe”. Quindi, anche se quest’espressione “nomina” effettivamente un numero, essa non fa parte dei “nomi” di cui si dice che non nominano x in meno di ventisei sillabe — cosicché il paradosso non sorge. Dopo aver proposto la sua soluzione al paradosso di Berry, Russell passa a discutere brevemente il paradosso di Richard: Qui, come prima, “definibile” che dev'essere relativo a un dato apparato d’idee fondamentali [fundamental ideas]; e vi è ragione di
supporre che “definibile in termini d’idee della classe N” non sia definibile in termini d’idee della classe N. Sarà vero che c’è qualche definito segmento della serie degli ordinali consistente interamente di ordinali definibili e avente il più piccolo ordinale indefinibile come suo limite. Questo più piccolo ordinale indefinibile sarà definibile con un piccolo allargamento del nostro apparato fondamentale; ma ci sarà allora un nuovo ordinale che sarà il più piccolo ad essere indefinibile con il nuovo apparato.*°
Anche qui, come nel caso dei nomi, Russell ritiene che, se non si suppone che il numero d’idee fondamentali sia finito, il paradosso non si produce più: Se allarghiamo il nostro apparato in modo tale da includere tutte le idee possibili, non vi è più alcuna ragione di credere che vi sia alcun ordinale indefinibile."
7° Russell [1908], $ IV, p. 79.
ml Ibid. 1: 78 Per la soluzione a questo paradosso prospettata da Russell nei Principia, v. sotto, cap. 11, $ 4.4. ?° Naturalmente, perché il paradosso di Berry funzioni, occorre includere nei “nomi” — in senso lato —anche le descrizioni definite.
30 Russell [1908], $ IV, p. 80. Sl Ibid.
642
capitolo 9
In questa sezione di “Mathematical logic...” Russell non menziona il paradosso di Kònig — che dovrebbe, si può supporre, ricevere una soluzione simile a quelli di Berry e di Richard. In conclusione, sembra che la teoria di “Mathematical logic...” consenta di evitare i paradossi “semantici”. Per comprendere come tale teoria consenta di evitare i paradossi di Russell, Cantor e Burali-Forti — permettendo, nello stesso tempo, una costruzione della matematica pura — dobbiamo però inoltrarci un po” di più in essa.
4. L’ONTOLOGIA DELLA TEORIA DEI TIPI DEL 1967 Prima di procedere, fermiamoci un momento a riconsiderare le opposte interpretazioni presenti in letteratura — cui abbiamo accennato nel cap. 8, $ 4.4.6 — della base ontologica della teoria dei tipi di “Mathematical logic...”. Per Cocchiarella ([1980], $ 8, [1987b], p. 196 e p. 199), Landini ([1987], [1989], [1998a], cap. 9, [2003]), Klement ([2004a], pp. 21-22), Stevens ([2005], cap. 2, pp. 49-50, e cap. 3, pp. 62-63), e Proops [2011], pp. 193194), questa teoria è ancora basata sull’assunzione delle proposizioni come entità, mentre le funzioni proposizionali, in senso ontologico, sono considerate del tutto eliminabili con il metodo delle matrici e sarebbero assunte nell’esposizione per mera comodità notazionale.
Secondo Rodriguez-Consuegra
([1989a], [2005]), all’opposto,
Russell sarebbe giunto a considerare le proposizioni come non-entità già nel 1906, e la teoria di “Mathematical logic...’ sarebbe basata — come quella dei Principia — sull’assunzione delle funzioni proposizionali come entità non linguistiche. La tesi di Rodriguez-Consuegra appare forzata rispetto a un testo in cui Russell dice esplicitamente che è possibile ridurre le funzioni proposizionali a matrici, e di non operare con questa riduzione solo perché è «tecnicamente scomoda» (technically inconvenient) (27), laddove, «tecnicamente», o «in pratica», una gerarchia di funzioni è
«più conveniente» di una gerarchia di proposizioni (21, 31). Se fosse corretto quanto afferma RodriguezConsuegra non si comprende perché Russell avrebbe dovuto camuffare le sue nuove convinzioni ontologiche parlando di semplici “motivi tecnici” e di convenienza pratica. Non si può spiegare questo — come fa RodrîguezConsuegra* — obiettando che non sarebbe stato opportuno per Russell dilungarsi in questioni filosofiche in un articolo scritto per una rivista matematica. Infatti, se il solo problema fosse stato quello di evitare lunghe argomentazioni filosofiche, Russell avrebbe semplicemente potuto, senza alcun rischio per l’intelligibilità dello sviluppo della teoria, omettere qualsiasi riferimento alla sua precedente teoria sostituzionale. Egli invece non solo menziona questa teoria, ma non avanza contro di essa nessuna riserva, tranne quella di essere “tecnicamente scomoda”. Rodrîguez-Consuegra, naturalmente, non può negare che Russell affermi che è possibile sostituire le funzioni proposizionali con matrici, secondo il dettato della teoria sostituzionale, ma sostiene che egli «infine respinge questa possibilità»* sulla base del fatto che, nello sviluppo della teoria, l’idea di “funzione proposizionale” è assunta come primitiva. È vero che, nel $ VI di “Mathematical logic...”, intitolato “Idee e proposizioni primitive della logica simbolica” (Primitive ideas and propositions of symbolic logic), Russell assume, come prima di sette idee primitive, l’idea di «Qualsiasi funzione proposizionale di una variabile x o di più variabili x, y, z, ...»;5° è anche vero che nella lista delle idee primitive non figura la nozione di “proposizione”. Ma è falso che Russell respinga la possibilità di sostituire le funzioni proposizionali con matrici. Ciò non è implicato dall’ assumere la nozione di “funzione proposizionale”’ come primitiva. Assumere un’idea come primitiva nell’ambito dello sviluppo formale di una teoria non comporta, di per sé, che quest'idea debba essere considerata irriducibile: può significare soltanto che si giudica per il momento opportuno fare così, per esempio, per non dilungarsi troppo su questioni filosofiche. L'assunzione da parte di Russell delle funzioni proposizionali come idee primitive non può dunque costituire, di per sé, l’indizio di una revoca di quanto egli aveva affermato poco prima sulla loro riducibilità da altre entità. Rodriguez-Consuegra afferma che in “Mathematical logic...” «c'è solo una menzione superficiale della teoria sostituzionale [...] che può benissimo essere omessa senza nessun pericolo per il funzionamento della presentata 82 Anzi, come abbiamo visto alla fine del precedente capitolo, secondo Rodriguez-Consuegra sarebbe stato proprio il rifiuto delle proposizioni come entità a portare Russell dalla teoria sostituzionale alla teoria dei tipi del 1907. SVI Rodriguez-Consuegra [1989a], p. 157, nota 25, e Rodriguez-Consuegra [2005], $ 6.
#4 Rodrîguez-Consuegra [1989a], p. 156.
8° Russell [1908], $ VI, p. 83.
La teoria dei tipi del 1907
643
teoria dei tipi nel suo complesso».* Ma proprio per questo si può supporre che, se Russell ritenne opportuno menzionare la teoria sostituzionale — con una certa ampiezza e in un articolo scritto per una rivista matematica — è plausibile che avesse qualche motivo per farlo; e questo motivo, secondo la nostra interpretazione, è che l’ontologia di “Mathematical logic...” assume individui e proposizioni come le effettive entità cui le cosiddette “proprietà” sono riducibili. La conclusione da trarne è che la tesi corretta sia quella di Cocchiarella e Landini. Ciò non implica che Russell non avesse, all’epoca di “Mathematical logic...”, forti dubbi sulle proposizioni come entità. L'esame di alcuni manoscritti russelliani del 1906-07 condotta da Rodriguez-Consuegra”” mostra in effetti un Russell sempre più incline a considerare le proposizioni come pseudoentità. È probabile che l’asserita riducibilità delle espressioni funzionali a matrici, insieme allo sviluppo di una teoria basata sull’idea primitiva di funzione proposizionale, fosse un modo adottato da Russell per lasciare aperta una questione filosofica per lui non del tutto decisa, senza con ciò pregiudicare lo sviluppo tecnico della teoria dei tipi.
5. L’ASSIOMA DI RIDUCIBILITÀ Il significato della gerarchia dei tipi di funzioni proposizionali stabilita in “Mathematical logic...” è il seguente: non è legittimo parlare di tutte le funzioni proposizionali, o di tutte le proprietà, senza qualificazioni, perché le funzioni proposizionali — le proprietà — sono di tipi diversi. Tutto ciò che si può fare è parlare di tutte le funzioni proposizionali, o di tutte le proprietà, di un determinato tipo. Russell tuttavia osserva che questo principio, sebbene consenta di evitare i paradossi, si rivela troppo restrittivo per consentire una fondazione logicista della matematica; esso impedirebbe, per esempio, la definizione (di Frege-Russell) di “numero naturale”: Possiamo dire, usando uno qualsiasi invece di tutti, “Una proprietà posseduta da 0, e dai successori di tutti i numeri che la possiedono, è posseduta da tutti i numeri finiti”. Ma non possiamo continuare: “Un numero finito è un numero che possiede tutte le proprietà possedute da 0 e dai successori di tutti i numeri che le possiedono”.8*
Il motivo è che non possiamo parlare di tutte le proprietà, senza qualificazioni, perché non esiste una simile totalità. Possiamo al più parlare di tutte le proprietà di un determinato tipo, ma ciò non è sufficiente a darci la definizione voluta; per esempio: Se limitiamo la nostra asserzione a tutte le proprietà del primo ordine dei numeri, non possiamo inferire che questo vale per le proprietà del second’ordine. Per esempio, non riusciremo a provare che, se 72 e n sono numeri finiti, allora m + n è un numero finito. Infatti, secondo la definizione precedente, ‘mn è un numero finito” è una proprietà del second’ordine di m; quindi il fatto che m +0 sia un numero finito, e che, se 71+ n è un numero finito, altrettanto sia 71+
+ 1, non ci permette di concludere per induzione che
m+ n è un numero finito.
«È ovvio», commenta Russell, «che un tale stato di cose rende impossibile molta della matematica elementare». Si rende quindi necessario — come già era accaduto nella prima teoria sostituzionale ramificata — porre un assioma con l’effetto di ridurre gli ordini delle funzioni proposizionali: l'assioma di riducibilità. Quest’assioma stabilisce che ogni funzione proposizionale di una o di due variabili è equivalente a una funzione predicativa delle stesse variabili. Per le funzioni di una sola variabile abbiamo, in simboli:
AP
(P!1y= I).
Per le funzioni di due variabili abbiamo:
d0)MM(P! (xy) = vx, Y). *° Rodriguez-Consuegra [1989a], p. 158. 8 V. Rodriguez-Consuegra [1989a], $ 6, e Rodriguez-Consuegra [2005], $ 6.
88 8° °0 2!
Russell [1908], $ V, p. 80. Russell [1908], $ V, pp. 80-81. Cfr Russell [1906d], $ III, p. 211-212. Russell [1908], $ V, p. 81. V. Russell [1908], $ VI, p. 87.
644
capitolo 9
Russell osserva che, volendo, si potrebbe estendere la validità dell’assioma di riducibilità alle funzioni iuipiù variabili, ma non lo fa, perché queste assunzioni non si rivelano necessarie allo sviluppo della matematica.” Il cosiddetto “assioma di riducibilità” non è però costituito di due assiomi, ma piuttosto di due schemi d’assiomi, ciascuno dei quali si ottiene dalla sostituzione di un’effettiva espressione funzionale al simbolo “w?.
Detto altrimenti, la lettera “y”, così come compare in quelli che Russell chiama “assioma di riducibilità”, non è una variabile, ma una lettera schematica: essa non può, in nessun caso, figurare in un quantificatore. Non si potrebbe, per es., formulare l’assioma, per le funzioni monadiche, in questo modo:
(Maip)M)(P!y= Vv), senza contraddire l’essenza stessa della non è che un portato della sua mancata simbolo, in un certo contesto, sia inteso plice: basta chiedersi se sia legittimo —
teoria dei tipi. Che Russell non distingua tra assiomi e schemi d’assiomi distinzione tra variabili libere e lettere schematiche. Ma per capire se un da Russell come variabile libera o lettera schematica l'algoritmo è semsecondo la teoria di Russell — far entrare il simbolo in un quantificatore:
se sì, abbiamo una variabile autentica, altrimenti si tratta di una lettera schematica.
L’assunzione dell’assioma (schema d’assiomi) di riducibilità per le funzioni monadiche permette di superare lo scoglio relativo, per esempio, alla definizione di “numero finito”. Possiamo infatti dire: “Un numero naturale è qualcosa che ha tutte le proprietà predicative possedute da 0 e dai successori di tutti i numeri che le possiedono”, perché — via riducibilità — una proprietà qualsiasi (di qualsiasi ordine) dei numeri naturali dev'essere formalmente equivalente a una proprietà predicativa degli stessi. L'assioma consente anche di conservare la definizione di “x= y” già fornita nei Principles, e cioè: «Ogni funzione proposizionale che vale per x vale anche per y>.® In assenza dello schema di riducibilità, questa definizione andrebbe perduta, nella teoria di “Mathematical logic...”’; infatti, se si quantifica solo su funzioni predicative, la definizione:
x=Y=a
(P)(0!x 3 Py)!
è certo legittima ma, senza schema di riducibilità, non dà quanto richiesto: x e y potrebbero condividere tutte le proprietà predicative, ma non condividere qualche proprietà non predicativa, essendo dunque entità distinte. Lo schema d’assiomi ha l’effetto di eliminare questa possibilità, rendendo la definizione adeguata; infatti, come osserva Russell, «Dall’assioma di riducibilità segue che se x soddisfa wx, dove w è una funzione qualsiasi, predicativa o non predicativa, allora y soddisfa yy».” L’effetto complessivo dell’assioma di riducibilità è di eliminare le distinzioni tra ordini in tutti i contesti estenstonali. In tali contesti, il tipo di una funzione è deciso esclusivamente dal tipo delle sue variabili argomentali. Potrebbe dunque sembrare che l’aggiunta di tale assioma abbia l’effetto di trasformare la teoria ramificata dei tipi in una teoria semplice dei tipi simile a quella proposta da Russell nei Principles. Ma non è così: mentre, infatti, la teoria semplice dei tipi non riesce a impedire il presentarsi di paradossi “semantici”, la teoria ramificata dei tipi con riducibilità li blocca. È lo stesso Russell a sottolinearlo: Si potrebbe pensare che i paradossi a causa dei quali abbiamo inventato la gerarchia dei tipi ora riappaiano. Ma non è così, perché, in tali paradossi, o è pertinente qualcosa oltre la verità o la falsità dei valori delle funzioni, oppure compaiono espressioni [expressions] che sono senza significato [unmeaning] anche dopo l’introduzione dell’assioma di riducibilità.?°
Il punto è che l'assioma di riducibilità garantisce che a ogni funzione proposizionale ne corrisponda una predicativa estensionalmente equivalente — non una identica; pertanto la gerarchia degli ordini è accantonata solo nei contesti estensionali, laddove si rivela un ostacolo insormontabile allo sviluppo della matematica classica. Ma i paradossi “semantici” sorgono in contesti non estensionali, dove la gerarchia degli ordini continua a funzionare. Russell fa quest’esempio:
?2 V. Russell [1908], $ V, p. 82. 9 Russell [1903a], $ 338, p. 356. 9 V. Russell [1908], $ VI, p. 85. V. anche [PM], vol. I, introduzione, cap. 2, $ VI, p. 57, e *13.01.
9° Russell [1908], $ VI, p. 85. °° Russell [1908], $ V, pp. 82-83.
La teoria dei tipi del 1907
645
Per esempio, un’asserzione [statement] come “Epimenide afferma wx” non è equivalente a “Epimenide afferma @!x° anche se wx e 0!x sono equivalenti. Così “Sto mentendo” resta senza significato se tentiamo d’includere tutte le proposizioni tra quelle che io posso affermare falsamente [.. 20
Resta il problema della plausibilità dell’assioma. Russell la difende argomentando che l’assioma è, in ogni caso, più debole di quello che assume il senso comune con l’ammettere l’esistenza di classi: Data una qualsiasi funzione proposizionale @x, di ordine qualsiasi, essa si assume essere equivalente, per tutti i valori di x a un’asserzione della forma “x appartiene alla classe @?. Ora, quest’asserzione è del primo ordine, poiché non fa allusione a “tutte le funzioni di tipo così e così”. In realtà il suo solo vantaggio pratico sull’asserzione originale @x è che essa è del primo ordine. Non c’è vantaggio nell’assumere che vi siano realmente cose come le classi, e la contraddizione circa le classi che non sono membri di se stesse mostra che, se vi sono classi, esse devono essere qualcosa di radicalmente diverso dagli individui. Io credo che lo scopo principale cui servono le classi, e la principale ragione che le rende linguisticamente convenienti, è che esse forniscono un metodo per ridurre l’ordine di una funzione proposizionale. Non assumerò, dunque, nulla di quanto può sembrare implicato nell’ammissione delle classi fatta dal senso comune, eccetto questo: che ogni funzione proposizionale è equivalente, per tutti i suoi valori, a qualche funzione predicativa. Quest’assunzione riguardo alle funzioni si deve fare qualunque possa essere il tipo dei loro argomenti.’
Poiché l’assioma di riducibilità cattura — secondo Russell — quella che «sembra essere l’essenza dell’usuale assunzione delle classi», egli lo chiama anche assioma delle classi e — nella forma applicata alle funzioni diadiche — assioma delle relazioni.
6. LA TEORIA DELLE CLASSI E DELLE RELAZIONI IN ESTENSIONE 6.1. Come si diceva all’inizio del capitolo, la teoria di “Mathematical logic...’ è — nella la terminologia di Russell — una teoria “senza classi”: in essa tutte le asserzioni che apparentemente riguardano le classi sono interpretate come asserzioni su funzioni proposizionali. Come avviene questo? In “Mathematical logic...” Russell comincia con il distinguere le funzioni estensionali da quelle intensionali: Le proposizioni in cui compare una funzione @ possono dipendere, per i loro valori di verità, dalla particolare funzione @, oppure possono dipendere soltanto dall’estensione di @, cioè dagli argomenti che soddisfano @. Così, per esempio, “Credo che tutti gli uomini siano mortali” può non essere equivalente a “Credo che tutti i bipedi implumi siano mortali”, anche se gli uomini sono coestensivi ai bipedi implumi; perché io posso non sapere che sono coestensivi. Ma “Tutti gli uomini sono mortali” dev'essere equivalente a “Tutti i bipedi implumi sono mortali”, se gli uomini sono coestensivi ai bipedi implumi. Così “Tutti gli uomini sono mortali” è una funzione estensionale di “x è un uomo”, mentre “Io credo che tutti gli uomini siano mortali” è una funzione non estensionale; chiameremo intensionali le funzioni quando esse non sono estensionali.'°°
Naturalmente —
osserva Russell —
î
:
-
»
è
- 101
tutte le funzioni con cui ha a che fare la matematica sono estensionali.
Formalmente, una funzione f di una funzione @! 2 è estensionale — dice Russell — se e solo se:
(MA
(p!x= va) > (f(p!)=f(v 8)
cioè se, e solo se, date due funzioni qualsiasi con la medesima estensione, la funzione f è vera di entrambe, o falsa di entrambe.
Dopo aver spiegato il concetto di ‘funzione estensionale”, Russell introduce una definizione contestuale dei simboli di classe: Da qualsiasi funzione f diuna funzione @! 2 possiamo derivare una funzione estensionale associata come segue. Poniamo:
?7 Russell [1908], $ V, p. 83. 98 Russell [1908], $ V, p. 81. °° Russell [1908], $ V, p. 82. 100 Russell [1908], $ VII, pp. 88-89. !0! V_ Russell [1908], $ VII, p. 89. 102 V. ibid.
capitolo 9
646 f{Z(v2)}.=:(49):
@!x.=..vx:f{@!z}Df.
i
1
n
PR,
ar
signiLa funzione f{ 2 (wz)} è in realtà una funzione di w 2, anche se non è la stessa funzione di f(W 2), supponendo quest’ultima Ni di È È : defini classe “la chiameremo che (w2), 2 argomento un avesse ficante. Ma è tecnicamente conveniente trattare f{ î (y2)} come se ta da y”.!®
La definizione
(DI) f(Z (Vv) = n AP(M(p!x= va) Af(0!Z)) permette d’interpretare i contesti in cui un simbolo di classe — come “ î (w2)” — può comparire in modo significante. Una volta che gli enunciati contenenti un simbolo di classe siano stati interpretati secondo la (DI) non resta, in essi, nessun simbolo che si riferisca a una classe. I simboli di classe sono quindi considerati dei simboli incompleti, proprio come le descrizioni definite: un simbolo di classe, preso in isolamento, non denota nulla; hanno
però significato le espressioni della forma “f(Z(w2))” in cui esso compare. Si osservi che, contrariamente a quanto afferma Russell, ‘f((w2z))” non è una funzione di w î, ma uno schema enunciativo. Infatti, ‘“w?, non è, nella (D1), una variabile quantificabile come ‘“@”, ma una lettera schematica. Essa non può entrare in un quantificatore, perché il suo ordine non è fissato. Lo schema “(4@)(@M(9!x= va) A f(@!Z)) è soddisfatto da ogni funzione di x, di qualsiasi ordine, che sia estensionalmente equivalente a @! z, ma
non rappresenta esso stesso una funzione, perché il tipo dei suoi argomenti non è fissato. Alla definizione (D1) si potrebbe obiettare che essa implica che si ottenga un enunciato significante sia ponendo in “f(...)” un simbolo di classe, sia ponendovi un simbolo di funzione, cosa che, nel linguaggio ordinario, appare scorretta. Supponendo, per esempio, che “f( Z (w2z))” sia “x e 2 (W2)”, secondo la definizione (D1) si ha:
xe Z(Y2)=(AP)(M(plx= wa) Axe pz), dove “x e @!Z”, diversamente da “x e Z (w2z)”, non sembra grammaticale: per es., se ‘“@! 2” è “umano 7”, “x e @!Z” diviene “x e umano Z”.. Questa difficoltà tuttavia non sorge, nel sistema di Russell, perché egli pone la seguente definizione: IE
4
Q! Z "4df px,
104
che permette di trasformare, per es., “x e umano Z” in “x è umano”, e viceversa. 6.2. Esattamente nello stesso modo delle classi sono trattate da Russell le relazioni diadiche in estensione. La de-
finizione è la seguente:
(D2) f(x)
= AMM
(px )= va) Afp (£, $))).!®
Le definizioni (D1) e (D2) consentono d’inferire le proprietà che si considerano usualmente caratteristiche delle classi e delle relazioni in estensione. In “Mathematical logic...” Russell osserva che, dalla definizione (DI), si ricava il teorema:
Z(02)= î(v2)=((0x= va),
106
in cui riconosciamo una forma dell’assioma (V) dei Grundgesetze di Frege,'”” che, garantendo l’estensionalità '* Russell menziona!® anche la dimostrabidelle classi, ne costituisce — dice Russell — «la proprietà distintiva». SAI: 104 V_ Russell [1908], $ VII, p. 90. 105 V_ Russell [1908], $ VII, p. 89. 106 Per la dimostrazione di questo teorema, v. sotto, cap. 11, $ 3.1.3. SV sopra, cap. 5, $ 1.
108 Russell [1908], $ VII, p. 89.
La teoria dei tipi del 1907
647
lità — a partire dalla definizione (D1) e dalla definizione del simbolo di appartenenza (x e @!î =4r @!x) — dei due teoremi: xe
Z(yz)= vx,
110
Z(@z)= 2(vz2)=()(xe
Z2(pz)=xe
î(vz)).
III
Su questi punti, tuttavia, la spiegazione contenuta in “Mathematical logic...” è piuttosto sommaria; sarà dunque meglio rinviarne l’analisi al momento in cui esamineremo la stessa teoria delle classi nell'esposizione dei Princi2412 pia.
6.3. La definizione dei simboli di classe è un punto cruciale nella teoria ramificata dei tipi di “Mathematical logic...”, che ritroveremo anche nei Principia; è dunque opportuno soffermarsi ancora un po’ su di essa. Proviamo a ripercorrere la strada che, presumibilmente, condusse Russell alla sua definizione, prescindendo, inizialmen-
te, dalla teoria dei tipi. L'obiettivo di Russell è di non assumere che i simboli di classe designino entità, ma di fornire un significato a
tutte le espressioni complesse in cui interessa far comparire un simbolo di classe. L'idea di fondo è che affermare che una funzione è soddisfatta da una classe sia come dire che essa è soddisfatta da qualsiasi funzione avente la stessa estensione di quella che definisce la classe. Quindi, le funzioni soddisfatte da una classe devono essere fun-
zioni estensionali di funzioni. Se tutte le funzioni fossero estensionali, si potrebbe semplicemente porre: F(E(Ww2)=af(W 2),
infatti, se fè estensionale, il fatto che essa sia soddisfatta da w 2 implica che essa sia soddisfatta da qualunque altra funzione
@ Z avente la stessa estensione di w 7. Tuttavia, non tutte le funzioni sono estensionali, e Russell
vuole che la simbologia abbia un significato del tutto generale. Bisogna dunque tenere conto anche dei casi in cui fnon sia una funzione estensionale. Allora Russell propone di leggere — in ogni caso — “f(7(w2z))” come: “Esiste una funzione @ Z che soddisfa fe che è formalmente equivalente a w
2”.
Questa è una funzione estensionale, essendo soddisfatta da tutte le funzioni estensionalmente equivalenti a @ Z,
purché f sia soddisfatta da @ î, indipendentemente dal fatto che la funzione f sia estensionale o intensionale."! !09 V_ Russell [1908], $ VII, p. 90. !!0 Per la dimostrazione di questo teorema, v. sotto, cap. 11, $ 3.1.4, teorema (TS).
!!! V._ sotto, cap. 11, $ 3.1.4, nota 347. 112 V_ sotto, ei
MS
!!3 Il fatto che «ogni proposizione circa una classe esprime una proprietà estensionale della funzione determinante la classe, e pertanto non dipende per la sua verità o falsità dalla particolare funzione selezionata per determinare la classe» ([PM], vol. I, #20.11) è dimostrato, nei
Principia, come segue. Si deve dimostrare che:
(1) @M(vx=zx) DS(î(v2)=f(î 42).
Assumendo come ipotesi il lato sinistro di (1), esso implica:
(2) (P(@M(p!x=yYN)=(pP!x= 7), poiché, in generale, La (2) implica:
=9)2(="=(9=”)
([PM], vol. I, *4.86).
(3) (P)(M((p!x= wa) Af(p!î)= (((p!x= 7%) Afp! È), poiché, in generale, (p = g) > ] Ar=gA La (3) implica:
r) ([PM], vol. I, *4.36).
(4) AP)(M(P!x= va Af(p!2))= EPM P!x= 7) Afp! 2), poiché, in generale, (x)(px > wx) > ((3x) px= (Ax) vr) ([PM], vol. I, #10.281). Da (4), per la definizione (D1) segue:
(5) f(2(v2)=f(2(72)), che non è altro che il lato destro della (1). Si è così provato il teorema. (La dimostrazione è quella offerta in [PM], vol. I, #20.11.)
capitolo 9
648
Data una funzione, f, di una funzione predicativa, Russell chiama “funzione estensionale derivata” di flo schema ‘fS(Z(w2))”. Nell’Introduction to Mathematical Philosophy, Russell scrive: Per esempio, si consideri ancora “Credo che tutti gli uomini siano mortali”, vista come funzione di “x è umano”. La funzione estensionale derivata è: “C’è una funzione formalmente equivalente a ‘x è umano” e tale che io credo che qualunque cosa la soddisfa sia mortale”. Ciò rimane vero quando sostituiamo “x è un animale razionale” a “x è umano”, anche se io credo falsamente che la Feni.
È
;
ce sia razionale e immortale.
114
Si osservi che, nell’interpretazione di Russell, possono essere veri enunciati riguardanti classi che paiono a prima vista contraddittori. Si prenda, per es., l’enunciato “Giovanni crede che tutte le cose che appartengono alla classe degli uomini siano mortali”; secondo Russell, esso significa: “Esiste una funzione formalmente equivalente a quella espressa da ‘x è umano’ e Giovanni crede che qualunque cosa la soddisfa sia mortale”. Secondo quest’interpretazione, gli enunciati: “Giovanni crede che tutte le cose che appartengono alla classe degli uomini siano mortali”
È “Giovanni non crede che tutte le cose che appartengono alla classe degli uomini siano mortali” possono essere entrambi veri. Il primo, infatti, sarebbe parafrasato come:
“Esiste una funzione proposizionale formalmente equivalente a quella espressa da ‘x è umano” e tale che Giovanni crede che qualunque cosa la soddisfi sia mortale”. Il secondo sarebbe parafrasato come: “Esiste una funzione proposizionale formalmente equivalente a quella espressa da ‘x è umano” e tale che Giovanni non crede che qualunque cosa la soddisfi sia mortale”. Se, per esempio, la funzione espressa da “x è umano” è coestensiva con quella espressa da “x è un bipede implume”, e però Giovanni crede che gli uomini siano mortali, ma che esistano bipedi implumi immortali, i due enunciati sono entrambi veri. Questo fenomeno si collega con un’obiezione alla definizione contestuale dei simboli di classe sollevata da Carnap in Meaning and Necessity.'!® Carnap sviluppa il suo argomento a partire dalla teoria delle classi dei Principia. Poiché tuttavia la teoria delle classi del 1907 è identica a quella dei Principia, possiamo parlarne adesso. Carnap tralascia le complicazioni dovute alla teoria dei tipi — poiché esse sono inessenziali alla sua discussione. La definizione russelliana dei simboli di classe da cui prende le mosse Carnap è la seguente:
(D1) f(7(Y2) =a (Ag) (Mex = va) Af(8 È). Carnap assume, inoltre, le due premesse: (i) (x ABx=Hx,, abbreviata I A B = H; ()@liza Bz Hzi dove “’” sta per “implume”, “B” sta per “bipede”, e “H?” sta per “umano”. I due enunciati (i) e (ii) dicono che la proprietà bipede implume e la proprietà umano sono equivalenti, ma non identiche. Si può dunque assumere che (i) e (ii) siano veri. Il passo successivo di Carnap è di mostrare che gli enunciati apparentemente contraddittori
1!4 Russell [1919a], cap. 17, pp. 187-188. !!° V. Carnap [1947], $ 33, pp. 147-150. A quest’argomento di Carnap fanno riferimento Cocchiarella [1980], pp. 113-114, nota 18, e Landini [1987], p. 193, nota 15.
La teoria dei tipi del 1907
649
(iii) #(Az)=H? (iv) 2(H2)#H?2 sono entrambi veri nel sistema dei Principia cui siano aggiunte le due premesse (i) e (ii). La (iii) — in accordo con la definizione (D1) — si deve sviluppare in:
(4g)(@(gx=Hx)A(g2 =H2)), che Carnap scrive, in modo abbreviato, come segue:
(v) Gg)(=H)n(gZ=Hî)). L’enunciato (v) — nota Carnap — è immediatamente dimostrabile, poiché segue, per generalizzazione esistenziale, dall’esempio di (v) con “H” al posto di “g”’. Per sviluppare (iv), si deve tenere presente che, in generale, un enunciato in cui compare un simbolo di classe può essere parafrasato in modi diversi, a seconda che l’intero enunciato, oppure solo una sua parte, sia considerato come l’espressione da cui il simbolo di classe dev'essere eliminato in base alla definizione contestuale (D1’. La situazione è identica a quella in cui ci si trova trattando le descrizioni definite. Anche la convenzione che sarà posta nei Principia per l’ambito di un simbolo di classe (cioè per l’espressione da cui esso dev'essere eliminato) è esattamente la stessa di quella posta per le descrizioni: se l’ambito di un simbolo di classe non è specificamente indicato (facendo precedere il simbolo “[Z(@z)]” all’espressione tra parentesi che costituisce l’ambito di “Z(@z)°), esso dev'essere considerato come costituito dal più piccolo sottoenunciato cui il simbolo di classe appartiene.'!° Seguendo questa convenzione, l’ambito di “ ? (H z)” in (iv) è costituito dall’intero enunciato, perché non c’è un sottoenunciato di (iv) più piccolo cui appartenga “(Hz)”.
In altri termini, il simbolo “#°, che è introdotto, nei
Principia, attraverso la definizione X#YV af ca6.0) PO
non deve essere eliminato prima dell’eliminazione del simbolo di classe. La parafrasi di (iv) è dunque:
(vi) (3g)(&@=H)A(gî
#HZ)),
CIOÈ:
Ea) (@=DA-z
=Hz)),
e non:
(vii) -Gg)((g=H) A (gZ =Hz)), come sarebbe se il simbolo “#° fosse eliminato da (iv), tramite la sua definizione, prima dell’applicazione della definizione (D1’), in modo da ottenere:
-(2(H2)=H?). L’enunciato (vi) —
osserva Carnap —
è derivabile dalle premesse (1) e (11) mediante una generalizzazione esi-
stenziale dall’esempio di (vi) con “I A B” al posto di “g”. c_
Lo V. [PM], vol. I, introduzione, cap. 3, p. 80. Questa convenzione non è posta da Russell nell’articolo del 1907 — dove la teoria delle classi è solo delineata per sommi capi. Tuttavia una convenzione del genere è senz’altro implicita anche nella teoria delle classi là esposta.
'!7 V. [PM], vol. I, #13.02.
capitolo 9
650
i Carnap conclude dunque — correttamente — che (iii) e (iv) sono entrambi veri nel sistema di Russell.!!5 russelliana nell’interpretazione — Carnap osserva — contraddittori sembrino (iv) e (iii) enunciati gli Sebbene essi non lo sono realmente, poiché (iv) non è interpretato come negazione di (iii). Infatti, la negazione di (111) dovrebbe svilupparsi in (vii), mentre (iv) si sviluppa in (vi), che non è incompatibile con (v). La situazione — possiamo aggiungere — ha un suo analogo nella teoria delle descrizioni definite. Nel $ 3.3 del cap. 7, avevamo infatti visto che gli enunciati: (vili)
a=(7») (0%)
e
(ix) a#(12)(9x), non sono contraddittori, perché — secondo le indicazioni di Russell — (ix) è interpretato come avente un significato diverso da:
1) -(@=(10(9x), che rappresenta la negazione di nomi propri, sono contraddittori Anche se non è stata derivata stra nondimeno che, nella teoria sero nomi di entità. Infatti, se
(viii). Si noti che, per contro, gli enunciati “a = b” e “a # b”, dove “a” e “Db” sono — poiché il secondo ha lo stesso significato di “(a = db)”. nessuna contraddizione reale — osserva Carnap — l’argomento precedente modi Russell, i simboli di classe non possono essere sempre manipolati come se fos-
@ è il nome di un’entità, ‘=
H 7” è in contraddizione con “@# H 2”. Questo, se-
condo Carnap, è il nucleo della difficoltà. Egli scrive: È vero che Russell ammonisce ripetutamente che le espressioni di classe sono incomplete e non hanno significato in isolamento. D’altra parte, la notazione [dei Principia] è stata costruita avendo in mente questo scopo: Le espressioni di classe dovrebbero essere tali da poter essere manipolate come se fossero nomi di entità; e Russell sembra assumere che questo scopo sia stato raggiunto.'!° Il nostro risultato mette in dubbio tale assunzione. "°°
Per far fronte a quest’ inconveniente, Carnap avanza una proposta articolata in due parti. In primo luogo, egli riformula la definizione russelliana dei simboli di classe come segue:
F(E(V2) = (9(M(gx = ya) DF(87)). Secondo questa definizione, dire che una funzione f è soddisfatta da una classe è equivalente ad affermare che f è soddisfatta da tutte le funzioni equivalenti a quella che si assume come definente la classe. In secondo luogo, Carnap sostituisce la convenzione stabilita da Russell riguardo all’ ambito dei simboli di classe — secondo la quale, se l’ambito di un simbolo di classe non è specificamente indicato, esso dev'essere considerato come costituito dal più piccolo sottoenunciato cui il simbolo di classe appartiene — con la convenzione secondo cui, qualora l’ambito del simbolo di classe non sia indicato, esso dev'essere assunto come costituito dal più
piccolo sottoenunciato nella notazione primitiva cui il simbolo di classe appartiene. Quando l’espressione da cui il simbolo di classe dev’essere eliminato non è nella notazione primitiva, occorre riportarla a questa notazione prima (di20) di eliminare il simbolo di classe.!! Ne segue che, per esempio, l’ambito di ‘ 7 (H z)” in (iv) non sarà più costituito !!8 Carnap nota che una prova analoga è costruibile, nel sistema dei Principia, ogni volta che si assuma l’esistenza di almeno due proprietà che sono equivalenti, ma non identiche — cosa che è senza dubbio ammessa nell’interpretazione presupposta nei Principia.
!!° [PM], p. 188, righe 3-5 e 14-16; e il testo di p. 198. [Nota di Carnap.] 120 Carnap [1947], $ 33, p. 149. 2! Si osservi che ciò è l’opposto di quello che avviene nella teoria di Russell. Per esempio, in “Mathematical logic...” (v. Russell [1908], $ VI, p. 85) e nei Principia (v. [PM], vol. I, #13.01) l’identità è definita da “x= y=4r(@)(@px > @y)”, ma non si può eliminare il segno di uguaglianza da contesti come “a= 2(@z)?, 0 “2(@z)= î(wz)° prima di aver eliminato i simboli di classe, perché un simbolo di classe non è un termine singolare. (Nei Principia si afferma esplicitamente che, per es., «‘ 2 (@z)= @! î” non è un valore di “x= y”», perché «una classe è un simbolo incompleto» ([PM, vol. I, introduzione, cap. 3, p. 84).) La situazione è qui parallela al caso delle descrizioni definite
La teoria dei tipi del 1907 dall’intero
enunciato
(iv), perché
il segno
x
“#” è introdotto
con
651
la definizione
x#
y=4r -(x=
y), e pertanto
dev'essere essere eliminato da (iv) prima del simbolo di classe. Se si suppone, come fa Carnap in questo contesto, che “=” sia un simbolo primitivo, l'ambito di “ î (H z)” in (iv) diviene “2(Hz)=Hî”. Con questo trattamento, (iii) risulta falso, perché si espande in “(g)((x)(gx=Hx) > gî= HZ)”, e (iv) — essendo ora interpretato come il contraddittorio di (iii) — risulta vero. In questo modo, non sorge nessuna difficoltà se — in (iii) e (iv) — interpretiamo il simbolo di classe come se fosse un nome proprio. Carnap conclude che, se la definizione dei simboli di classe fosse modificata nella direzione da lui suggerita: [...] allora soltanto alcune delle dimostrazioni [dei Principia] in poche sottosezioni che si riferiscono alla definizione avrebbero bi-
sogno di essere cambiate. Sembra che in seguito compaiano solo contesti estensionali; pertanto, i teoremi e le dimostrazioni di gran parte dell’opera resterebbero inalterati.'?*
L’idea di Carnap, tuttavia, non sembra eliminare le stranezze intuitive che sorgono nella teoria di Russell. Nell’interpretazione di Carnap, per esempio, gli enunciati apparentemente contraddittori: “Giovanni crede che tutte le cose che appartengono alla classe degli uomini siano mortali”
C “Giovanni non crede che tutte le cose che appartengono alla classe degli uomini siano mortali” sono entrambi falsi, nell'ipotesi precedentemente formulata — secondo cui qualcosa è un bipede implume se e solo se è umano, e tuttavia Giovanni crede che gli esseri umani siano mortali ma che esistano bipedi implumi immortali — che li rendeva veri nell’interpretazione russelliana. Infatti, le loro parafrasi carnapiane sarebbero, rispettivamente:
“Per ogni funzione proposizionale formalmente equivalente a quella espressa da ‘x è umano’ Giovanni crede che qualunque cosa la soddisfi sia mortale”, “Per ogni funzione proposizionale formalmente equivalente a quella espressa da ‘x è umano’ Giovanni non crede che qualunque cosa la soddisfi sia mortale”; che sarebbero, nelle ipotesi date, entrambe false.
Inoltre, nell’interpretazione carnapiana sorgono problemi con un enunciato come:
(xi)
î(Hz)= 2(Hz):!*
(v. sopra, cap. 7, nota 247).
122 Si osservi però che, se invece di considerare l’identità come una nozione primitiva la si considera definita da “x= y=4r(@)(gx > @y) — come in “Mathematical logic...” e nei Principia (v. nota precedente) — l’enunciato (iii) si espande, in notazione primitiva, in
(iii) (9YP(2(H2) > PH),
dove il più piccolo sottoenunciato in cui compare “ ? (H 2)” —
ossia l’ambito di “ 2 (H 2)” —
è “@( î (Hz))”, che secondo la definizione
carnapiana si espande in:
@(MEx=Ho>
9 (2):
per cui (ii1*) diviene:
(PM
x=Hm > 9 (gî) > PH È),
che è un enunciato vero. Cosicché, in quest’interpretazione, (iii) risulta vero, e (iv) risulta falso. Perché (ili) risulti falso (e (iv) risulti vero),
in un’interpretazione carnapiana che consideri l'identità definita alla maniera dei Principia, occorre che l'ambito di “ î (H 2)” sia il sottoenunciato (aperto) di (iii*) “@((Hz)) > @(H 2))”, che non è il più piccolo sottoenunciato di (ii*) cui appartiene il simbolo di classe da
eliminare.
!23 Carnap [1947], $ 33, p. 150. 124 Per quanto segue si vedano L. Linsky [1983], appendice, pp. 154-155, e Landini [1998a], $ 6.6, pp. 167-168.
capitolo 9
652
(xi) è indubbiamente vero, se i simboli di classe sono trattati come nomi, ma nell’interpretazione di Carnap può
essere interpretato in due modi, uno solo dei quali è vero. Le due interpretazioni s1 possono identificare ponendo degli indicatori di ambito in (xi). In un’interpretazione, che si può indicare con:
(xii) [Z(H2z)] (Z(H2z)= 2(H2)), dove “[ £ (Hz)]” indica — analogamente a quanto accade con le descrizioni definite — che l’ambito del simbolo di classe “ ? (Hz)” è l’intera espressione tra parentesi che segue “[ Z (Hz)]”, si elimina ...” ottenendo, in accordo con la definizione di Carnap: .
A
S
ci
.
.
cera
.
.
D
A
“Z (Hz) dal'contestornistte b)
(94
(Ss
(xii) (9)(M(gx=Hx)>g7î=g2), che è un enunciato vero. Ma potemmo interpretare (xi) come:
(xiv) [Z(H2)]([*(HA»](Z(H2)= %(Hx))), cioè eliminando prima ‘ î (H z)” dal contesto “... = *(H x)”, così da ottenere:
(xv) (9(@M(gx=Hx>gî = *(Hx), e poi eliminando, nella (xv), “*(Hx)” dal contesto “g Z = ...” ottenendo:
(xvi) (@((x=Hv > @M(@Mhx=Hx>g7=hî)). Ma la (xvi) implica:
(xvii) (9(M(M(gx=hx)DgZ7 =hZ), che nell’interpretazione carnapiana è falsa, perché significa che tutte le funzioni proposizionali aventi la stessa estensione sono identiche, in contrasto con gli assiomi (i) e (ii). L’interpretazione di Carnap dunque evita che due enunciati apparentemente contraddittori come (iii) e (iv) possano essere entrambi veri, ma implica che un’apparente tautologia come (xi) — che è effettivamente tale, nell’interpretazione russelliana'” —, si possa leggere in due modi che la rendono, rispettivamente, vera e falsa. In conclusione, neppure nella teoria di Carnap i simboli di classe si possono interpretare come semplici nomi. In ogni caso non è storicamente corretto suggerire — come fa Carnap — che Russell ritenesse che, secondo la sua teoria, un simbolo di classe possa essere trattato in qualunque contesto come un autentico nome proprio. Carnap suffraga la sua tesi riferendosi al seguente passo del *20 dei Principia: [...] sebbene le espressioni come % (@x) non abbiano significato in isolamento, tuttavia quelle loro proprietà formali cui ci siamo interessati fino adesso [corsivo mio] sono le stesse delle proprietà corrispondenti dei simboli che hanno un significato in isolamento. Quindi nulla nell’apparato fin qui introdotto ci richiede di determinare se un dato simbolo sta per una classe o no, a meno che il simbolo compaia in un modo in cui solo una classe può comparire in modo significante.!?9
Si osservi, però che questo brano segue una serie di dimostrazioni di teoremi come:
daofa=A10d-fa (0) fa> fp. (@pvio>pv(o fa, (4g) (0)(fa= g! a), 15 Nell’interpretazione di Russell, le letture (xii) e (xiv) sono logicamente equivalenti, e entrambe vere.
126 [PM], vol. I, +20, p. 198.
La teoria dei tipi del
1907
653
dove “@?° e “PB” sono variabili per classi. Tali teoremi dimostrano che la teoria della quantificazione funziona nello stesso modo per le variabili individuali e per le variabili di classe, e che le classi di classi hanno le stesse proprietà formali delle classi d’individui. È a questi teoremi — fondamentali per lo sviluppo della matematica in termini di classi — che Russell si riferisce con la locuzione «quelle [...] proprietà formali cui ci siamo interessati fino adesso». Russell, nel brano riportato, non afferma che un simbolo di classe può sempre essere trattato come se fosse un nome: egli intende invece dire che lo può essere tutte le volte che compare negli enunciati che dipendono dai teoremi menzionati, che sono enunciati estensionali. Russell dice esplicitamente che si può fare a meno di determinare se un dato simbolo sta per una classe o per un individuo «a meno che [corsivo mio] il simbolo compaia in un modo in cui solo una classe può comparire in modo significante». Ora, i contesti:
sono, per l’appunto, contesti in cui & può rappresentare solo un simbolo di classe, perché — secondo la teoria dei tipi — dire che un individuo è, o non è, uguale a una funzione proposizionale è privo di senso. Consideriamo la cosa da un altro punto di vista, istituendo un parallelo con la teoria russelliana delle descrizio-
ni definite. Una descrizione definita (simbolo incompleto) si può trattare come un nome se (1) non è vuota (cioè se esiste uno e un solo individuo che la soddisfa) e (2) il suo ambito è indifferente (e, nei Principia"” si dimostra che l’ambito di una descrizione non vuota è indifferente in tutti i contesti estensionali).'* La situazione, con la definizione contestuale dei simboli di classe, è del tutto analoga. Un simbolo di classe può essere usato come un nome se (1) esiste una certa funzione predicativa e (2) l’ambito del simbolo di classe è indifferente. L'esistenza della richiesta funzione predicativa è assicurata dall’ assioma di riducibilità. Ma l’ambito di un simbolo di classe è indifferente in tutti i contesti estensionali, non in tutti i contesti. Il contesto scelto da Carnap è (come egli stesso
riconosce) non estensionale: dunque, in un contesto del genere, la condizione (2) non è soddisfatta e non esiste nessuna garanzia che un simbolo di classe si debba comportare come un nome. Tutto questo è esplicitamente ri-
conosciuto da Russell: Come nel caso di
f(7x)(@x), così in quello di f{ 2 (@2)}, c'è un’ambiguità quanto all’ambito di 2 (@2) se esso compare in una pro-
posizione che è essa stessa parte di una proposizione più ampia. Ma nel caso delle classi, poiché abbiamo l’assioma di riducibilità, cioè
Av): px.=. ya, che prende il posto di E! f(7x)(@x), ne segue che il valore di verità di una qualsiasi proposizione in cui compare (2) è lo stesso qualunque sia l’ambito che possiamo assegnare a î(@z), ammesso che la proposizione sia una funzione estensionale di qualunque funzione possa contenere [corsivo mio].
Ciò esclude che Russell pensasse che i simboli di classe possano essere manipolati come nomi propri in qualunque contesto, come suggerisce Carnap. 6.4. Fin qui abbiamo discusso la definizione russelliana dei simboli di classe prescindendo dalla teoria dei tipi. Tuttavia, tenendo presente tale teoria, vediamo che la definizione di “f((w2))” come:
“Esiste una funzione @ î che soddisfa fe che è formalmente equivalente a w 2”, dev'essere corretta. Il problema è che in “Esiste una funzione @ î che soddisfa f ed è formalmente equivalente a w î” contiene una quantificazione su @ 2 ; tuttavia, secondo la teoria dei tipi, funzioni aventi argomenti di un certo tipo fissato possono essere, a loro volta, di ordini diversi. Pertanto quantificare su tutte le funzioni aventi argomenti di un certo tipo è illegittimo: dobbiamo indicare quale sia il loro ordine. Russell ne fissa l'ordine stabilendo che @ dev'essere una funzione predicativa. La definizione di ‘f((w2))” diviene allora la (DI), cioè:
127 V_ [PM], vol. I, *14.3. Va
sopra, cap. 7, $ 3.3.
129 V. [PM], vol. I, introduzione, cap. 3, p. 80.
capitolo 9
654
f(î(w2)=x Esiste una funzione predicativa @! î che soddisfa f e questa funzione è formalmente equivalente a
yz. Questa definizione si rivela adeguata grazie all’assioma di riducibilità, il quale garantisce che per qualsiasi funzione ce n’è sempre una che è predicativa ed è vera per gli stessi argomenti. Si osservi che, sempre a causa della teoria dei tipi, “f(?(w2))” non rappresenta una funzione di w 7, neppure quando l’ordine di f è fissato. Infatti, poiché il tipo degli argomenti non determina l’ordine di una funzione, w 7 può essere di qualsiasi ordine, e poiché gli argomenti di una funzione proposizionale devono avere un tipo fissato, e dunque un ordine determinato, “f(È(w2))” non può rappresentare una funzione proposizionale, ma deve essere uno schema enunciativo. In connessione con la teoria dei tipi, si deve prestare attenzione al fatto che — secondo Russell — la funzione estensionale derivata è sempre definita a partire da una funzione di una funzione predicativa: in altri termini, f è sempre una funzione di una funzione predicativa. Trascurare questo punto porta a fraintendimenti. Per esempio, Steven E. Boèr ([1973]) offre il seguente resoconto dell’idea di Russell: Russell [...] propone [...] un espediente che consente di ricavare, da qualsiasi attributo di ordine più alto, un attributo estensionale correlato. Data un’asserzione della forma
(2) f(wz)
3
che esprime un attributo di w 2 , Russell costruisce ciò che ciò che chiama funzione estensionale derivata: cioè,
(3) BP)[M(p!x= va) Af(p! 2).
|
|
Se f è estensionale, allora (2) e (3) sono formalmente equivalenti. E se fè intensionale, allora (3) sarà vero almeno ogni volta che è vero (2).!5°
Sulla base di questo resoconto, Boér argomenta che la costruzione di Russell non funziona: Questo si può vedere come segue: sia “f ’
6
— è pensato da John”; allora (2) e (3) si possono riscrivere, in italiano, come
(2a) w 2 è pensato da John. e (3a) w 2 è formalmente equivalente a qualche attributo predicativo che è pensato da John. Ma (2a) può ben essere vero e (3a) essere falso! Perché John può non aver mai pensato a nessun attributo predicativo.'
31
La conclusione di Boèr è giustificata sulla base della sua interpretazione della tesi di Russell; ma Russell non dice affatto ciò che gli attribuisce Boér. In “Mathematical logic...” leggiamo: Da una funzione qualsiasi f di una funzione @! 2 possiamo derivare una funzione estensionale associata nel modo che segue. Poniamo:
f{î(v2}.=:Eo):9!x.=..vx:f{g!z}.Df!
Il punto cruciale è che Russell parla di una funzione «di una funzione @! 2 », cioè di una funzione di una funzione predicativa, non di una funzione di una funzione qualsiasi, come interpreta Boèr. Lo stesso punto è ribadito in tutti i testi in cui Russell espone questa teoria." Per esempio, nei Principia si legge: AI fine di ovviare alla necessità di dare un diverso trattamento alle funzioni intensionali ed estensionali di funzioni, costruiamo una funzione estensionale che sia derivata da una qualsiasi funzione di una funzione predicativa y! î, e abbia la proprietà di essere equivalente alla funzione da cui è derivata, purché questa funzione sia estensionale, come pure la proprietà di essere significante (mediante l’aiuto dell’ambiguità sistematica dell’equivalenza) con qualsiasi argomento @ ? i cui argomenti siano dello stesso tipo di quelli di y! 2. La funzione derivata, scritta “f{ î(@2)}”, è così definita: Data una funzione f(y! 2 ), la nostra funzione derivata dev’essere: “vi è una funzione predicativa che è formalmente equivalente a @ ? e soddisfa f?.!54
150 Boér [1973], pp. 206-207. 15! Boér [1973], p. 207. 132 Russell [1908], $ VII, p. 89. 133 Fa eccezione l’Introduction to Mathematical Philosophy, dove non è menzionato il fatto che f dev’essere una funzione di una funzione predicativa perché, a quel punto del testo, Russell non ha ancora introdotto il concetto di predicatività. È possibile che Boèr sia stato fuorviato dalla trattazione dell’Introduction. 154 [PM], vol. I, introduzione, cap. 3, pp. 74-75.
La teoria dei tipi del
1907
655
La tesi di Russell non è dunque che la funzione estensionale derivata di una funzione f di una funzione qualsiasi sia:
AP(@M(p!x= wa) Af(P!Z)), come vuole Boér, ma che la funzione estensionale derivata di una funzionef di una funzione predicativa è:
FP(M(p!x= va) Af(p!Z)). Così, se f è una funzione estensionale, allora, ammesso che la funzione (D1) è vero quando, e solo quando, è vero f(w
w î sia predicativa, il lato destro della
7). Si ha cioè:
f(Z(v2)=f(w2) Se la funzione f non è estensionale, allora, sempre ammesso che w 2 sia predicativa, il lato destro della (D1) sarà sempre vero quando è vero f( 7), ma potrà essere vero anche in casi in cui f(w î) è falso. In ogni caso, f non può avere come argomento una funzione che non sia predicativa: se w Z non è predicativa, il simbolo “f(w 2)” è semplicemente privo di senso.'’ Con ciò, l’obiezione di Boér viene a cadere. 6.5. Russell definisce contestualmente il simbolo “(yz)”, cioè lo definisce quando compare nel contesto ‘f(Z(w2))”, dove f sia una funzione che prende per argomenti funzioni monadiche predicative di un certo tipo.
Analogamente, definisce il simbolo “%$ y(x, y)” quando compare nel contesto “f(% v(x, y))”, dove f sia una funzione che prende come argomenti funzioni diadiche predicative di un certo tipo. La definizione (D1) vale senza riguardo al fatto che f sia estensionale o intensionale e vale qualunque sia il tipo logico della funzione w 2 che si sceglie per caratterizzare la classe. Nello stesso modo, la definizione (D2) vale senza riguardo al fatto che f sia estensionale o intensionale e vale qualunque sia il tipo logico della funzione “ %*y y(x, y)” che caratterizza la relazione in estensione. In modo strettamente analogo alle descrizioni definite, i simboli di classe e di relazione in estensione sono — per Russell — dei simboli significativi solo in un contesto, cioè dei simboli incompleti: essi non denotano nulla perché, quando l’intera espressione in cui compare un simbolo di classe o di relazione è stata interpretata secondo la definizione (D1) o (D2), non rimane, nel definiens, nessun simbolo che si supponga denotare una classe, o una relazione in estensione. La definizione (D1) comporta che ogni funzione proposizionale monadica definisca una classe, e tutte le funzioni che hanno la stessa estensione definiscano la medesima classe.'*° Per l'assioma di riducibilità, ogni funzione proposizionale monadica è formalmente equivalente a una funzione proposizionale predicativa. Ne segue che ogni classe può essere definita da una funzione proposizionale predicativa.'” In altri termini, le funzioni proposizionali monadiche non predicative determinano classi che sono già definite da funzioni proposizionali predicative degli stessi argomenti, cosicché non esiste nessuna classe che sia definita solo da una funzione proposizionale non predicativa. Si possono considerare allora tutte le classi come definite dalle funzioni proposizionali predicative corrispondenti. Poiché il tipo di una funzione proposizionale predicativa è del tutto determinato dal tipo dei suoi argomenti, ne deriva che la gerarchia degli ordini è, per le classi, del tutto abolita: ogni classe ha un tipo logico che è esclusivamente determinato dal tipo logico degli argomenti delle funzioni proposizionali predicative che definiscono la classe." Così, mentre non è possibile quantificare su tutte le funzioni proposizionali che hanno argomenti di un certo tipo — potendo esse avere ordini diversi — è possibile quantificare su tutte le classi che hanno elementi di un certo tipo, perché ciò equivale a quantificare su tutte le funzioni proposizionali predicative che
!35 I] motivo per cui Russell non prenda in considerazione il caso di una funzione di funzioni non predicative diverrà chiaro più avanti, quando discuteremo la teoria dei tipi nel contesto dei Principia (v., in particolare, sotto, cap. 11, $$ 2.3.2 e 3.1.5).
!56 Per la dimostrazione di questi punti, che richiedono l’intervento dell’assioma di riducibilità, v. sotto, cap. 11, $$ 3.1.2 e 3.1.3. 137 Per la dimostrazione formale di questo teorema, v. sotto, cap. 11, $ 3.1.3, teorema (T2).
138 V_ [PM], vol. I, +20.151.
capitolo 9
656
hanno argomenti di un tipo determinato." La stessa cosa, per le medesime ragioni, vale per le relazioni in estensione. Si noti che, in assenza dell’assioma di riducibilità (ma continuando ad assumere che ogni funzione proposizionale determini una classe, o una relazione in estensione) la teoria ramificata dei tipi non garantirebbe che non esistano classi o relazioni in estensione che possano essere definite solo mediante funzioni proposizionali non predicative; cosicché classi formate da elementi dello stesso tipo, o relazioni in estensione tra elementi degli stessi tipi, potrebbero essere di tipi diversi, a seconda dell’ordine della funzione proposizionale che le definisce. Ciò renderebbe impossibile, per esempio, parlare di “tutte le classi di oggetti di un certo tipo” e, con ciò renderebbe impossibile una definizione come quella logicista di “numero naturale”. Possiamo ora comprendere bene come si risolve, nel contesto di “Mathematical logic...”, il paradosso di Russell. Scrive Russell: È chiaro che, poiché abbiamo identificato le classi con funzioni, [...] nessuna classe può dirsi in modo significante essere o non essere un membro di se stessa; perché i membri di una classe sono suoi argomenti, e gli argomenti di una funzione sono sempre di tipo più basso della funzione. E se chiediamo: “Ma che dire della classe di tutte le classi? Non è questa una classe, e così un membro di se stessa?”, la risposta è duplice. Primo, se “la classe di tutte le classi” significa “la classe di tutte le classi di qualunque tipo”, allora non c’è una tale nozione. In secondo luogo, se “la classe di tutte le classi” significa “la classe di tutte le classi di tipo ?°, allora questa è una classe del tipo successivo a 1, e pertanto ancora non è membro di se stessa.'‘°
Il paradosso di Russell è risolto dal fatto che, in “Mathematical
logic...’’, le espressioni
6
“Z(wz) e
Z(wz)” e
“Z(wz) é Z(wz)° — che affermano che una classe appartiene, o non appartiene, a se stessa — sono considerate prive di significato. Infatti, se applichiamo la definizione (D1) all’espressione ‘“Z7(wz) e Z(yw2)”, otteniamo:!
ANn(@Mr1x= vv) A
x!î e x!î)
che, in virtù della definizione del simbolo di appartenenza di “Mathematical logic...”:
iS
aree
equivale a:
IUAV); ma secondo la teoria di “Mathematical logic...” questa è un’espressione malformata, perché il simbolo “X!(X! 2)” è privo di senso: infatti, la teoria prescrive che una funzione debba essere sempre di tipo superiore a quello dei suoi argomenti — cosa impossibile se la funzione è presa come argomento di se stessa. Un ragionamento simile risolve il paradosso di Russell nella sua forma concernente le relazioni in estensione. !* Formulata la teoria sopra esposta, in “Mathematical logic...” Russell introduce lettere greche minuscole (diverse da £, @, V, X, 6) per le espressioni come “ (@z)” e lettere maiuscole latine (come R, S, 7) per le espressioni come “%} y(x, y)”. Egli dichiara quindi che «la teoria delle classi procede, da questo punto in avanti, come nel CEI
g
2
144
È
LI
+
-
A
3
sistema di Peano». Sono poi presentate le nozioni logiche fondamentali e, sulla base di queste, si procede a derivare le idee fondamentali dell’aritmetica: quelle di “numero cardinale” e di “numero ordinale”.
15° Per la quantificazione sulle classi, v. sotto, CAPRI
SSIZAlE
140 Russell [1908], $ VI, p. 88. 10 Leggiamo
qui “Z(wz)e
Z(wz)° come
“T2(Y2]A x (va) (v2)e %(wx)). 142 V. Russell [1908], $ VII, p. 90. 143 V. Russell [1908], $ VI, p. 88. 144 Russell [1908], $ VII, p. 91.
‘Tî(y2)](î(vz)e
î(wv2);
ma il risultato sarebbe lo stesso se lo leggessimo
come
La teoria dei tipi del 1907
7.LO SVILUPPO DELLE IDEE FONDAMENTALI
657
DELL’ARITMETICA
7.1. ALCUNE DIFFICOLTÀ DERIVANTI DALLA TEORIA DEI TIPI Lo sviluppo delle idee fondamentali dell’ aritmetica nell’ambito della teoria ramificata dei tipi di “Mathematical logic...” è — nelle linee fondamentali — molto simile a quello che Russell aveva presentato anni prima nei Principles, ma la teoria dei tipi ha su di esso alcune conseguenze importanti — di cui Russell si rese perfettamente conto fin dal 1907 — destinate ad accompagnare anche la dottrina sostenuta nei Principia. Secondo la teoria ramificata dei tipi, una classe non può avere elementi che non siano di tipo omogeneo; per esempio, non può avere come elementi un individuo e una classe, o una classe e una classe di classi. Da ciò scaturiscono alcuni impacci per lo sviluppo dell’aritmetica che in parte si possono superare — come mostra Russell — ricorrendo ad artifici tecnici e in parte, invece, limitano in modo indesiderato la potenza dimostrativa della teoria.
7.1.1. Un inconveniente è che, nella teoria dei tipi, i numeri cardinali non sono più unici, ma si riproducono, per così dire, all’interno di ciascun tipo. In altre parole, per ciascun tipo c’è un numero 0, un numero 1, un numero 2, e così via. Ecco come Russell descrive la situazione in “Mathematical logic...”: Bisogna osservare, in ogni caso, che 0 e 1 e tutti gli altri cardinali, secondo le definizioni precedenti, sono simboli ambigui [...] € hanno tanti significati quanti sono i tipi. Per cominciare con 0: il significato di 0 dipende da quello di A, e il significato di A è differente a seconda del tipo di cui esso è la classe nulla."
Russell definisce il numero 0 come la classe che contiene solo la classe vuota, in simboli: 0 Zqf LA,
146
i
dove la classe vuota è definita come la classe degli oggetti che sono diversi da se stessi:
Az=a $(#x).! A causa della teoria dei tipi, tuttavia, il simbolo “A” non è univoco, ma rappresenta una classe diversa a seconda del tipo della funzione predicativa definente, cioè a seconda del tipo dei valori appropriati per x. Vi sarà così una classe vuota d’individui, una classe vuota di classi d’individui, una classe vuota di classi di classi d’individui, e
così via. Pertanto ‘il’ numero 0 non è più unico. Lo stesso avviene per gli altri numeri cardinali. Per esempio, vi sarà un numero 1 applicabile alle classi d’individui, un numero 1 applicabile alle classi di classi d’individui, e così via. Infatti, la definizione di ‘1’ può essere scritta così:
I=r d(EMM)Ge a=x=y)," dove la classe che definisce 1 è diversa a seconda del tipo di @, cioè a seconda del tipo cui appartengono gli argomenti della funzione definente. Più in generale, il simbolo “Nc‘@° diviene ambiguo. Infatti, “Nc‘@° è definito come “l’insieme delle classi che
hanno lo stesso numero cardinale della classe @/’, cioè come “la classe dei f tali che 8 sm @°, dove sm Sar dB (AR) (R e 1->1AD‘'R=aX0
‘R=):!
“La similitudine cardinale è la relazione che vale tra due classi 2 e tali che c’è una relazione uno-uno il cui dominio è @e il cui dominio inverso è 2”. Dalla definizione emerge chiaramente che “sm” è un simbolo ambiguo, 15 14 147 148
Russell [1908], $ IX, p. 96. V. ibid. V. Russell [1908], $ VII, p. 91. V_ Russell [1908], $ IX, p. 96.
149 V_ ibid. Nell’articolo del 1907, Russell usa “Sim” al posto del simbolo utilizzato nei Principia “sm”.
capitolo 9
658
cioè non rappresenta un’unica relazione in estensione, ma può rappresentare relazioni diverse a seconda dei tipi di a e B. Per disambiguare “sm” potremmo usare l’artificio di apporre ad esso due indici: il primo a indicare quale dev'essere il tipo dei termini del dominio della relazione in estensione, il secondo per indicare quale dev'essere il tipo dei termini del codominio della relazione in estensione. Così, per esempio, potremmo usare il simbolo “sm” per indicare la relazione (in estensione) di similitudine cardinale tra classi d’individui e classi d’individui, oppure potremmo usare il simbolo “sm” per indicare la relazione (in estensione) di similitudine cardinale tra classi di classi di classi d’individui e classi d’individui, e così via. A seconda di come decidiamo di disambiguare il simbolo “sm”, il simbolo “Nc‘@? sarà disambiguato in modi diversi: se @ è una classe d’individui, “Nce‘@° potrà rappresentare la classe di tutte /e classi d’individui che sono cardinalmente simili ad @, oppure la classe di tutte /e classi di classi d’individui che sono cardinalmente simili ad 4, e così via. Nei Principia, questi inconvenienti saranno superati attraverso l’uso dell’ambiguità sistematica, secondo la quale si evita di apporre indici di tipo ai simboli che compaiono in formule che valgono in qualunque modo 1 tipi vengano specificati, con la sola restrizione (naturalmente) che la formula debba risultare significante.
7.1.2. Altre complicazioni sorgono in relazione alle operazioni aritmetiche tra numeri cardinali. Nel cap. 2 ($ 3.5.2), avevamo visto che Russell, nell’Introduction to Mathematical Philosophy," provvede il seguente metodo per formare la somma aritmetica di due classi, cioè per formare una classe che abbia come numero cardinale il numero che rappresenta la somma dei numeri cardinali, n e m, di due classi @'e /.. Si forma la classe @' di tutte le coppie ordinate aventi come primo membro un elemento di 2 e come secondo membro la classe vuota; si forma la classe /' di tutte le coppie aventi come primo membro la classe vuota e come secondo membro un elemento di £& le due classi di coppie @' e £8' così formate non hanno elementi in comune — anche se @ e / hanno elementi in comune — e hanno lo stesso numero di elementi, rispettivamente, di e di 8, cosicché la loro somma logica avrà n+.mtermini.
Questo metodo deve però essere corretto in base alla teoria dei tipi.’ Poiché — secondo tale teoria — una classe può essere formata solo da elementi di tipo omogeneo, le coppie ordinate che formano @' possono essere riunite in una sola classe con quelle della classe /' solo se sono dello stesso tipo di queste. La soluzione che Russell offre nei Principia è stata già esposta nel cap. 2 ($ 3.5.2), ma ora siamo in grado di comprendere appieno le ragioni di quella che poteva apparire una complicazione gratuita. Essa consiste in due aggiustamenti tecnici: (1) Al posto di ciascun elemento di @ e di ciascun elemento di /8, si prende — a formare un elemento di ciascuna coppia — la classe che contiene quell’unico elemento. (2) Si richiede che la classe vuota che è accoppiata a {x}, dove x è un elemento di 4, sia dello stesso tipo logico di Be, analogamente, che la classe vuota che è accoppiata a {y}, dove y è un elemento di 8, sia dello stesso tipo logico di a. Se indichiamo — seguendo la simbologia impiegata nei Principia — la classe vuota dello stesso tipo di £ con “A N B’, e la classe vuota dello stesso tipo di @ con il simbolo “AN
@ o ? abbiamo che la classe &/ viene ad esse-
re costituita da una coppia ({x}, A N ) per ogni elemento x di & mentre la classe £8' viene ad essere costituita da una coppia {A N 4 {y}) per ogni elemento y di 2. In questo modo ci si garantisce che le coppie che costituiscono a’ e quelle che costituiscono /' siano sempre dello stesso tipo, e dunque possano essere raccolte in un’unica classe, che è detta, nei Principia," somma aritmetica delle classi 2 e B
Si osservi che non è necessario, per ottenere la somma aritmetica di due classi &e 8 — in simboli “a+ 8? — che Qe / siano classi dello stesso tipo: anche se non lo sono, le coppie ({x}, A N I) e (A N 4 {y}) saranno co150 V_ Russell [1919a], cap. 12, pp. 117-118. !5! Russell, al tempo della stesura dell’Introduction, ne era perfettamente cosciente, come dimostra la trattazione dello stesso argomento fornita anni prima nei Principia. Tuttavia, a quel punto dell’Introduction egli semplifica, non volendo ancora entrare in questioni relative alla teoria dei tipi.
!5? Poiché an Bè definito come segue (v. Russell [1908], $ VII, p. 91): anB=x%(xe
anxe fb),
è evidente che il simbolo “&N #8” può essere significante solo se @e 8 sono dello stesso tipo logico.
153 V. [PM], vol. II, *110, p. 73.
La teoria dei tipi del 1907
659
munque dello stesso tipo, e dunque saranno sommabili. Infatti, qualsiasi sia il tipo f di (e qualsiasi sia il tipo £' di b, le due coppie ({x}, AM B) e (A N & {y}) avranno un primo membro di tipo f e un secondo elemento di tipo r'. Una complicazione simile sorge nella definizione della somma di due numeri cardinali. Nel cap. 2 ($ 3.5.2) a-
vevamo detto che Russell definisce la somma di due numeri cardinali n e m come segue:
n+em=g é(GOAPI(n=Ne'a nm=Nc'BA Esm (0+ fB). In nota, avevamo però avvertito che si trattava di una semplificazione. In realtà, la formula dei Principia'”
è:
n+,m=x È (Ga) (A0)(n= Nega Am= Ney BA Esm (a+). La differenza tra la prima e la seconda formula è che, nella seconda, compare il simbolo “Ncy” al posto del simbolo “Ne”. “Neo
significa “Il numero cardinale omogeneo di @°. Data una classe a, il numero cardinale omoge-
neo di 2 non è altro che la classe di tutte le classi dello stesso tipo della classe a che sono cardinalmente simili ad a.!° La necessità di ricorrere a questa specificazione risiede esclusivamente nella teoria dei tipi. Finché non consideriamo le classi come suddivise in tipi, siamo sempre sicuri che — posto che sia & una classe — il numero cardinale di @ non può essere la classe vuota: infatti, la classe di tutte le classi cardinalmente simili ad @ deve contenere almeno la stessa classe &, poiché ogni classe è cardinalmente simile a se stessa. Ma quando le classi vengono suddivise in tipi, non possiamo più avere la sicurezza che il numero cardinale di @ non risulti, in qualche tipo, essere la classe vuota. Supponiamo, per esempio, che al mondo vi siano solo 2 individui: allora vi saranno 2° = 4 classi
d’individui,
2'=
16 classi di classi
d’individui,
e così
via. Prendiamo
una
classe
di classi di classi
d’individui composta di, diciamo, 15 elementi, chiamiamola ‘“@?. Ora accade che il numero cardinale di @ è uguale alla classe vuota di classi d’individui, e alla classe vuota di classi di classi d’individui, poiché non vi sono classi d’individui, né classi di classi d’individui, che siano cardinalmente simili a & mentre non è uguale alla classe vuo-
ta di classi di classi di classi d’individui, perché le classi di classi di classi d’individui, nella nostra ipotesi, possono avere fino a 16 membri. Potrebbero dunque esistere modi di specificare il simbolo “Nce‘@° per cui: INGIO=7A8
Questo rende necessario, nella definizione di somma di due numeri cardinali, porre la condizione che il numero cardinale delle classi cui si fa riferimento sia un numero cardinale omogeneo. Il ricorso ai numeri cardinali omogenei si rende necessario — e sarà utilizzato, nei Principia — ogni volta che si vuole escludere che il numero cardinale di una classe possa risultare, in qualche tipo, essere la classe vuota. Esso si ritrova, per esempio, nella teoria del prodotto e dell’esponenziazione. Per quanto riguarda le operazioni tra numeri-relazione, le cose procederanno — nei Principia — in modo del tutto analogo: nelle definizioni è richiesto, al posto del simbolo “Nr‘R”, il simbolo “Nro‘R”, che si legge “il numero-relazione omogeneo di R” e significa: “la classe di tutte le relazioni dello stesso tipo della relazione R che sono ordinalmente simili a R”.!°° Mentre il numero-relazione di R può essere, per certe specificazioni di tipo, la relazione vuota, questo non può mai accadere con il numero-relazione omogeneo di R, grazie al fatto che R stessa — essendo ordinalmente simile a se medesima — è un elemento del numero-relazione omogeneo di R. 7.1.3. Le complicazioni fin qui considerate sono state risolte da Russell ricorrendo a manovre tecniche. La teoria dei tipi ha però anche inconvenienti che non si possono aggirare in questo modo. Uno di questi è che la teoria dei tipi — quella di “Mathematical logic...”, così come quella sostenuta più tardi nei Principia — rende impraticabile una dimostrazione logica dell’esistenza di una classe infinita: Laddove siano interessate solo un numero finito di classi, possiamo ovviare alle conseguenze pratiche di ciò [cioè del fatto che possono essere sommate solo classi di tipo omogeneo], per il fatto che possiamo sempre applicare a una classe delle operazioni che in-
154 V_ [PM], vol. II, *110.02. !S5 V_ [PM], vol. II, *103. 156 V. [PM], vol. II, *155.
660
capitolo 9 nalzino il suo tipo fino a un qualsiasi grado richiesto senza alterare il suo numero cardinale. Per esempio, data una qualsiasi classe a, la classe 1°°@ [cioè la classe che ha per elementi tutte e solo le classi che contengono un solo elemento di a] ha lo stesso numero
cardinale, ma è del tipo immediatamente successivo a quello di &. Quindi, dato un qualsiasi numero finito di classi di tipi differenti, possiamo innalzarle tutte al tipo che è quello che possiamo chiamare il minimo comune multiplo di tutti i tipi in questione [...] Ma, laddove abbiamo una serie infinita di classi di tipi ascendenti, questo metodo non può essere applicato. Per questa ragione, non possiamo ora provare che devono esserci classi infinite. !°”
Ricordiamo che, fino al 1906, Russell era persuaso che l’esistenza di una classe infinita si potesse dimostrare con mezzi puramente logici. I metodi indicati nei Principles, così come il metodo di Frege," comportano però
tutti una violazione della teoria dei tipi. Ma anche la dimostrazione che Russell aveva fornito nel 1906, nell’articolo “Les paradoxes de la logique”,'° diviene ora impraticabile, essendo basata sull’assunzione che le proposizioni appartengano tutte allo stesso tipo logico — una tesi respinta in “Mathematical logic...”. Nell'ambito della teoria dei tipi si può ancora dimostrare che esistono classi aventi un qualsiasi numero finito di elementi: Infatti, se il numero cardinale dei termini in un tipo qualsiasi è n, quello dei termini nel tipo successivo è 2”. Così se non ci sono individui, ci saranno almeno una classe (cioè, la classe vuota), due classi di classi (cioè, quella che non contiene nessuna classe e d at È È =] 5 5 . 2 160 quella che contiene la classe vuota), quattro classi di classi, e in generale 2" classi dell’n-esimo ordine.
Ma non si può dimostrare che esiste una classe che contiene infiniti elementi: Infatti, si supponga che vi siano solo n individui in tutto nell’universo, dove n è finito. Ci sarebbero allora 2” classi d’individui, e 2° classi di classi d’individui, e così via. Così il numero cardinale di termini in ciascun tipo sarebbe finito; e, sebbene questi nu-
meri crescano oltre qualsiasi numero finito assegnato, non ci sarebbe modo di addizionarli così da ottenere un numero infinito. Abbiamo quindi bisogno di un assioma, così sembrerebbe, da cui consegua che nessuna classe finita d’individui contiene tutti gli indi-
vidui; ma se qualcuno preferisce assumere che il numero totale degli individui nell’universo è (per esempio) 10.367, non sembra esserci nessun modo a priori di rifiutare la sua opinione.'°!
Così — se non si assume che vi sono infiniti individui — non si può dimostrare che esiste almeno un tipo in cui sia presente /’intera progressione dei numeri naturali: non si può dimostrare che esista almeno un tipo in cui il ter-
zo assioma di Peano è vero.
i
Assumendo invece l’assioma dell’infinito, cioè assumendo che nessuna classe finita d’individui contiene tutti
gli individui, si ha che, per ogni numero finito, esiste una classe d’individui che ha quel numero cardinale: Quindi tutti i numeri cardinali finiti esistono come cardinali-individuo, cioè come numeri cardinali di classi d’individui. Ne segue
che c’è una classe di Xy cardinali, vale a dire, la classe dei cardinali finiti. Quindi Xy esiste come il cardinale di una classe di classi di classi d’individui. Formando tutte le classi di cardinali finiti, troviamo che 2° esiste come il cardinale di una classe di classi di
classi di classi d’individui; e possiamo procedere così indefinitamente. L'esistenza di N, per ogni valore finito di n può anche essere provata, ma questo richiede la considerazione degli ordinali.'°°
Nei Principia, l'assioma dell’infinito non sarà assunto come principio logico. Esso sarà semplicemente posto come premessa agli enunciati che ne conseguono. Vale a dire che nei Principia se un enunciato, sia esso rappresentato dalla lettera “p”, deriva (oltre che da altri assiomi logici) dall'assunzione dell’assioma dell’infinito, esso non è assunto come teorema: si assume invece come teorema il condizionale ‘Infin ax > P”, dove ‘“Infin ax” sta
per “assioma dell’infinito”. Così, nei Principia, gli enunciati matematici che richiedono l’esistenza di una classe infinita non sono né teoremi della logica, né teoremi della matematica: per es., nei Principia il terzo assioma di Peano non è un teorema.
157 Russell [1908], $ IX, p. 97. 158 V. sopra, cap. 2, $ 6.3. EER sopra, cap. 8, $ 4.1.3.
190 Russell [1908], $ X, p. 101. ‘©! Russell [1908], $ IX, p. 97. 162 Russell [1908], $ IX, p. 98.
La teoria dei tipi del 1907
661
La teoria dei tipi si rivela qui un’arma a doppio taglio. Infatti, lo stesso argomento che da un lato inibisce la dimostrazione dell’esistenza di una classe infinita, dall’altro è in grado di bloccare il paradosso di Cantor. E lo stesso Russell, in “Mathematical logic...”, ad accostare i due aspetti dell’argomentazione: Dalla precedente forma di ragionamento risulta evidente che la dottrina dei tipi evita tutte le difficoltà relative al più grande cardinale. C'è un più grande numero cardinale in ciascun tipo, vale a dire, il numero cardinale dell’intero tipo; ma questo è sempre superato dal numero cardinale del tipo successivo, poiché, se @ è il numero cardinale di un tipo, quello del tipo successivo è 2% che, come ha mostrato Cantor, è sempre più grande di @. Poiché non vi è modo di addizionare tipi diversi, non possiamo parlare del “numero cardinale di tutti gli oggetti, di tipo qualsiasi”, e così non c'è un numero cardinale che sia il più grande in assoluto.'°
7.1.4. La teoria ramificata dei tipi ha conseguenze indesiderate sullo sviluppo della teoria dei numeri ordinali transfiniti e degli alef di Cantor. Richiamiamo rapidamente alcune idee fondamentali:'* (a)
Russell definisce un numero ordinale come la classe di tutte le relazioni ordinalmente simili a una relazione seriale ben ordinata. Unarelazione è seriale se e solo se è irriflessiva, transitiva e connessa. Una relazione è R è connessa se e solo se, tra due qualsiasi elementi diversi del suo campo, x e y, 0 xRy 0 yRx.
(b) (c)
(d)
Una relazione è ben ordinata se ogni sottoclasse non vuota del suo campo ha un minimo.
In “Mathematical logic...”, dopo aver esposto brevemente la sua teoria degli ordinali, Russell nota: Se ora esaminiamo le nostre definizioni con uno sguardo alla loro connessione con la teoria dei tipi, vediamo, per cominciare, che le definizioni di “Ser” [cioè di “relazione seriale’”] e di Q [cioè di “relazione ben ordinata”] involgono i campi di relazioni seriali.
Ora, il campo è significante solo quando la relazione è omogenea; quindi le relazioni che non sono omogenee non generano se+ 165 sie.t0
La difficoltà rilevata da Russell è che il campo di una relazione è la classe costituita da tutti i termini che formano il suo dominio, insieme con tutti i termini che ne formano il codominio.
Ma nessuna classe, secondo la teoria dei
tipi, può essere costituita da elementi appartenenti a tipi logici diversi: ne consegue che una relazione la quale può sussistere tra termini di tipi logici diversi non può avere un campo, e quindi non può essere né una relazione seriale (perché non può essere connessa), né una relazione ben ordinata. Questo — osserva Russell'°° — ha immediatamente una conseguenza sulla possibilità di dimostrare l’esistenza dei numeri ©@ e o: si potrebbe infatti pensare di generare una serie avente numero ordinale © nel modo che segue. Per ogni termine x, si denoti la classe che contiene esclusivamente x con il simbolo “1‘°x?. Partendo da un qualsiasi termine x formiamo la serie: 6
‘
AIAR
RE
167
avente numero ordinale ©. L'uso di questo metodo per provare l’esistenza di © è legittimo nell’ambito di una teoria intuitiva degli insiemi, ma non è più utilizzabile nel quadro della teoria dei tipi di Russell. Il problema — osserva Russell! — è che x e 1‘x sono di tipi diversi, e perciò non può esistere una serie come la precedente. Sebbene si possa dimostrare che tutti i numeri ordinali finiti esistono, non si può dunque provare, nel contesto della teoria ramificata dei tipi, che esistono numeri ordinali infiniti, cioè che esiste almeno una serie infinita. Solo se si postula che esistano infiniti individui — cioè se si assume /’assioma dell’infinito — siamo in grado di ottenere la gerarchia cantoriana degli ordinali e degli alef; scrive Russell:
!63 Russell [1908], $ IX, pp. 97-98. Ie
sopra, cap. 2, $ 4.2.
'65 Russell [1908], $ X, p. 100. !°0 V. ibid. 167 «1‘?y? costituisce un’abbreviazione per il simbolo formato da “x? preceduto da n occorrenze di “1°”.
168 V_ Russell [1908], $ X, p. 100.
capitolo 9
662
Il numero ordinale di una serie d’individui è, per la precedente definizione di No [Numero ordinale”], una classe di relazioni tra individui. Esso è dunque di un tipo diverso da qualsiasi individuo e non può essere parte di nessuna serie in cui compaiono degli individui. Ancora, si supponga che tutti gli ordinali finiti esistano come ordinali-individuo, cioè, come gli ordinali di una serie d’individui. Allora gli ordinali finiti stessi formano una serie il cui numero ordinale è ©; così @ esiste come ordinale-ordinale, cioè, come l’ordinale di una serie di ordinali. Ma il tipo di un ordinale-ordinale è quello delle classi di relazioni tra classi di relazioni tra individui. Così l’esistenza di © è stata provata in un tipo più alto di quello degli ordinali finiti. Ancora, il numero cardinale dei numeri ordinali di serie ben ordinate che possono essere costruite con gli ordinali finiti è X; quindi &| esiste nel tipo delle classi di classi di classi di relazioni tra classi di relazioni tra individui. Anche i numeri ordinali di serie ben ordinate composte di ordinali finiti possono essere disposti in ordine di grandezza, e il risultato è una serie ben ordinata il cui numero ordinale è @. Quindi ©; esi-
ste come ordinale-ordinale-ordinale. Questo processo può essere ripetuto per un qualsiasi numero finito di volte, e così possiamo stabilire l’esistenza, nei tipi appropriati, di X,, e @, per qualsiasi valore finito di il
Russell non lo rileva, ma si deve notare che, in questo modo, la matematica cantoriana è drasticamente potata: il
motivo è che non si possono raggiungere i numeri transfiniti relativamente “piccoli” ®» e N, né, naturalmente, nessuno dei numeri più grandi. In compenso, la derivazione del paradosso di Burali-Forti è bloccata: Ma il suddetto processo di generazione non conduce più a nessuna totalità di tutti gli ordinali, perché, se prendiamo tutti gli ordinali di un qualsiasi tipo dato, vi sono sempre ordinali più grandi nei tipi più alti; e non possiamo sommare insieme una classe di ordinali il cui tipo cresce oltre ogni limite finito. Così, in un tipo qualsiasi, tutti gli ordinali possono essere disposti in ordine di grandezza in una serie ben ordinata, la quale ha un numero ordinale di tipo più alto di quello degli ordinali che compongono la serie. Nel nuovo tipo, questo nuovo ordinale non è il più grande. Di fatto, non c’è un ordinale che sia il più grande in qualsiasi tipo, ma in ogni tipo tutti gli ordinali sono minori di qualche ordinale di tipo più alto. È impossibile completare la serie degli ordinali, poiché essa cresce fino a raggiungere tipi sopra ogni limite finito assegnato; quindi anche se ogni segmento della serie degli ordinali è ben ordinato, non possiamo dire che l’intera serie sia ben ordinata, perché l’“intera serie” è una finzione. Quindi la contraddizione di Burali-Forti scompare.!?°
Come si può osservare, il meccanismo che, nella teoria dei tipi, impedisce di ricavare il paradosso di BuraliForti è proprio il medesimo che blocca la dimostrazione dell’esistenza di serie infinite. Anche qui, la teoria dei tipi si rivela un’arma a doppio taglio. Essa impedisce il sorgere di contraddizioni che sorgevano nella teoria intuitiva degli insiemi, ma, nel contempo, blocca la dimostrazione di un teorema che, in questa teoria, appariva dimostrabiuri
7.2. UN ARGOMENTO MODALE CONTRO LA DEFINIZIONE RUSSELLIANA DI “NUMERO CARDINALE” In un articolo del 1977 intitolato “A difficulty with the Frege-Russell definition of number”, Robert Hambourger ha sollevato un’interessante obiezione alla definizione logicista di “numero naturale”. Come indica il titolo, la
critica è rivolta contro la concezione — che Russell condivide con Frege — che identifica i numeri cardinali con classi di classi. Sebbene Hambourger non connetta la sua critica con la teoria dei tipi, la discussione che svolgerò del suo argomento si basa su considerazioni che riguardano lo sviluppo dell’aritmetica nel contesto di questa teoria. L'argomento di Hambourger è di carattere modale, e si serve della nozione di “mondo possibile”. Si può supporre che Russell non ne avrebbe accettato i presupposti, perché egli — come Frege prima di lui, e come Quine dopo di lui — negava qualsiasi legittimità alle nozioni di modalità e di “mondo possibile”. Nel 1905, per esempio, Russell scrive: [...] l'argomento della modalità dovrebbe essere bandito dalla logica, poiché le proposizioni sono semplicemente vere o false, e non c’è un comparativo e un superlativo di verità come quello che è implicato dalle nozioni di contingenza e necessità. '?3
Nel 1913, Russell non ha cambiato idea:
olbia. 170 Russell [1908], $ X, pp. 100-101. Va sopra, cap. 2, $ 6.3. !72 È verosimile che Frege abbia avuto una sua parte nell’influenzare la posizione di Russell. In proposito, v. DejnoZka [2001], p. 26.
173 Russell [1905g], p. 520.
La teoria dei tipi del 1907
663
Si può stabilire in generale che la possibilità contrassegna sempre un’analisi insufficiente: quando l’analisi è completa, solo ciò che x
x
c
3
5
ga)
È
È
SI
L
è reale [actual] può essere rilevante, per la semplice ragione che c’è solo il reale, e che il meramente possibile non è nulla.”
74
[...] non possono esserci cose come gli oggetti irreali, e [...] qualsiasi teoria che assuma o implichi che ci siano dev'essere falsa. [...] E lo stesso si applica a qualsiasi filosofia che crede, in modo definitivo, in un regno di “possibili” che non sono reali [ac175
tual).
Una posizione confermata cinque anni dopo nell’ Introduction to Mathematical Philosophy: [...] sostenere che Amleto, per esempio, esiste nel suo mondo, cioè, nel mondo dell’immaginazione di Shakespeare, proprio come (per esempio) Napoleone è esistito nel mondo ordinario, è dire qualcosa che confonde deliberatamente, o altrimenti che è confuso in modo pressoché incredibile. C'è solo un mondo, il mondo “reale” [...].!?°
In The Analysis of Matter (1927), Russell spiega che “necessario”, “possibile” e “impossibile” non sono primariamente proprietà di enunciati chiusi, ma di enunciati aperti: Non penso che si possa farsene molto della modalità, la plausibilità della quale sembra essere derivata dal confondere le proposizioni con le funzioni proposizionali.'?”
Le funzioni proposizionali [...] sono di tre generi: quelle che sono vere per tutti i valori dell’argomento o argomenti, quelle che sono false per tutti i valori, e quelle che sono vere per alcuni argomenti e false per altri. Le prime si possono chiamare necessarie, le seconde impossibili, le terze possibili. E questi termini possono essere trasferiti alle proposizioni quando esse non sono conosciute come vere di per sé, ma ciò che si sa riguardo alla loro verità o falsità è dedotto dalla conoscenza di funzioni proposizionali. [...] Laddove [...] è utile dire che una proposizione è possibile, il fatto dipende dalla nostra ignoranza.'”*
Abbiamo riportato da un testo del 1927, ma questa concezione è sostenuta da Russell almeno dal 1904, e poi nel corso di tutta la sua carriera filosofica.” Premesso questo, può tuttavia essere interessante concedere a Hambourger i suoi presupposti modali e vedere se — in tale quadro — la concezione russelliana dei numeri naturali incontri realmente le difficoltà indicate. Cominciamo con l’esporre l’obiezione. L’argomento di Hambourger è rivolto contro la definizione dei numeri cardinali secondo cui, per esempio, il numero (cardinale) 1 sarebbe l’insieme di tutti gli insiemi che contengono un solo oggetto. Per evitare obiezioni provenienti dalla teoria russelliana dei tipi, secondo la quale non può esistere una totalità di tutte le entità, di tipo qualsiasi, Hambourger precisa che per “oggetto” egli intende «tutte e solo le cose che non sono insiemi». Possiamo dire che quelli che Hambourger chiama “oggetti” sono quelli che Russell, in “Mathematical logic...”, chiama “individui” — questo punto non è comunque importante. Hambourger muove da due assunzioni: (a) C'è almeno un mondo possibile in cui esiste il numero 1 ma in cui qualche oggetto [...] che esiste nel mondo attuale non esiste. (b) Il numero 1 è esattamente la stessa entità in ogni mondo possibile in cui 1 esiste; cioè, non si dà il caso che un’entità sia il numero 1 in un mondo possibile mentre un’altra entità è il numero 1 in un altro mondo possibile. !*' 174 Russell [1913a], parte I, cap. 2, p. 27.
!75 !7© !?” !78
Russell Russell Russell Russell
[1913a], [1919a], [1927a], [1927a],
parte II, cap. 5, p. 152. cap. 16, p. 169. cap. 17, p. 169. cap. 17, p. 170.
17° Jan DejnoZka ([2001], pp. 22-23) fornisce un elenco di nove testi, nell’arco di 36 anni, in cui Russell sostiene questa posizione. Tra essi menzioniamo, oltre all’appena citato Russell [1927a]: Russell [1905g], p. 518; Russell [1908], $ II, p. 66, prima nota; Russell [1913c], pp. 181-183 (per la “necessità”); Russell [1918-19], $ V, p. 231; Russell [1919a], cap. 15, p. 165; Russell [1940], cap. 2, p. 37 (per la “possibi-
lità). A quest’elenco aggiungerei Russell [1904a], $ I, p. 26, e $ II, p. 45, e Russell [1910d], pp. 355-356. Contro questa concezione della modalità reagì Wittgenstein nel Tractatus Logico-Philosophicus, sostenendo invece che necessarie sono le tautologie, possibili le proposizioni fattuali, e impossibili le contraddizioni: «La verità della tautologia è certa, della proposizione possibile [Wittgenstein considera proposizioni solo gli enunciati fattuali, non gli enunciati logici], della contraddizione impossibile» (Wittgenstein [1921], prop. 4.464). Più avanti, Wittgenstein torna sull’argomento, scrivendo: «È scorretto rendere in parole la proposizione “(4x) . fr? — come fa Russell — mediante “fr è possibile”. Certezza, possibilità o impossibilità di una situazione non sono espresse da una proposizione, ma dall’essere un’espressione una tautologia, una proposizione dotata di senso, 0 una contraddizione (Wittgenstein [1921], prop. 5.525). Per maggiori informazioni sulle idee di Wittgenstein, v. sotto, cap. 10, $ 5, e cap. 12, $ 2.5. 150 Hambourger [1977], p. 409.
!5! Hambourger [1977], p. 410.
capitolo 9
664
Poi sviluppa un argomento modale basato su due premesse, che egli giustifica in modo che si può ritenere soddisfacente: (1) Gli insiemi non contengono membri inesistenti. GR è x . 0 A ANTO s 5 (2) Un insieme contiene gli stessi membri in ogni mondo possibile in cui esiste.
182
Dalle premesse (1) e (2) — osserva Hambourger — risulta che: [...] un insieme che esiste nel mondo reale esiste in un secondo mondo possibile solo se tutto ciò che appartiene ad esso nel mondo reale esiste in quel secondo mondo. Per esempio, si supponga che un insieme S contenga un'entità a che esiste contingentemente nel mondo reale, e si supponga che W sia un mondo possibile in cui a non esiste. Allora la premessa (2) richiede che S contenga a in ciascun mondo in cui S esiste, e la premessa (1) richiede che S non contenga a in W (perché nessun insieme lo contiene). Ma al-
lora, prese insieme, le premesse richiedono che S non esista in W. Inoltre, lo stesso ragionamento porterà alla conclusione che nessun insieme che contiene S nel mondo attuale esiste in W, che nessun insieme che contiene queil’insieme [che contiene cioè un in-
sieme contenente S] esiste in W, ecc. Il risultato di ciò è che gli insiemi che contengono oggetti che esistono contingentemente 0 che contengono insiemi contenenti tali oggetti esistono essi stessi contingentemente."*
Ma questo — sostiene Hambourger — fa sorgere un problema riguardo alla definizione di “numero cardinale” di Frege e Russell: Infatti, in questa definizione, i numeri sono identificati con insiemi che contengono insiemi che, a loro volta contengono oggetti che
esistono contingentemente. Ma se il precedente argomento è valido, questi insiemi esistono contingentemente, mentre i numeri devono esistere di necessità. Per esempio, sia S l’insieme di tutti gli insiemi unità,*4 l'insieme che la definizione di Frege-Russell as-
sume essere il numero 1, e sia a un qualsiasi oggetto che esiste nel mondo reale ma non esiste in tutti imodi possibili. Allora, tra le altre cose, S contiene l’insieme unità a cui appartiene a e nient'altro. Chiamiamo quest’insieme 7. Ora, se il precedente ragionamento è valido, allora 7 non esiste nei mondi possibili in cui non esiste a, e S non esiste nei mondi possibili in cui 7 non esiste; così
S non esiste nei mondi in cui a non esiste. !*°
Questo risultato è tuttavia in conflitto con le assunzioni (a) e (5): almeno una di esse dev'essere respinta se si vuole mantenere la definizione del numero 1 data da Frege-Russell: Una possibilità è respingere (b). Se si fa questo, si può sostenere che nel mondo reale S è il numero 1 ma che in un mondo in cui a non esiste qualche altra entità (per es., l'insieme che in quel mondo è l’insieme di tutti gli insiemi unità) è il numero 1. [...] D’altra parte, se si accetta (5), allora si ammetterà che se S è il numero
1 nel mondo reale, S è il numero
1 in ciascun mondo in cui 1 esiste.
E in questo caso, poiché S non esiste nei mondi in cui 4 non esiste, neppure 1 esisterà in tali mondi. Ma siccome a può essere un oggetto qualsiasi, quest’ alternativa porta alla conclusione che 1 esiste solo nei mondi in cui esiste ogni oggetto esistente nel mondo reale; cioè, porta alla conclusione che (a) è falsa.!89
Hambourger conclude: «Poiché io credo che (a) e (b) siano entrambe vere, credo che la definizione sia inadeguaug
L’assunzione (a) è difficile da respingere, una volta che si accetti una logica di mondi possibili. Quanto all'assunzione (5), Hambourger argomenta che, se essa fosse falsa, avremmo difficoltà a stabilire confronti numerici tra mondi possibili diversi: Per esempio, laddove W, e W, sono due mondi possibili, è naturale comprendere l’ enunciato (c) Il numero dei figli di John in W, è identico al numero dei figli di John in W)
182 V. Hambourger [1977], pp. 411-412. Riguardo «l’insieme degli esseri umani, per esempio, potrebbe due mondi», ma ritiene che quest’obiezione riposi su i a meno che non ci siano proprio gli stessi
alla premessa (2), Hambourger osserva che si potrebbe avanzare l’obiezione che esistere in ciascuno di due mondi possibili, anche se vi sono esseri umani diversi nei una confusione: «Ciò che è vero è che in ciascun mondo ci sarà un insieme di esseri umani in entrambi i mondi, questi saranno insiemi diversi» (Hambourger [1977], DL
2-413).
183 Hambourger [1977], p. 413. IS6A rigor di termini, l'insieme di tutti gli insiemi unità di oggetti. [...]. [Nota di Hambourger.]
155 Hambourger [1977], pp. 413-414. 156 Hambourger [1977], p. 414.
187 Ibid.
La teoria dei tipi del 1907
665
in modo tale che esso sia vero se e solo se la descrizione “il numero dei figli di John” ha il medesimo riferimento in W, come in W.. Tuttavia, se (5) fosse falso, il riferimento della descrizione potrebbe differire nei due mondi, anche se John avesse, diciamo, esattamente un figlio in ciascuno di essi. Perché se John avesse un figlio in ciascun mondo, allora “il numero dei figli di John” si riferirebbe in W, all’entità che è il numero 1 in W,, mentre in W, si riferirebbe all’entità che è il numero 1 in W.. E se (b) fosse falso,
queste sarebbero entità diverse. '8* Un problema del tutto simile a quello che qui pone Hambourger, riguardo al confronto tra numeri di entità che si trovano in mondi possibili diversi, si potrebbe porre già nel mondo reale, qualora si accetti la teoria russelliana dei tipi che abbiamo esposto sopra. Si potrebbe infatti argomentare che, per esempio, avendo una classe @ formata di tre individui e una classe 8 formata di tre classi d’individui, non si possa dire che il numero cardinale di @ è identico al numero cardinale di 8, perché il numero cardinale di @ è una classe di classi d’individui, mentre il numero
cardinale di #8è una classe di classi di classi d’individui, e si tratta pertanto di entità sicuramente diverse.!*” In realtà, le cose non stanno così. Il fatto è che, secondo la teoria ramificata dei tipi sostenuta da Russell, quando diciamo “il numero cardinale di (° diciamo qualcosa di ambiguo. Supponendo che sia « una classe di un certo tipo fissato, anche classi di tipo logico differente da @ possono avere lo stesso numero cardinale di @. Infatti, anche una classe ydi tipo diverso da @ può essere correlata con Qin modo che tra gli elementi di ye quelli di @ vi sia una corrispondenza biunivoca, e questo è tutto quello che serve per affermare che ye & hanno lo stesso numero cardinale. Ora, il numero cardinale di & è, secondo la definizione di Russell, una classe che, secondo la teoria
dei tipi, dev'essere formata da elementi di tipo omogeneo: questa classe dovrà dunque contenere tutte le classi di un certo tipo che hanno lo stesso numero cardinale di a. Ma, e questo è il punto cruciale, che @ sia di un certo tipo, non implica che il numero cardinale di a debba essere formato di classi aventi lo stesso tipo di @. il numero cardinale di & può essere formato di classi aventi un tipo qualsiasi. Solo quello che Russell chiama il numero cardinale omogeneo di a dev'essere formato di classi aventi lo stesso tipo logico di a. Ora vediamo come si risolve — nel quadro della teoria ramificata dei tipi — il problema di affermare che il numero cardinale della classe 2 è uguale al numero cardinale della classe /, laddove @ e f hanno tipi logici diversi. Per verificare l’uguaglianza, basterà disambiguare le espressioni “il numero cardinale di @° e “il numero cardinale di 2” in modo che esse si riferiscano a due classi di classi dello stesso tipo logico t: una costituita di tutte le classi di tipo f — 1 cardinalmente simili ad 4, l’altra costituita di tutte le classi di tipo ft— 1 cardinalmente simili a D. Se le due classi di classi sono identiche, allora è vero che “Il numero cardinale di @ è uguale al numero cardina-
le di 8”, altrimenti è falso. Si osservi che quella di disambiguare i tipi di “il numero cardinale di @° e di “il numero cardinale di 2° in modo che essi coincidano, non è una semplice opzione: nella teoria dei tipi è un obbligo che scaturisce dalla teoria stessa. Infatti un’uguaglianza potrà essere vera o falsa solo quando l’identità si afferma di oggetti dello stesso tipo logico: altrimenti l'uguaglianza è priva di senso." Ora, nel disambiguare un’espressione tipicamente ambigua del simbolismo
noi abbiamo
tutta la libertà possibile, ma, ovviamente,
dobbiamo
sempre
fornire un’interpretazione sensata. Il problema posto da Hambourger si può risolvere, nel contesto della teoria dei tipi, in modo del tutto analogo a quello del confronto tra i numeri di classi di tipo logico diverso. Il punto è che, se si ammettono mondi possibili, le espressioni ‘il numero dei figli di John in W;” e “il numero dei figli di John in W,” sono ambigue non solo riguardo al tipo logico, ma anche riguardo al mondo possibile. L’ambiguità rispetto al tipo logico è eliminata dalla precisazione di Hambourger di riferirsi al tipo delle classi di classi d’individui. Ma continua a permanere l’ ambiguità rispetto al mondo possibile. Infatti, per esempio, il numero dei figli di John in W, può essere interpretato come la classe di tutte le classi d’individui di W; che sono cardinalmente simili alla classe dei figli che John ha W., oppure come la classe di tutte le classi d’individui di W, che sono cardinalmente simili alla classe dei figli che John ha W,.
Può dunque esser vero che il numero dei figli di John in W, sia identico al numero dei figli di John in W, anche se W, non contiene gli stessi oggetti di W). Ciò accade quando il numero dei figli di John in W, è, in W,, lo stesso numero che è, sempre in W,, il numero dei figli di John in W: questi numeri sono allora entrambi identificati con !88 Hambourger [1977], pp.410-411. 5° Un’argomentazione simile si può trovare in Giaquinto [2002], parte III, cap. 4, pp. 114-115. 19° Ciò deriva dal fatto che affermare l’identità tra x e y significa — secondo una definizione che Russell mantiene costante in tutta la sua carriera, e che è ripetuta anche in Russell [1908], $ VI, p. 85 — affermare che tutte le funzioni (predicative, nella teoria dei tipi) soddisfatte
da x lo sono anche da y; ma quest’affermazione, secondo la teoria dei tipi, ha senso solo se x e y appartengono allo stesso tipo logico.
666
capitolo 9
la classe di tutte le classi d’individui di W, (di W;, non di W.!) che sono cardinalmente simili alla classe dei figli di
John in W, (o alla classe dei figli di John in W;). Invece, il numero dei figli di John in W, non è, in W,, lo stesso numero che è, in W,, il numero dei figli di John in W,.
Seguendo la falsariga della teoria dei tipi di Russell si può dunque — contrariamente a quanto sostiene Hambourger — respingere l’assunzione (b) continuando a dare un senso ai confronti numerici tra classi appartenenti a È Fee - 191 mondi possibili diversi.
!°! Chihara [1980], pp. 43-45, propone una diversa soluzione del puzzle di Hambourger. La sua proposta consiste nel rimpiazzare le proprietà — come, per esempio, “essere un figlio di John” — che hanno estensioni diverse a seconda del mondo possibile, con proprietà includenti un riferimento a un mondo possibile — come “essere un figlio di John in W,” o “essere un figlio di John in W,”. Queste ultime proprietà non hanno un'estensione diversa a seconda del mondo possibile di riferimento: in realtà esse isolano delle sottoclassi dall’unione U dei domini di tutti i mondi possibili. A questo punto, nell’ipotesi che John abbia, per esempio, esattamente un figlio in ciascuno dei due mondi W, e W,, sarà corretto affermare che il numero cardinale (nel tipo, per es. delle classi di classi di individui) dei figli di John in W, è identico al numero cardinale dei figli di John in W., perché la classe comprendente tutte le classi (di individui) di U cardinalmente simili alla classe dei figli di John in W, sarà effettivamente identica alla classe comprendente tutte le classi (di individui) di U cardinalmente simili alla classe dei figli di John in W.. La soluzione indicata da Chihara, di includere nel dominio degli individui tutti gli individui di tutti i mondi possibili, richiede — come egli stesso riconosce (pp. 44-45) — una concezione fortemente realista dei mondi possibili, simile a quella sostenuta da David Lewis. L’idea che propongo nel testo è invece compatibile con una concezione meno realista dei mondi possibili — e si armonizza bene con la struttura reale della teoria dei tipi di Russell.
CAPITOLO 10 LA TEORIA DEL GIUDIZIO COME RELAZIONE MULTIPLA
Lo sviluppo tecnico della teoria dei Principia Mathematica è pressoché identico a quello della teoria dei tipi di “Mathematical logic...”, ma c’è una differenza importante nelle basi ontologiche delle due dottrine: in “Mathematical logic...’ Russell assume ancora la teoria dei Principles secondo cui le proposizioni sono entità e l’idea — propria della sua teoria sostituzionale — che le funzioni proposizionali siano eliminabili sulla base di un’analisi in termini di proposizioni come entità non linguistiche; nei Principia, invece, la teoria sostituzionale è definitiva-
mente abbandonata e le proposizioni, in senso non linguistico, sono considerate pseudoentità, ontologicamente riducibili ai loro componenti: particolari e universali. Il rifiuto delle proposizioni in senso ontologico consegue dall’adozione, da parte di Russell, di quella che è nota, in letteratura, come teoria del giudizio come relazione
multipla (multiple relation theory of judgement). Un esame di questa teoria, che Russell sostenne dal 1909 al 1913," è dunque cruciale per far luce sui presupposti ontologici dei Principia. Vi dedicheremo questo capitolo.
1.I GIUDIZI ELEMENTARI
ALL’EPOCA DEI PRINCIPIA
La teoria del giudizio come relazione multipla è delineata nei Principia, ma ne troviamo una trattazione più diffusa in un articolo uscito nel 1910 (lo stesso anno della pubblicazione del primo volume dei Principia), dal titolo “On the nature of truth and falsehood”.? Esaminiamo dapprima questo scritto. Dopo alcune considerazioni preliminari, su cui non ci soffermiamo, Russell osserva che: Parlando in generale, le cose che sono vere o false, nel senso che ci riguarda, sono asserzioni [statements], e credenze 0 giudizi. Quando, per esempio, vediamo il sole splendere, il sole stesso non è “vero”, ma il giudizio “Il sole splende” è vero. La verità o falSità di un’asserzione può essere definita nei termini della verità o falsità di credenze: Un’asserzione è vera quando una persona che la crede crede in modo veritiero, e falsa quando una persona che la crede crede falsamente. Così, considerando la natura della verità, possiamo limitarci alla verità delle credenze, poiché la verità delle asserzioni è una nozione derivata da quella delle credenze.‘
Russell prosegue poi interrogandosi su quale sia la differenza tra una credenza vera e una falsa. Egli spiega che, con questo, non intende individuare un criterio in base al quale riconosciamo una credenza vera, ma intende inda-
gare che cosa sia la verità di una credenza: Non vado in cerca di ciò che si chiama un criterio della verità, cioè di qualche qualità, diversa dalla verità, che appartenga a tutto ciò che è vero e a nient'altro. [...] Un criterio è una specie di marchio di fabbrica, cioè una certa caratteristica ovvia che sia una garanzia di genuinità. [...] Ora io non credo che la verità abbia, universalmente, nessun marchio di fabbrica del genere: non credo che
ci sia nessun’etichetta per mezzo della quale possiamo sempre sapere che un giudizio è vero o falso. Ma questa non è la questione che voglio discutere: voglio discutere che cosa la verità e la falsità realmente sono, non quali caratteristiche estranee esse abbiano per mezzo delle quali possiamo riconoscerle.”
Se ciò che è vero o falso sono sempre 1 giudizi è evidente — osserva Russell — che possono esserci verità o falsità solo se c’è una mente che giudica. Tuttavia, la verità o la falsità di un giudizio non dipendono dalla persona che esprime il giudizio, ma esclusivamente dai fatti a proposito dei quali essa giudica; per esempio:
' Russell accenna già alla possibilità (che egli respinge, all’epoca) di una teoria del genere in Russell [1904a], $ III, p. 69, comincia a considerarla plausibile in alcuni manoscritti del 1906-07 (v. Rodrfguez-Consuegra [2005], $ 6), per poi svilupparla e sostenerla pubblicamente negli scritti del periodo 1909-13, nei quali è battezzata teoria del giudizio come relazione multipla (in precedenza, la teoria non aveva un nome).
? V. Russell [1910b].
3 Userò le parole “credenza” e “giudizio” come sinonimi. [Nota di Russell.]
4 Russell [1910b], p. 117. ° Russell [1910b], p. 117.
capitolo 10
668
Se io giudico che Carlo I morì nel suo letto, giudico falsamente, non a causa di qualcosa che ha a che fare con me, ma a causa del fatto che egli non morì nel suo letto. Similmente, se io giudico che egli morì sul patibolo, giudico in modo vero, a causa di un evento che realmente avvenne 260 anni fa.°
Russell ne conclude che «da verità o falsità di un giudizio hanno sempre un fondamento oggettivo, ed è namrale chiedersi se non siano verità e falsità oggettive ad essere gli oggetti, rispettivamente, dei giudizi veri e falsi». Qui Russell sta menzionando la sua precedente teoria delle proposizioni che, in una lettera a Frege datata 24 maggio 1903, esponeva così: Rappresentazione [Vorstellung] e giudizio [Urtheil] hanno entrambi in tutti i casi un oggetto: ciò che io chiamo “Proposition” può essere oggetto di un giudizio, e parimenti può essere oggetto di una rappresentazione. Vi sono dunque due modi in cui si può pensare a un oggetto, nel caso che quest’oggetto sia un complesso [Komplex]: lo si può rappresentare [vorste/len], oppure lo si può giudicare [urtheilen]; l'oggetto è però in entrambi i casi lo stesso (per es. quando si dice “il vento freddo” e quando si dice “il vento è freddo”). Il tratto di giudizio significa [bedeutet] dunque per me un modo diverso di essere diretti a un Oegello: I complessi sono veri o falsi: quando si giudica, si pensa di trovare un complesso vero; ma ci si può naturalmente sbagliare.*
In questa teoria — che Russell deriva dall’amico G. E. Moore’ — le proposizioni hanno un'esistenza oggettiva: sono entità complesse che costituiscono il riferimento degli enunciati; entità costituite dalle denotazioni delle diverse parole che compaiono negli enunciati corrispondenti. Alcune proposizioni sono vere, altre false, e questo — secondo la teoria di Moore e Russell —
è un fatto primitivo, non ulteriormente analizzabile.!° Un giudizio, una
credenza, secondo questa teoria non è altro che una relazione diadica tra una mente giudicante e una proposizione: «la credenza è un certo atteggiamento [attitude] nei riguardi delle proposizioni, che si chiama conoscenza quando esse sono vere, errore quando sono false»."! In questo schema, «la distinzione tra vero e falso applicata ai giudizi è derivata rispetto alla distinzione tra vero e falso applicata agli oggetti del giudizio», cioè alle proposizioni: «ci sono, a parte e indipendentemente dal giudizio, proposizioni vere e false, e [...] l'uno e l’altro genere può essere assunto, creduto o non creduto [disbe-
lieved)».!® «Che cosa sia la verità, e che cosa sia la falsità», scriveva Russell quando sosteneva questa teoria, «dobbiamo semplicemente afferrarlo [apprehend], poiché entrambe sembrano non passibili d’analisi».!* La preferenza che gli uomini hanno per le proposizioni vere sarebbe fondata «su una proposizione etica primitiva: “È bene credere le proposizioni vere, e male credere quelle false». Più tardi,'° Russell considerò questa dottrina una forma di quelle che chiamò “teorie della doppia corrispondenza”, tra le quali annoverò anche la teoria delle proposizioni sostenuta da Alexius Meinong.'” Il nome deriva dal fatto che, secondo queste teorie, non solo i giudizi veri hanno per oggetto (“corrispondono a”) qualcosa, ma anche quelli falsi. Si osservi, però, che la teoria della “doppia corrispondenza” in precedenza sostenuta da Russell non è una teoria corrispondentista della verità nel senso usuale: a essere vere o false, secondo tale teoria, sono primariamente le proposizioni, in senso ontologico, e una proposizione vera non deve “corrispondere” ad alcunché, ma solo avere una certa proprietà che la distingue da quelle false: le proposizioni non corrispondono talora (quando sono vere) a fatti, ma sono sempre fatti — fatti che possono essere falsi. Benché questa teoria della “doppia corrispondenza” non sia — come sottolinea Russell — logicamente incoerente, nel 1909 non gli pare più plausibile. Egli osserva: Riguardo alle verità, questo modo di vedere è plausibilissimo. Ma riguardo alle falsità, è tutto il contrario che plausibile; tuttavia, come vedremo, è difficile sostenerlo riguardo alle verità senza essere costretti a sostenerlo anche riguardo alle falsità.!*
° Russell [1910b], pp. 117-118. ? Russell [1910b], p. 118. è In Frege [1976], p. 242. ? V. G. E. Moore [1899a]. 10 V. Russell [1904a], $ III, p. 75, e Moore [1899a], p. 180.
!! 1? !3 14 !5
Russell Russell Russell Russell Ibid.
[1904a], [1910b], [1904a], [1904a],
$ III, p. 75. p. 118. $ III, p. 74. $ III, p. 76.
!6 V. Russell [1913a], parte II, cap. 5, pp. 151-153. !7 Abbiamo accennato alla teoria delle proposizioni di Meinong sopra, nel cap. 7, $ 2.
18 Russell [1910b], p. 118.
La teoria del giudizio come relazione multipla
669
Si potrebbe infatti, spiega Russell, cercare di correggere la teoria sostenendo che i giudizi veri hanno un oggetto, mentre quelli falsi non l'hanno. Ciò comporterebbe però una diversa analisi dei giudizi veri rispetto a quelli falsi: i primi sarebbero relazioni tra una mente e un singolo oggetto, mentre i secondi sarebbero qualcosa di diverso. Ma questo, dice Russell, è assurdo: [...] perché ciò creerebbe una differenza intrinseca tra giudizi veri e falsi, e ci metterebbe in grado (il che è ovviamente impossibile) di scoprire la verità o la falsità di un giudizio semplicemente attraverso l’esame della natura intrinseca del giudizio."
A quest’argomento si può obiettare che è implausibile assumere che chi formula un giudizio (chi ha una credenza) debba sapere immediatamente, per introspezione, se esso abbia o no un oggetto. Evidentemente non è così, come testimonia la stessa discussione filosofica relativa agli oggetti dei giudizi. In ogni caso, dal precedente argomento Russell conclude che, se si sostiene che i giudizi veri abbiano un oggetto, bisogna sostenere la stessa cosa per quelli falsi — una conclusione plausibile, direi, per ragioni di economia teorica. Egli però assume che, se i giudizi falsi hanno un oggetto, quest’oggetto debba essere diverso da quello dei corrispondenti giudizi veri: Così ci saranno nel mondo entità, non dipendenti dall’esistenza dei giudizi, che possono essere descritte come falsità oggettive. Questo è di per sé quasi incredibile: noi abbiamo l'impressione che non ci sarebbero falsità se non ci fossero menti che fanno errori.‘20
Questa non è, tuttavia, la sola possibilità: si potrebbe infatti sostenere che un giudizio vero e uno falso abbiano entrambi lo stesso oggetto: quel fatto che rende vero il primo e falso il secondo. Questa sarà la teoria sostenuta da Wittgenstein nel Tractatus e che, come vedremo alla fine di questo capitolo, Russell farà propria a partire dal 199, Nello scritto in esame, Russell prosegue osservando che la sua vecchia teoria ha lo svantaggio di lasciare non spiegata la differenza tra verità e falsità. Tuttavia: Abbiamo l’impressione che, quando giudichiamo in modo vero, si debba trovare, al di fuori del nostro giudizio, qualche entità in
qualche modo “corrispondente” al nostro giudizio, mentre quando giudichiamo falsamente non c’è una tale entità “corrisponden21 {i
Quest’idea preteorica, che rende implausibile la teoria delle proposizioni come verità o falsità oggettive, non dimostra, riconosce Russell, che tale teoria debba essere errata, ma costituisce una ragione per cercare di sostituirla con una migliore, se è possibile. Tutto ciò conduce Russell a proporre una teoria secondo cui nessun giudizio consiste in una relazione tra una mente e un singolo oggetto: La via d’uscita dalla difficoltà consiste nel sostenere che, sia che giudichiamo in modo vero, sia che giudichiamo falsamente, non c’è una sola cosa che stiamo giudicando. Quando giudichiamo che Carlo I morì sul patibolo, abbiamo presenti [before us], non un solo oggetto, ma diversi oggetti, vale a dire Carlo I e il morire e il patibolo. Similmente quando giudichiamo che Carlo I morì nel suo letto, abbiamo presenti [before us] gli oggetti Carlo I, il morire, e il suo letto. Questi oggetti non sono finzioni: essi sono altrettanto genuini degli oggetti del giudizio vero. Quindi sfuggiamo alla necessità di ammettere falsità oggettive, o di ammettere che giudicando falsamente non abbiamo presente [before the mind)[°] nulla. Così, secondo questo modo di vedere, il giudizio è una relazione della malte con diversi altri termini: se questi altri termini hanno tra loro una relazione “corrispondente”, il giudizio è vero; se no è falso.
Russell procede poi con lo spiegare nei particolari la sua nuova teoria. Innanzi tutto, egli precisa che, affermando che il giudizio è una relazione della mente con diverse cose, non intende dire che la mente abbia relazioni separate con ciascuna di queste cose. Per esempio, dicendo che il giudizio che Carlo I è morto sul patibolo è una relazione tra una mente, Carlo I, il morire e il patibolo, non s’intende che la mente ha una relazione con Carlo I, e ha
la stessa relazione con il morire, e ha la stessa relazione con il patibolo:
!° Russell [1910b], p. 120. 20 Russell [1910b], p. 119.
?! Ibid.
22 Sia nell’articolo in esame, sia in altri testi coevi, Russell usa le locuzioni “to have before us” e “to have before the mind” (“aver presente’) a proposito di certi oggetti, per rilevare che tali oggetti non sono idee nella nostra mente, ma sono autentiche entità che sussistono al di fuori di essa. Russell spiega l’uso di questa locuzione in un passo di Yhe Problems of Philosophy, del 1912 (cap. 4, p. 22).
23 Russell [1910b], p. 120.
capitolo 10
670
Nulla che riguardi Carlo I e il morire e il patibolo separatamente e individualmente darà il giudizio “Carlo I morì sul patibolo”. Per ottenere questo giudizio, dobbiamo avere una singola unità della mente e Carlo I e il morire e il patibolo, Fioo dobbiamo avere, non diverse istanze di una relazione tra due termini, ma una sola istanza di una relazione tra più di due termini.
Il giudizio è dunque una “relazione multipla” — cioè, una relazione poliadica — uno dei termini della quale è una mente. Russell riassume così, in prima istanza, la sua nuova dottrina: Ogni giudizio è una relazione di una mente con diversi oggetti, uno dei quali è una relazione [o una qualità]; il giudizio è vero quando la relazione che è una degli oggetti correla gli altri oggetti, altrimenti è falso. Così [...] [quando, per csompio. si giudica che A ama B], l’amore, che è una relazione, è uno degli oggetti del giudizio, e il giudizio è vero se l’amore correla A e B.
Per rendere la tesi adeguata occorre tuttavia — osserva Russell — distinguere tra il giudicare che A ama B e il giudicare che B ama A, che sono, ovviamente, cose diverse. La soluzione, secondo quanto Russell afferma in “On the nature of truth and falsehood”, consiste sostenere che la relazione che entra nel giudizio deve avere un verso, da Aa Bo da BadA, e il giudizio è vero se esiste un complesso in cui A e B sono correlati dalla relazione presa con il medesimo verso che aveva come termine della relazione multipla: Così il giudizio che due termini hanno una certa relazione R è una relazione della mente con i due oggetti e la relazione R con il senso appropriato: il complesso “corrispondente” consiste dei due termini correlati dalla relazione R nel medesimo senso. Il giudiRIN x x 26 zio è vero quando c’è un tale complesso, e falso quando non c’è.
Questa teoria del giudizio come relazione multipla, non ha, secondo Russell, solo il pregio di rendere definibili la verità e la falsità, ma anche quella di «spiegare la differenza tra giudizio e percezione, e la ragione per cui la percezione non è soggetta all’errore come lo è il giudizio».”” Russell s’inserisce qui in un’antica tradizione filosofica — risalente almeno a Epicuro — che sostiene che, mentre un giudizio può essere falso, una percezione non può mai esserlo. La risposta russelliana all’obiezione che i sogni e le allucinazioni smentirebbero l’infallibilità della percezione è quella tradizionale: la percezione è — in sé — corretta anche in questi casi, ciò che può essere scorretto è un eventuale giudizio basato sulla percezione. Riguardo alla percezione, Russell sostiene che essa è una relazione di una mente con un oggetto: Supponiamo che io veda simultaneamente sul mio tavolo un coltello e un libro, il coltello essendo a sinistra del libro. La percezione mi presenta un oggetto complesso, che consiste del coltello e del libro in una certa posizione relativa (così come altri oggetti, che possiamo ignorare). Se presto attenzione a quest’oggetto complesso e lo analizzo, posso arrivare al giudizio “Il coltello è a sinistra del libro”. Qui il coltello e il libro e la loro relazione spaziale presenti alla mia mente in modo separato; ma nella percezione, io ho solo l’intero “coltello-a-sinistra-del-libro”. Così nella percezione io percepisco un singolo oggetto complesso, mentre in un giudizio basato sulla percezione io ho presenti le parti dell’oggetto complesso separatamente, anche se simultaneamente. Per percepire un oggetto complesso, come “coltello-a-sinistra-del-libro”, deve esservi un tale oggetto, perché altrimenti la mia percezione non avrebbe oggetto, cioè non vi sarebbe nessuna percezione, poiché la relazione di percezione richiede i due termini, il percipiente e la
cosa percepita.” Dunque Russell riafferma, per le percezioni, una teoria molto simile a quella da lui sostenuta, nel passato, per le percezioni e per i giudizi: le percezioni sarebbero effettivamente relazioni diadiche tra una mente e un oggetto (il più delle volte complesso) della percezione. Tale oggetto non può non esistere, perché una relazione deve necessariamente avere un relatum. (Questa non è intesa da Russell, naturalmente, come una prova che ciò che percepiamo dev'essere qualcosa di esterno alla nostra mente, ma solo come una prova che, se davvero percepiamo (qualcosa), dev’esserci qualcosa che percepiamo.) Una percezione non può dunque essere fallace, e ogni giudizio che deriva da una percezione per semplice analisi dev'essere vero. Possono sì darsi giudizi falsi basati su percezioni, ma questo si deve al fatto che possiamo sbagliarci nell’analisi di ciò che nella percezione ci è dato. Ecco quindi che si spiega il fatto che la percezione sia infallibile mentre il giudizio non lo è: la prima è una relazione di una mente con ur oggetto, mentre il secondo è una relazione di una mente con diversi oggetti, i quali possono mancare di formare, nella realtà, un unico complesso.
24 25 2° 2? 28
Russell Russell Russell Russell Russell
[1910b], [1910b], [1910b], [1910b], [1910b],
pp. 120-121. p. 122. p. 124. p. 122. p. 123.
La teoria del giudizio come relazione multipla
671
La metafisica implicata dalla teoria del giudizio come relazione multipla si può riassumere come segue. Il mondo è costituito di particolari e di universali — relazioni e qualità —, che sono oggetti semplici. Vi sono poi dei complessi di oggetti semplici, come A-nella-relazione-R-con-B, o A-con-la-proprietà-P (dei “fatti”, potremmo dire) i quali possono costituire l'oggetto della percezione. Il giudizio è invece una relazione multipla tra una mente e diversi oggetti, almeno uno dei quali è una qualità o una relazione: esso è vero solo se il complesso corrispondente esiste. È proprio dall’enunciazione di questa metafisica che comincia l'esposizione della teoria del giudizio come relazione multipla nei Principia:”° L’universo consiste di oggetti che hanno varie qualità e che stanno in varie relazioni. Alcuni degli oggetti che si presentano nell’universo sono complessi. Quando un oggetto è complesso, consiste di parti interrelate. Consideriamo un oggetto complesso
composto di due parti a e b che stanno l’una con l’altra nella relazione R. L'oggetto complesso “a-nella-relazione-R-con-b” può essere passibile di essere percepito; quando è percepito, è percepito come un solo oggetto. L'attenzione può mostrare che esso è complesso; noi allora giudichiamo che a e b stanno nella relazione R. Tale giudizio, essendo derivato dalla percezione mediante la semplice attenzione, può essere chiamato un “giudizio di percezione”. Questo giudizio di percezione, considerato come un accadimento reale, è una relazione di quattro termini, ossia a, b, e Re
il percipiente.®
Dopo qualche altra spiegazione, Russell scrive: A causa della pluralità di oggetti di un singolo giudizio, ne segue che ciò che chiamiamo una “proposizione” [proposition] (nel senso in cui questa è distinta dall’enunciato [phrase] che la esprime) non è affatto una singola entità. Vale a dire, l’espressione [phrase] che esprime la proposizione è ciò che chiamiamo simbolo “incompleto” [...]; esso non ha significato in se stesso ma richiede qualche integrazione al fine di acquisire un significato completo.
Ciò — prosegue Russell — può non essere subito evidente a causa del fatto «che il giudizio in se stesso fornisce un'integrazione sufficiente, e che il giudizio in se stesso non reca alcun’aggiunta verbale alla proposizione». Se si suppone che un enunciato denoti una proposizione (in senso ontologico), si deve concludere che, per esempio, “la proposizione denotata da ‘Socrate è umano””, denota la stessa cosa di “Socrate è umano”; ma ora Russell sostiene che, nel secondo caso, il significato del simbolo incompleto “Socrate è umano” sia completato (sia pure non in forma verbalmente esplicita) dall’atto del giudicare, dell’asserire, cosicché non abbiamo più un simbolo incompleto. (Nei Principia, gli enunciati asseriti sono fatti precedere dal simbolo di asserzione “+”, che Russell mutua
da Frege.) Con l’accettazione di queste tesi, la vecchia teoria sostituzionale, basata sull’assunzione di proposizioni come entità non linguistiche, è implicitamente respinta.
2. L'EVOLUZIONE SUCCESSIVA Il 7 maggio del 1913, Russell cominciò a scrivere quella che aveva dedicata all’ epistemologia: si tratta di Yheory of Knowledge. Il libro fu sempre incompiuto a causa delle difficoltà sorte all’interno della teoria quale Russell aveva basato l’intera costruzione. Delle sei parti previste
concepito come un’opera di grande respiro abbandonato un mese dopo, rimanendo per del giudizio come relazione multipla, sulla furono portate a termine solo le prime due,
divise, rispettivamente, in nove e sette capitoli, per un totale di 350 pagine manoscritte, stese nel breve spazio di
tempo tra il 7 maggio e il 6 giugno del 1913. I primi sei capitoli furono pubblicati sul Monist tra il 1914 e il 1915 in forma di articoli separati, gli altri rimasero allo stato di manoscritto. Ciò che resta di quell’opera, è stato rico2 Pur non essendo i Principia opera del solo Russell, attribuirò esclusivamente a lui le idee presentate nel secondo capitolo dell’introduzione, poiché esso costituisce la ripresa, quasi parola per parola, del testo di un articolo pubblicato nel 1910 a firma del solo Russell (v. [1910c]). 30. [PM], vol. I, introduzione, cap. 2, $ III, p. 43. di [PM], vol. I, introduzione, cap. 2, $ III, p. 44.
°° Ibid.
33 I primi tre capitoli furono raccolti sotto il titolo “On the nature of acquaintance” e pubblicati con diversi sottotitoli nel vol. 24 (1914) di The Monist: I: “Preliminary description of experience”, pp. 1-16; Il: “Neutral monism”, pp. 161-187; III: “Analysis of experience”, pp. 435-453. Il quarto capitolo fu pubblicato anch’esso su Yhe Monist, vol. 24 (1914), pp. 582-593, con il titolo “Definitions and methodological principles in the theory of knowledge”. Quinto e sesto capitolo furono pubblicati su Yhe Monist, vol. 25 (1915), con i titoli “Sensation and imagination” (pp. 28-44) e “On the experience of time” (pp. 212-233).
672
capitolo 10
struito da Elizabeth Ramsden Fames e Kenneth Blackwell e pubblicato, nel 1984, come settimo volume dei Collected Papers di Russell. In Theory of Knowledge, la teoria del giudizio come relazione multipla è estesa, in modo conseguente, in una teoria che potremmo chiamare “teoria degli atteggiamenti proposizionali come relazioni multiple”. Il giudicare non è infatti altro, osserva Russell in Theory of Knowledge, che una tra le molte forme di “pensiero proposiziona». le??: Un pensiero proposizionale è un pensiero che comporta una “proposizione” nel suo significato. [...] Ci sono vari generi di pensieri proposizionali, proprio come ci sono vari generi di relazioni duali con oggetti. Oltre al comprendere una proposizione ci sono, per esempio, credere, non credere [disbelieving], dubitare, analizzare e sintetizzare, per menzionare solo relazioni puramente cognitive — se fossimo usciti da ciò che è cognitivo avremmo dovuto menzionare anche relazioni come desiderare e volere.
In Theory of Knowledge, tutti gli atteggiamenti proposizionali considerati relazioni poliadiche: ciò che cambia, se l’atteggiamento non è quello della credenza, è solo che alla relazione multipla del credere è sostituita un’altra relazione multipla — come quella di comprendere, affermare, negare, supporre, dubitare, congetturare, sperare, desiderare, temere, scoprire, ecc. Per esempio, la comprensione della proposizione “Otello ama Desdemona”
è
analizzata come una relazione di comprensione U che ha tra i suoi termini il soggetto giudicante, Otello, la relazione amare e Desdemona. Supponendo che, in effetti, Otello ami Desdemona, esisterà nel mondo un'entità complessa — un fatto, potremmo dire — Otello-ama-Desdemona o, se si preferisce L’amore-di-Otello-perDesdemona. Ma in ogni caso, avverte Russell,” la comprensione non potrà essere interpretata come una relazione diadica tra un soggetto e questo complesso: infatti, è evidentemente possibile comprendere l’enunciato “Otello ama Desdemona” indipendentemente dal fatto che, in effetti, Otello ami o non ami Desdemona.
Tra i vari tipi di relazioni di atteggiamento proposizionale, Russell assume proprio il comprendere una proposizione come «la più inclusiva e fondamentale delle relazioni cognitive proposizionali».*° Il motivo di questo è, spiega Russell, che: «non possiamo credere o non credere o dubitare di una proposizione senza comprenderla».” Russell applica all’analisi della comprensione delle proposizioni la sua teoria — risalente al 1903, ma pubblicata per la prima volta in “On denoting” (1905)? — secondo la quale tutti i costituenti reali delle proposizioni che possiamo comprendere devono essere entità che conosciamo per familiarità (acquaintance); pertanto, tutti i termini con cui il soggetto è correlato da una relazione di atteggiamento proposizionale — secondo la teoria degli atteggiamenti proposizionali come relazioni multiple — devono essere entità conoscibili per familiarità. Ciò che Russell chiama “acquaintance” è la consapevolezza diretta di un oggetto da parte di un soggetto; essa è una relazione diadica tra un soggetto conoscente e un oggetto, e pertanto la sua sussistenza implica direttamente l’esistenza del suo oggetto: è infatti impossibile che qualcuno abbia una relazione diadica con nulla. La familiarità è dunque, per Russell, immune da errore. Russell individua nella familiarità la relazione cognitiva diadica «più inclusiva e fondamentale», così come la comprensione è la più fondamentale e inclusiva relazione cognitiva poliadica. L’ontologia di Theory of Knowledge ammette, oltre alle entità semplici, anche i “complessi”. Russell definisce un “complesso” come «qualsiasi cosa sia analizzabile, qualsiasi cosa abbia costituenti», e prosegue: Quando, per esempio, due cose sono relate in qualche modo, sembra esserci un “tutto” [whole] che consiste delle due cose così relate; se, poniamo, A e B sono simili, “la somiglianza di A con B” sarà un tale tutto; e un tale tutto sarà un “complesso”.
Russell afferma che, in qualsiasi complesso, ci sono «almeno due generi di costituenti, cioè i termini relati, e la relazione che li unisce» e spiega: In (poniamo) “A precede B”, A e B compaiono diversamente da come compare “precede”. D’altra parte, in “Precedere è la conversa di succedere”, “precedere” compare, prima facie, nello stesso modo in cui compaiono A e B in “A precede B”. [...] Un’entità che
34 Russell [1913a], parte II, cap. 1, p. 110. 35 V. Russell [1913a], parte II, cap. 1, pp. 116-117.
°° Russell [1913a], parte II, cap. 1, p. 110.
7 Ibid.
°* V. Russell [1903f], punto (5), p. 307, e Russell [1905c], p. 56. AVE sopra, cap. 7, $ 1. Per la scelta di traduzione del russelliano “acquaintance”, v. sopra, cap. 7, nota 10.
4° Russell [1913a], parte II, cap. 1, p. 110. 4! Russell [1913a], parte I, cap. 7, p. 79.
La teoria del giudizio come relazione multipla
673
può comparire in un complesso come “precede” compare in “A precede B” sarà detta relazione. Quando compare in questo modo in IS
.
.
.
.
.
un complesso dato sarà detta “relazione relazionante” [relating relation) in quel complesso.*
2
Il concetto di relazione relazionante era già stato introdotto da Russell nel $ 54 dei Principles: La duplice natura del verbo [si badi che, nei Principles, con “verbo” non s'intende primariamente un simbolo, ma il riferimento di un verbo, che è identificato con una relazione in intensione] come verbo effettivo e come nome verbale, può venire espressa, se si ritiene che tutti i verbi siano relazioni, come la differenza tra una relazione in se stessa e una relazione effettivamente relazionante
[actually relating]. Si consideri, per esempio, la proposizione “A differisce da B”. I costituenti di questa proposizione, se la analizziamo, appaiono essere solo A, differenza, B. Tuttavia questi costituenti, messi così uno di fianco all’altro, non ricostituiscono la proposizione. La differenza che compare nella proposizione correla effettivamente A e B, mentre la differenza dopo l’analisi è una nozione che non ha connessione con A e B. Si può dire che dovremmo, nell’analisi, menzionare le relazioni che la differenza ha con
A e B, relazioni che sono espresse da è e da quando diciamo “A è differente da B”. Queste relazioni consistono nel fatto che A è il referente e B il relatum rispetto alla differenza. Ma “A, referente, differenza, relatum, B” è ancora semplicemente una lista di termi-
ni, non una proposizione. Una proposizione, di fatto, è essenzialmente un’unità, e quando l’analisi ha distrutto l’unità, nessun’enumerazione dei costituenti ricomporrà la proposizione. Il verbo, quando è usato come verbo, esprime l’unità della proposizione, ed è perciò distinguibile dal verbo considerato come un termine [della proposizione in cui compare], benché io non sappia dare un resoconto chiaro della natura precisa della distinzione.*
Nei Principles, una relazione relazionante e una relazione in se stessa sono, dal punto di vista ontologico, la medesima entità:** quest’entità è tuttavia passibile di una “duplice occorrenza” in una proposizione: come termine di essa o come concetto; ma essa non è in grado di unire delle entità in una proposizione se non quando compare come relazione relazionante. Ciò dà origine a una curiosa conseguenza,
che Russell non rileva. Prendiamo,
per
esempio, la proposizione espressa da “A differisce da B”, e supponiamo che si tratti di una proposizione falsa. Nel brano appena riportato, Russell dice che «[IJa differenza che compare nella proposizione correla effettivamente A e B»; se ne conclude che la relazione differenza correla effettivamente A e B — eppure la proposizione è falsa, cioè A non differisce da B. Ciò che salva la teoria dei Principles dall’incoerenza è la “doppia corrispondenza” secondo la quale anche gli enunciati falsi denotano, potremmo dire, dei fatti: solo che si tratta di “fatti” falsi.® Ma,
come vedremo, il problema è destinato a ricomparire, con effetti infine drammatici, nella teoria di Theory of Knowledge, che ammette invece un solo genere di fatti: i fatti tout court. In Theory of Knowledge, servendosi del concetto di relazione relazionante, Russell fornisce una definizione (che considera provvisoria) dei complessi atomici e dei complessi molecolari: i primi sono quei complessi in cui è
4 Russell [1913a], parte I, cap. 7, p. 80.
43 Russell [1903a], $ 54, pp. 49-50. 4 Scrive Russell: «È chiaro [...] che il concetto che compare nel nome verbale, è esattamente lo stesso che compare come verbo. Ciò risul-
ta dall’argomento precedente, che ogni costituente di ogni proposizione deve, sotto pena di autocontraddizione, essere suscettibile di essere reso soggetto logico. Se diciamo “Uccide non ha lo stesso significato di uccidere”, noi abbiamo già fatto di uccide un soggetto, e non possiamo affermare che il concetto espresso dalla parola uccide non possa essere reso soggetto. Così esattamente il verbo che compare come verbo può anche comparire come soggetto» (Russell [1903a], $ 52, p. 48). Si noti che — del tutto coerentemente — nei Principles la situa-
zione ha un esatto parallelo nel caso delle proposizioni: per esempio “A differisce da B” e “La differenza tra A e B” o “Cesare morì” e “La morte di Cesare” si riferiscono, secondo la teoria dei Principles, alla stessa proposizione: «Trasformando il verbo, come esso compare in una proposizione, in un nome verbale, l’intera proposizione può essere trasformata in un singolo soggetto logico, non più asserito, e non più contenente in se stesso verità o falsità [containing in itself truth or falsehood]. Ma anche qui, non sembra esserci possibilità di sostenere che il soggetto logico risultante sia un’entità diversa dalla proposizione» (Russell [1903a], $ 52, p. 48). 4 Il problema dell’unità delle proposizioni false, nella teoria russelliana delle proposizioni dell’epoca dei Principles, è stato sollevato da vari autori. Kenneth Olson scrive: «[U]na relazione o mette in relazione un paio di termini o no. Ciò rende piuttosto arduo per Russell dar conto dell’unità di una proposizione falsa, poiché questa non può consistere nel fatto che la relazione che si asserisce valere valga realmente» (Olson [1987], cap. 4, pp. 80-81; riportato in B. Linsky [1999] $ 3.2, p. 47, nota 2, e in Proops [2011], p. 198). Il dilemma è: se la relazione mette davvero in relazione i termini — per es., la relazione ama mette davvero in relazione A con B — allora la proposizione deve essere vera, altrimenti, se la relazione non mette in relazione i termini — per es., se A non ama B — allora non si ha più alcuna proposizione. Questa difficoltà spinse Russell, secondo Olson, «a negare le proposizioni a favore dei fatti» ((bid.) Bernard Linsky (v. B. Linsky [1999] $ 3.2, p. 47, nota 2), cita con approvazione l’interpretazione di Olson e osserva che c’è un’evidente difficoltà anche con le proposizioni vere, se queste devono essere distinte dai fatti; scrive Linsky: «Una proposizione vera, distinta dal fatto che riferisce, dovrebbe legare insieme gli individui a formare un’unità, ma non un’unità che abbia come risultato un fatto» (B. Linsky [1999] $ 3.2, p. 48). A queste obie-
zioni si può rispondere negando che la teoria delle proposizioni dei Principles ammetta fatti distinti dalle proposizioni: le proposizioni vere dei Principles sono fatti veri; ma vi sono anche “fatti” falsi. Come osserva Jan Proops, si può rispondere all'argomento menzionato «semplicemente sostenendo che sebbene in alcuni complessi la relazione relazionante cementi certi oggetti in un fatto, in altri cementi gli oggetti rilevanti solo in una proposizione falsa. [...] In questa prospettiva, la relazione nel suo ruolo “relazionante” provvederà due possibili modi di combinazione» (Proops [2011], p. 200). Naturalmente, che la teoria delle proposizioni dei Principles non sia sotto quest’aspetto incoerente, non significa che per tale aspetto essa sia anche plausibile, o che tale rimanesse agli occhi di Russell.
capitolo 10
674
presente una sola relazione relazionante; i secondi sono quelli in cui sono presenti più relazioni relazionanti.' L’attenzione di Russell, nella parte del libro portata a termine, è ristretta al trattamento dei complessi atomici — mentre la trattazione dei complessi molecolari è rinviata alla parte terza dell’opera, che non sarà mai scritta. I complessi atomici sono classificati secondo il numero di termini che contengono oltre alla relazione relazionante: duali se contengono due termini, e così via. Nello stesso modo sono classificate le relazioni: le relazioni
che possono essere relazionanti in complessi duali saranno duali, e così via. Sui complessi corrispondenti alle proposizioni soggetto-predicato, Russell sembra ancora incerto, come lo era stato nei Principles: Può darsi che ci siano complessi in cui c’è soltanto un termine e un predicato, dove il predicato compare nel modo in cui le relazioni compaiono in altri complessi. In quel caso, i predicati saranno definiti come entità che compaiono in questo modo in complessi che contengono solo un’altra entità. È tuttavia dubbio se ci siano tali complessi, mentre sembra certo che ci sia una relazione di predicazione; perciò i predicati possono essere definiti come termini che hanno la relazione di predicazione con altri termini. La “bianchezza” sarà un predicato di una particolare macchia bianca, la “rotondità” di una particolare macchia rotonda, e così via.!”
Dicendo che i predicati'* sono «termini che hanno con altri termini la relazione di predicazione», è chiaro che Russell intende che essi figurano come termini ne/ complesso di cui fanno parte, non semplicemente che sono termini perché (essendo entità) possono figurare come tali in un complesso o in un altro. Dunque la predicazione è vista qui in modo un po” diverso dai Principles, dove — ricordiamo — la copula è presa a simboleggiare una relazione del tutto peculiare che vale non tra due o più termini di una proposizione, ma tra l’unico termine della proposizione e il concetto denotato da un aggettivo — come, per esempio “bianco” o “rotondo” — il quale concetto non è tuttavia considerato come un termine della proposizione in cui compare.” Nel capitolo successivo del libro, tuttavia, Russell sembra inclinare per un punto di vista diverso: I motivi [per rispondere affermativamente alla domanda se vi siano «universali che compaiono come compaiono le relazioni relazionanti, ma in complessi che hanno solo un altro costituente»] sarebbero: primo, che il soggetto e il predicato differiscono ovviamente da un punto di vista logico, e non semplicemente come differiscono due particolari, cosicché, se la predicazione fosse primariamente una relazione duale, dovrebbe essere una relazione duale molto strana; secondo, che sembrerebbe veramente bizzarro se non ci fossero complessi di due costituenti, benché ci siano complessi con tre, quattro, cinque... costituenti; terzo, che termini del
tipo bianco, doloroso, ecc., sembrano richiedere soggetti proprio nello stesso modo in cui le relazioni richiedono termini. Per queste ragioni, assumeremo che, se esistono predicati, essi possano comparire in complessi che hanno solo un altro costituente, e non solo in complessi in cui essi abbiano una relazione duale, detta “predicazione”, con i loro soggetti.”
Quando Russell, nel brano appena riportato, scrive «se esistono predicati» (sc. attributi monadici), si riferisce alla questione, che affronta subito dopo, «se i predicati siano del tutto illusori e debbano essere sostituiti da relazioni simmetriche transitive, che possiamo chiamare “somiglianze specifiche” [specific similarities]}».! Questa è una concezione che Russell attribuisce a Berkeley e Hume «che — egli scrive — immaginarono ingenuamente che abolendo i predicati avrebbero abolito tutte le “idee astratte’’».’° Russell riconosce che la dottrina è logicamente sostenibile, ma gli pare che l’idea secondo la quale [...] non abbiamo familiarità con il bianco o il giallo o qualsiasi altro colore universale, ma solo con somiglianze [di una certa par-
ticolare macchia] con varie macchie particolari di bianco o di giallo o di qualche altro colore, non sembra introspettivamente plausibile, e, immagino, non sarebbe stata sostenuta se [Berkeley e Hume] si fossero resi conto che non eliminava la necessità delle “i-
dee astratte”, ma semplicemente trasferiva questa necessità dai predicati alle relazioni.?
Russell ne conclude che «ci sono buone ragioni per credere che ci siano predicati».?* Predicati e relazioni (sc. attributi monadici e poliadici) — dice Russell — sono universali: tutti i costituenti di un complesso sono universali o particolari,
e almeno uno dev'essere un universale.” Fin qui, non c’è nulla di ra-
4° V_ Russell [1913a], parte I, cap. 7, p. 80. 47 Russell [1913a], parte I, cap. 7, pp. 80-81. 48 Si noti che il primo Russell usa in genere il termine “predicato”, diversamente da come è oggi usuale, per significare un attributo, non un simbolo. L’uso di “predicato” in senso linguistico prevale invece nell’ultimo Russell. 4 V. sopra, cap. 6, $ 2.2.
50 °! °2 93 94
Russell Russell Russell Russell Russell
[1913a], [1913a], [1913a], [1913a], [1913a],
parte parte parte parte parte
I, cap. I, cap. I, cap. I, cap. I, cap.
8, p. 90. 8, pp. 90-91. 8, p. 91. 8, p. 95. 8, p. 96.
La teoria del giudizio come relazione multipla
675
dicalmente nuovo rispetto alla teoria sostenuta nei Principia:”° i “complessi” ereditano gran parte delle proprietà che, nei Principles, avevano le “proposizioni”; la differenza tra i complessi e le proposizioni dei Principles è che i complessi non hanno la proprietà di essere veri o falsi: sono ora solo i giudizi ad essere veri o falsi. Ora però la teoria del giudizio come relazione multipla di Theory of Knowledge si complica notevolmente, rispetto a quella del 1910. L'origine delle modifiche apportate da Russell alla precedente versione della sua teoria
risiede nel tentativo di risolvere in modo soddisfacente quello che è noto, nella letteratura sull’argomento, come il problema della direzione (ristretto) — (narrow) direction problem. Un esempio elementare di tale problema è il seguente: come distinguere il giudizio di Otello che Desdemona ami Cassio, dal giudizio di Otello che Cassio ami Desdemona? Nel 1910, come sappiamo, Russell aveva sostenuto che i due giudizi si distinguono per il verso che la relazione amare ha come termine del giudizio.” Il problema, con questa tesi, è che se la relazione amare entra nel giudizio che Desdemona ama Cassio come relazione in sé, non come relazione relazionante, essa non può avere nessun verso: è solo la relazione effettivamente relazionante che può avere un verso. Ma se la relazione amare entrasse nello stesso giudizio come relazione relazionante — cioè come relazione che effettivamente correla Desdemona con Cassio — allora parte del complesso Otello-giudica-Desdemona-ama-Cassio sarebbe un complesso Desdemona-ama-Cassio,
e non si vede come il giudizio potrebbe essere falso,
a meno di non ammettere
complessi falsi corrispondenti ai giudizi falsi — ripristinando così l’intera ontologia delle proposizioni dei Principles. Avvertendo questa difficoltà, in The Problems of Philosophy (1912), Russell offre una soluzione diversa; egli propone che sia la relazione del giudicare, a mettere in ordine i termini che entrano in essa: Si osserverà che la relazione di giudicare ha ciò che è chiamato un “senso” o “direzione”. Possiamo dire, metaforicamente, che essa pone gli oggetti in un certo ordine, che possiamo indicare per mezzo dell’ordine delle parole nell’enunciato. [...] Il giudizio di Otello che Cassio ami Desdemona differisce dal suo giudizio che Desdemona ami Cassio, a dispetto del fatto che esso consiste degli stessi costituenti, perché la relazione del giudicare dispone i costituenti in un diverso ordine nei due casi. Nello stesso modo, se Cassio giudica che Desdemona ami Otello, i costituenti del giudizio sono ancora gli stessi, ma il loro ordine è diverso. Questa proprietà di avere un “senso” o una “direzione” è una proprietà che la relazione di giudicare condivide con tutte le altre relazioni.°*
La relazione del giudicare può ordinare i suoi termini, secondo Russell, perché è, effettivamente, una relazione
relazionante, l’unica relazione relazionante che compare in un complesso di credenza, ed è quindi l’unica relazione di questo complesso che può avere un verso: Quando ha luogo un atto di credere, c’è un complesso, in cui “credere” è la relazione che unisce [uniting relation], e soggetto e 0ggetti sono disposti in un certo ordine dal “senso” della relazione di credere. Tra gli oggetti, come abbiamo visto considerando “Otello crede che Desdemona ami Cassio”, uno dev’essere una relazione — in quest’esempio la relazione “amare”. Ma questa relazione, così come compare nell’atto di credere, non è la relazione che crea l’unità del tutto complesso consistente del soggetto e degli oggetti. La relazione “amare”, come compare nell’atto di credere, è uno degli oggetti — è un mattone della struttura, non il cemento. Il cemento è la relazione “credere”. Quando la credenza è vera, c'è un’altra unità complessa, in cui la relazione che era uno
degli oggetti della credenza correla gli altri oggetti.”
In Theory of Knowledge anche questa teoria è modificata. A Russell appare ora indispensabile aggiungere un nuovo termine alle relazioni di atteggiamento proposizionale: il nuovo termine è la forma logica, o semplicemente forma, del complesso. «Un complesso — dice Russell — ha una proprietà che possiamo chiamare la sua “forma”, e i costituenti devono avere ciò che chiamiamo una determinata “posizione” in questa forma». In prima istanza, Russell spiega come si ottiene un’espressione che denota una forma nel modo seguente: Il modo naturale di simbolizzare una forma è prendere qualche espressione in cui entità reali sono messe insieme in quella forma, e rimpiazzare tutte queste entità con “variabili”, ossia con lettere che non hanno significato. Prendiamo, per esempio, la proposizione “Socrate precede Platone”. Questa ha la forma di un complesso duale: possiamo simbolizzare la forma naturalmente con “xRy”
[ed®
TAV, per es., Russell [1913a], parte I, cap. 7, p. 81. °© V. sopra, cap. 6, $ 2.
57 98 °° °0
V. Russell [1910b], p. 124. Russell [1912a], cap. 12, p. 198. Russell [1912a], cap. 12, p. 199-200. Russell [1913a], parte I, cap. 7, p. 81.
©! Russell [1913a], parte I, cap. 9, p. 98.
capitolo 10
676
L'espressione simbolica naturale per la forma di un dato complesso è l’espressione ottenuta rimpiazzando i nomi dei costituenti del complesso con lettere rappresentanti variabili, usando generi diversi di lettere per costituenti di generi logici diversi, o indicando la differenza di genere con parentesi o qualche metodo simile. Così possiamo indicare la forma generale di un complesso duale con “xRy” o con R(x, y); e possiamo indicare la forma generale di un complesso soggetto-predicato con Ax), in cui a è il predicato e x il soggetto, o con x € 4 in cui “e” serve semplicemente, come una parentesi, a indicare una posizione relativa.î?
Qui le forme rappresentano le strutture dei complessi, il modo in cui i vari componenti di un complesso sono messi insieme. L'innovazione di Russell, rispetto alla precedente versione della teoria, è quella di sostenere che
fra i termini di una qualsiasi relazione di atteggiamento proposizionale, oltre ai termini che vi figuravano in precedenza, debba esservi anche una forma. Per esempio, siccome la forma del complesso Otello-ama-Desdemona è xRy, Russell ora sostiene che, se Cassio giudica che Otello ami Desdemona, tale giudizio debba essere considerato come una relazione a cinque posti, Js, tra Cassio, Otello, amare, Desdemona e la forma xRy. Schematicamente, si ha: Js(Cassio, Otello, amare, Desdemona, xRy).
Ma perché Russell ritiene ora indispensabile introdurre le forme? Egli lo spiega così: Qual è la dimostrazione che dobbiamo comprendere la “forma” prima di poter comprendere la proposizione? Ho sostenuto in precedenza che erano sufficienti i soli oggetti, e che il “senso” [sense] della relazione di comprendere li avrebbe messi nell’ordine giusto; tuttavia, non mi sembra più che sia così. Supponiamo di voler comprendere “A e B sono simili”. E essenziale che il nostro pensiero debba, come si dice, “unire” o “sintetizzare” i due termini e la relazione; ma non possiamo “unirli” effettivamente perché o A e B sono simili, nel qual caso sono già uniti, o sono dissimili, nel qual caso nessun pensiero può costringerli a diventare uniti. Il processo di “unire” che possiamo effettuare nel pensiero è il processo di metterli in relazione con la forma generale dei complessi duali. [...] Più semplicemente, per comprendere “A e B sono simili” dobbiamo sapere che cosa si suppone si faccia con A, B e con la somiglianza, ossia che cosa sia per due termini avere una relazione; cioè, dobbiamo comprendere la forma del complesso che deve
esistere se la proposizione è vera.®
L’osservazione di Russell, nel passo appena riportato, è che non si giudica una semplice lista di entità, sia pure ordinate in un certo modo, ma qualcosa che deve possedere una sua unità: per es., non si giudica che A, similitudine, B, ma che A è simile a B. Ma se, per esempio, il giudizio che A è simile a B riunisse davvero A, la similitudi-
ne e B in un complesso A-è simile a-B — come suggeriva la teoria esposta da Russell in The Problems of Philosophy — allora il giudizio che A è simile a B sarebbe sempre vero — una conclusione inaccettabile. Russell sostiene allora la necessità che una relazione di atteggiamento proposizionale riunisca e ordini i suoi oggetti non fattivamente, ma nel senso di metterli in relazione con una certa forma. La credenza sarà poi vera quando nella realtà esiste davvero un complesso di quella forma costituito da quegli oggetti, altrimenti sarà falsa.°° Con l’introduzione delle forme, comprendere, per esempio, similitudine come relazione relazionante, comporta comprendere che cosa significherebbe dire che x è simile a y; cioè comporta non solo una relazione con la relazione similitudine, ma an-
che una relazione con la forma dei complessi diadici xRy.°° Dalla spiegazione, prima riportata, secondo cui «possiamo indicare la forma generale di un complesso duale con “xRy” o con R (x, y)», sembra che le variabili che costituiscono l’espressione simbolica di una forma siano °2 Russell [1913a], parte II, cap. 1, p. 113. °3 Russell chiarisce che la forma di un complesso non si deve intendere come un ulteriore costituente del complesso: «Questa [la forma logica del complesso Socrate-è-umano] non può essere un nuovo costituente [del complesso], perché se lo fosse, dovrebbe esserci un nuovo modo in cui essa e gli altri due costituenti sono messi insieme, e se prendiamo questo modo ancora come un costituente, ci troviamo imbarcati in un regresso all’infinito.
È ovvio, in effetti, che quando rutti i costituenti di un complesso sono stati enumerati, rimane qualcosa che si può chiamare la “forma” del complesso, che è il modo in cui i costituenti sono combinati nel complesso» (Russell [1913a], parte I, cap. 9, p. 98).
° Russell [1913a], parte II, cap. 1, p. 116. 95 V. Russell [1913a], parte II, cap. 5, p. 144.
© In “The philosophy of logical atomism” (1918) c’è un passo in cui Russell cerca di chiarire questo punto: «Comprendere un predicato è una cosa del tutto differente dal comprendere un nome. [...] Per comprendere un nome dovete essere in familiarità [acguainted] con il particolare di cui esso è un nome, e dovete sapere che esso è il nome di quel particolare. Non avete, cioè, nessun indizio della forma della proposizione, mentre l’avete nel comprendere un predicato. Comprendere “rosso”, per esempio, è comprendere che cosa s’intende dicendo che una cosa è rossa. [...] Esattamente la stessa cosa si applica alle relazioni, e di fatto a tutte quelle cose che non sono particolari. Prendete, per es., “prima” in “x è prima di y”: comprendete “prima” quando comprendete che cosa ciò significherebbe se x e y fossero dati» (Russell [1918-19], $ II, p. 205). ° Russell [1913a], parte II, cap. 1, p. 113; v. anche il passo sopra riportato da Russell [1913a], parte I, cap. 9, p.98.
La teoria del giudizio come relazione multipla
677
variabili libere. Tuttavia, subito dopo, in Theory of Knowledge, Russell chiarisce di intenderle come variabili vincolate. Vediamo perché. Secondo Russell, se le forme devono essere usate per indicare come gli oggetti di una relazione di atteggiamento proposizionale sono messi insieme, esse devono essere semplici.®* Ossia, sebbene i simboli per le forme siano
composti di variabili, le forme da essi indicate non devono a loro volta essere analizzabili: questo perché, se una forma fosse composta di elementi, occorrerebbe poi un’altra forma per stabilire come gli elementi della prima siano messi insieme, e si avvierebbe un regresso all’infinito. In altre parole, perché le forme abbiano la capacità, che Russell attribuisce loro, di spiegare il modo in cui i costituenti di un complesso devono essere messi insieme, le forme non devono essere, a loro volta, complessi — questo esclude, incidentalmente, che le forme possano essere
sequenze di simboli. Russell si pone quindi il problema di come possa, qualcosa che apparentemente ha una struttura, essere semplice: «A prima vista [la forma] sembra avere una struttura, e quindi non essere semplice; ma è più corretto dire che è una struttura. Il linguaggio non è adatto a parlare di tali oggetti».°° Ma com’è possibile che una forma sia priva di costituenti? Russell lo spiega così: Se prendiamo qualche particolare complesso duale xRy, questo ha tre costituenti, x, R, e y. Se ora consideriamo “Qualcosa ha la re-
lazione R con y”, otteniamo un fatto che non contiene più x e non ha sostituito x con nessun’altra entità, poiché “qualcosa” è niente. Così il nostro nuovo fatto contiene soltanto R e y. Per ragioni simili, “Qualcosa ha la relazione R con qualcosa”, non contiene alcun costituente eccetto R; e “Qualcosa ha una relazione con qualcosa” non contiene affatto costituenti. È perciò adatto a servire come
“forma” dei complessi duali.”°
All’inizio di questa spiegazione, “x”, “R” e “y? non devono essere intese come variabili, ma come lettere schematiche. Russell trasforma queste lettere schematiche in variabili, implicitamente vincolate da quantificatori esistenziali, ottenendo quella che ritiene l’espressione di una forma logica: “Qualcosa ha qualche relazione con qualcosa”. Così, la forma di un complesso duale non è correttamente simboleggiata dall’enunciato aperto “xRy”, ma dall’enunciato chiuso “(4x) (4y) (AR) (ARy)”. In Theory ofKnowledge, Russell identifica le forme con dei fatti, fatti assolutamente generali: 6.99
Il primo esempio che voglio discutere è la comprensione di proposizioni che non hanno costituenti, cioè in cui tutti i costituenti sono stati rimpiazzati da variabili apparenti, e rimane solo la pura forma. Possiamo prendere come il tipo di tali proposizioni la proposizione “Qualcosa è in qualche modo in relazione con qualcosa”, cioè “Ci sono un x, un y e un R tali che x ha la relazione R con y” o “xRy è a volte vero”. Questa è all’incirca la stessa proposizione di “Ci sono complessi duali”. Si ricorderà che, secondo la nostra teoria della comprensione delle proposizioni, la pura forma è sempre un costituente del complesso della comprensione [cioè del “fatto” che si verifica quando un soggetto comprende una proposizione], ed è uno degli oggetti con cui dobbiamo essere in familiarità [to be acquainted) per comprendere la proposizione. Se questo è vero, allora la comprensione della pura forma dev'essere più semplice di quella di qualsiasi proposizione che sia un esempio della forma. Poiché desideravamo dare il nome di “forma” ad autentici oggetti piuttosto che a finzioni simboliche, abbiamo dato il nome al “fatto” “Qualcosa è in relazione con qualcosa in qualche modo”.
Se c'è una cosa come
la familiarità con le forme, come
ci sono buoni motivi
per credere che ci sia, allora una forma
dev'essere un autentico oggetto; d’altra parte, i “fatti” assolutamente generali come “Qualcosa è in relazione con qualcosa in qualche modo” non hanno costituenti, sono inanalizzabili, e devono pertanto essere detti semplici. Essi hanno quindi tutte le caratteristiche essenziali richieste alle pure forme.”
Questo trattamento delle forme sembra contrastare con ciò che Russell dice in un breve manoscritto dell’anno precedente — non pubblicato all’epoca — intitolato “What is logic?”.’? Qui, cercando di definire la logica a partire dalla nozione primitiva di “forma”, Russell dice: Possiamo assumere la forma come primitiva. I valori di una forma sono i complessi che hanno quella forma. Una forma è necessaria se per ogni valore delle variabili nella forma c’è un valore per la forma e possibile se la contraddittoria non è necessaria. Allora 3 . Sauri 3: la logica = la classe delle forme necessarie e possibili. Df.”*
Russell prosegue avvertendo che una forma «non è un semplice simbolo: un simbolo composto interamente di vas quos È & 5 74 5 È = riabili simbolizza una forma, ma non è una forma». Qui le forme sembrano essere simboleggiate da formule che
6 °° "°° "! 72 73
v. Russell [1913a], parte II, cap. 1, pp. 113-114. Russell [1913a], parte II, cap. 1, p. 114. Ibid. Russell [1913a], parte II, cap. 3, p. 129. V. Russell [1912e]. Russell [1912e], p. 56.
capitolo 10
678
non contengono variabili vincolate, le quali denotano delle strutture complesse che somigliano ai concetti di Frege, essendo “incomplete” — la differenza essendo che una forma sarebbe, per così dire, totalmente incompleta. Secondo il resoconto di Theory of Knowledge, invece, una forma è un’entità completa — un fatto — che Russell dice si potrebbe identificare con «il fatto che ci sono entità che costituiscono complessi aventi la forma in questione».” Griffin ([1985a], p. 224) ritiene che Russell abbia cambiato idea, riguardo alle forme, proprio durante la stesura di Theory of Knowledge: nel cap. 7 della prima parte, dedicato alla familiarità con le relazioni, egli avrebbe sostenuto una concezione delle forme come puri schemi, mentre più avanti, nel capitolo 1 della seconda parte, le avrebbe intese come oggetti in sé completi. Ma, come abbiano visto, Russell si esprime in un modo ambiguo anche nello stesso capitolo 1 della seconda parte di Theory of Knowledge, laddove sostiene chiaramente una concezione delle forme come espresse da enunciati chiusi. È dunque plausibile che, come ritiene Pisa ([1991]}p.50; nota 7), Russell non abbia cambiato idea, ma si sia solo espresso, talora, in modo iimpreciso.” Comprendere una forma, secondo Russell, s’identifica con il conoscerla per familiarità (acquaintance): «Non penso», scrive Russell, «che ci sia alcuna distinzione tra comprensione e familiarità nel caso di “Qualcosa ha una relazione con qualcosa”».” Il modo in cui questo accade è abbastanza chiaro: poiché (4x)(3y)(4R)(xRy) è una forma, il fatto che, per esempio, il soggetto S comprenda che (4x) (4y) (48) (xRy), non implica altri termini della relazione di comprendere se non il soggetto e la forma, riducendosi dunque a:
U(S, (x) (4y) ER) (ARy)), cioè a una relazione diadica tra un soggetto conoscente e un oggetto. Poiché «la comprensione è qui una relazione diretta del soggetto con un singolo oggetto», Russell conclude che «la possibilità della non verità non sorge, come accade quando la comprensione è una relazione multipla».”* Le forme sono, per Russell, i fatti di cui si occupa la logica. Ciò si ricava da diversi accenni, in Theory of Knowledge. Nell’ultimo capitolo, per esempio, si legge: Considerando la comprensione di proposizioni, un caso specialmente interessante è fornito dalle proposizioni atomiche della logica pura, che non hanno costituenti; in questo caso, la comprensione è una relazione duale, poiché il termine-oggetto è una pura forma. Questo fatto sembra essere connesso con l’autoevidenza delle proposizioni logiche.” .
Ea
.
.
($
Se le forme logiche sono fatti logici, devono corrispondere a verità logiche, vi sono due conseguenze importanti. Innanzi tutto, la logica non rimane affatto neutrale riguardo all’esistenza — all’esserci — di universali: l’esistenza, per esempio, di relazioni diadiche dev’essere una verità logica. Questa conclusione sembra esplicitamente tratta da Russell, il quale parla della «verità necessaria che appartiene a proposizioni come “Qualcosa ha qualche relazione con qualcosa”».* Un'altra conseguenza è che non si possono ammettere “forme” la cui espressione simbolica comporti l’uso di connettivi — che potremmo chiamare forme molecolari. Il punto è che, sebbene l’introduzione di forme molecolari sembri fornire il dispositivo più semplice per render conto della capacità di comprendere (o giudicare, ecc.) gli enunciati molecolari, questo implicherebbe la rinuncia all’idea che le forme
(in senso ontologico) siano verità logiche; infatti, la comprensione di una contraddizione come, per esempio, “aR'b n —aR'b” richiederebbe l’esistenza di una forma come (4x) (4y) (AR) (xRy 1 135 re. Un complesso atomico è un complesso in cui c’è solo una relazione relazionante.
Russell parla anche dei «concetti caratteristici delle proposizioni molecolari, come quelli coinvolti nelle parole “e”, “0”, “non”».'?° Più oltre leggiamo: «La proposizione “a è prima di b” si deve interpretare come significante “C’è un complesso in cui a è precedente e b è successivo”. Questo comporta la parola ‘e’, che è una delle parole
che indicano i complessi molecolari».!5” Se esistono complessi molecolari, sembra che debbano esistere anche forme molecolari: le forme, appunto, di tali complessi. In effetti, in Theory of Knowledge si trovano allusioni all’esistenza di forme molecolari. Per esempio, parlando delle relazioni cognitive, Russell dice che «se l’oggetto più astratto [di tali relazioni] è [...] una forma logica, ossia un fatto che non contiene costanti, abbiamo la comprensione, la credenza, la non credenza, il dubbio e probabilmente molte altre relazioni; se la forma logica è molecolare abbiamo anche l’inferenza e la conoscenza delle proposizioni della logica e dei loro esempi». si Come abbiamo già osservato, nonostante il nome le forme molecolari dovrebbero essere semplici. Dovremmo allora essere in rapporto di familiarità (acquaintance) con ciascuna delle forme logiche di tutti gli enunciati che siamo in grado di comprendere. Un’idea poco soddisfacente quanto lo sarebbe una semantica che, invece di spiegare composizionalmente la nostra capacità di comprendere sempre nuovi enunciati, semplicemente postulasse che li comprendiamo direttamente, uno indipendentemente dall’altro, e che dobbiamo solo riconoscerli. Inoltre, è
evidente che nulla potrebbe impedire a una forma molecolare di essere contraddittoria; ma queste contraddizioni che, pur non essendo forme di nessun complesso, sussisterebbero oggettivamente, e potrebbero essere oggetto di acquaintance, che cosa sarebbero se non proposizioni false che, cacciate dalla porta, tornano ostinatamente a bussare alle finestre ontologiche? Nel suo libro Russel!’s Hidden Substitutional Theory (v. Landini [1998a]), Landini propone un’analisi alternativa secondo cui «la descrizione camuffata [in cui dev'essere analizzato il supposto nome di una proposizione] intende riferirsi al complesso di credenza piuttosto che al supposto complesso (fatto) che corrisponderebbe ad esso». Seguendo quest’idea, per esempio, l’enunciato incassato “Fa” sarebbe da analizzarsi per mezzo della descrizione: (7p)(p consiste di una credenza che correla una mente m con a, con F, e con la forma (4@) (Ax) (@x));
così, per la tesi di Russell secondo cui una credenza è vera se e solo se esiste un complesso corrispondente ad essa, si avrebbe:
Fa è vera =x (49) (q corrisponde al (7p)(p consiste di una credenza che correla una mente m con a, con F, e con la forma (4@)(4x)(@x)). Questa proposta fa del predicato di verità qualcosa che si accompagna a descrizioni di giudizi, un punto di vista che Russell sembra sottoscrivere quando dice, per esempio: La verità o falsità di un’asserzione può essere definita nei termini della verità o falsità di credenze: Un’asserzione è vera quando una persona che la crede crede in modo veritiero, e falsa quando una persona che la crede crede falsamente. [...] la verità delle asserzioni è una nozione derivata da quella delle credenze.!‘ 155 Russell [1913a], parte I, cap. 7, p. 80. 136 Russell [1913a], parte II, cap. 3, p. 130.
157 Russell [1913a], parte II, cap. 3, p. 135. 138 Russell [1913a], parte II, cap. 3, pp. 131-132.
59 Landini [1998a], $ 10.12, p. 289. 14° Russell [1910b], p. 117. Si osservi anche quanto scrive Russell, in Theory of Knowledge, a proposito del suo trattamento dei complessi permutativi: «Abbiamo visto che, quando un complesso è permutativo, non c’è alcuna credenza atomica corrispondente al complesso; e benché abbiamo visto come sia possibile una credenza che non è atomica ed è vera quando c’è un tale complesso e falsa altrimenti, tuttavia questa credenza, poiché non è atomica, solleva problemi che non vogliamo considerare fino alla prossima Parte. Quindi le uniche credenze delle quali possiamo occuparci adesso sono quelle la cui verità richiede l’esistenza di un complesso atomico non permutativo. Questo include credenze in
La teoria del giudizio come relazione multipla
691
Invece, secondo la prima interpretazione di Landini, il predicato di verità si accompagnerebbe a una descrizione del (supposto) complesso corrispondente a un complesso di credenza e, in quel contesto, sarebbe reinterpretato in termini di un’asserzione di esistenza di tale complesso. Nella seconda interpretazione di Landini, inoltre, una supposta proposizione si dissolve in un giudizio e negli oggetti da esso correlati, che sembra essere ciò che Russell intende, quando scrive, per esempio: «Una proposizione, come le espressioni quali “il così e così”, dove appare grammaticalmente come soggetto, dev'essere spezzata nei suoi costituenti se dobbiamo trovare il vero soggetto o soggetti». Invece, la prima interpretazione di Landini sostituisce a una proposizione (come soggetto logico apparente) un complesso di credenza (0 di comprensione, ecc.) come vero soggetto logico." Naturalmente, questa seconda interpretazione si trova subito a fronteggiare la difficoltà di quali possano essere i costituenti di un giudizio molecolare o generale. Nell’articolo “A new interpretation...” Landini afferma però che, anche se l’analisi delle ascrizioni di credenza si rivelasse irrealizzabile, la teoria della relazione multipla so-
stenuta nei Principia non sarebbe minacciata, perché «i due problemi [di provvedere le condizioni di verità per enunciati non contenenti verbi di atteggiamento proposizionale e di provvedere e condizioni di verità per enunciati che li contengono] sono separabili». Questo è corretto: in primo luogo, per gli scopi della matematica non sono necessari enunciati contenenti verbi di atteggiamento proposizionale; inoltre, come vedremo, l’unico scopo della teoria del giudizio come relazione multipla, nei Principia, è quello di rendere possibile una definizione ricorsiva di “verità” la quale giustifichi l'attribuzione di ordini alle variabili per proposizioni e funzioni proposizionali.'* Tuttavia, l’intenzione di Russell non era quella di sviluppare una teoria della verità e una teoria degli atteggiamenti proposizionali, ma una teoria della verità basata sull’analisi degli atteggiamenti proposizionali. Lo scopo della teoria del giudizio come relazione multipla, fin dal suo esordio, è quello di eliminare l’ apparente riferimento a proposizioni in senso ontologico, un obiettivo che Russell riteneva di poter raggiungere reinterpretando le apparenti relazioni diadiche tra una mente e una proposizione come relazioni multiple. Landini ha ragione quando dice che Russell non deve spiegare solo le possibili occorrenze di un enunciato incassato in contesti di atteggiamento proposizionale, ma anche quelle in contesti estensionali. Tuttavia, se la teoria di Russell avesse avuto successo nella spiegazione dei giudizi molecolari, il secondo tipo di occorrenza sarebbe stato immediatamente chiarito. In assenza, invece, di un’analisi soddisfacente dei giudizi molecolari e generali, le proposizioni, come oggetti di tali giudizi, non sarebbero dissolte nell’analisi e rimarrebbero dunque, dal punto di vista di Russell, costituenti del mondo, privando la teoria del giudizio come relazione multipla del suo fondamento.
5. WITTGENSTEIN
E L'ABBANDONO
DELLA TEORIA
Con queste difficoltà sempre crescenti, per un’idea che all’inizio pareva semplice e intuitiva, non è sorprendente che la teoria del giudizio come relazione multipla sia, infine, andata incontro all’abbandono. E non può essere un caso che il libro Theory of Knowledge sia stato abbandonato proprio alle soglie del trattamento dei giudizi molecolari e generali. Ma è ormai accertato che ci fu anche una causa più diretta dell’abbandono del libro: una critica mossa da Wittgenstein che creò problemi alla teoria del giudizio come relazione multipla anche per gli enunciati elementari." Secondo la ricostruzione di Griffin," Wittgenstein formulò per la prima volta questa critica a Russell alla fine di maggio del 1913. Il 27 maggio del 1913, Russell scrisse a Ottoline Morrell: proposizioni soggetto-predicato, e in proposizioni che asseriscono relazioni simmetriche o relazioni che, laddove non siano simmetriche, siano anche non omogenee. Possiamo tornare al nostro precedente esempio, “A e B sono simili”. La credenza in questa proposizione è vera
quando c’è un complesso i cui costituenti sono A e B e simile, mentre altrimenti è falsa. Questa è la teoria che dobbiamo esaminare» (Russell [1913a], parte II, cap. 5, pp. 148-149). È chiaro che qui Russell concepisce la sua riduzione dei complessi permutativi a complessi non permutativi come il passaggio da un’apparente credenza atomica a una reale credenza molecolare. 14! [PM], vol. I, introduzione, cap. 2, $ IV, p. 48. 142 Infatti, per esempio, nel definiens di:
Fa è vera =4r E! ((7p) Crede{m, a, F} corrisponde a p) “Credem, a, F}” rappresenta il nome (complesso) di un complesso di credenza.
!43 andini ] [1991], p. 61. 144 V_ sotto, CApat 192322:
145 V_ Griffin [1980], [1985a], [1985b]; Wahl [1986]; Candlish [1996], p. 124. 14 V. Griffin [1980], pp. 175-178; [1985a], pp. 238-240; [1985b], pp. 142-145.
capitolo 10
692
Wittgenstein è venuto a trovarmi [...] io gli ho mostrato una parte cruciale di ciò che stavo scrivendo. Ha detto che era tutto sbagliato, non riconoscendo le difficoltà — che aveva provato la mia teoria e sapeva che non funzionerebbe. Non sono riuscito a comprendere la sua obiezione — di fatto egli è stato molto oscuro — ma lo sento nelle ossa che deve avere ragione, e che ha visto qualcosa che mi è sfuggito. '!”
Quale fosse l’obiezione di Wittgenstein appare precisato in una sua successiva lettera a Russell sulla quale — per mano di quest’ultimo — è apposta la data “giugno 1913”. Il giorno è incerto, ma doveva trattarsi di alcuni giorni prima del 18 giugno; nella lettera, infatti, Wittgenstein fissava un appuntamento per un pranzo con sua madre e con Russell per il 18 di giugno. Ecco il passo rilevante: Posso ora esporre esattamente la mia obiezione alla tua teoria del giudizio: credo che sia ovvio che, dalla prop[osizione] “A giudica che (poniamo) a è nella Rel[azione] R con b”, se analizzata correttamente, la prop[osizione] “aRb . v . -aRb” deve seguire diretta-
mente senza l’uso di nessun’altra premessa. Questa condizione non è soddisfatta dalla tua teoria. sa
Dopo il 6 giugno del 1913, Russell non scrisse più nulla, di Theory of Knowledge. Il 18 giugno incontrò Wittgenstein, e si può presumere che i due abbiano discusso ancora della questione. Il 19 giugno, Russell scrive a Ottoline Morrell che il giorno prima si era sentito «pronto per il suicidio», ma ora è passata, perché ha deciso di essere onesto nei confronti del proprio lavoro: Tutto ciò che non va in me ultimamente proviene dall’attacco di Wittgenstein al mio lavoro — l’ho appena compreso. È stato molto difficile essere onesti su questo perché probabilmente rende una gran parte del libro che intendevo scrivere impossibile per gli anni a venire. Ho cercato di credere che non fosse così grave [...]. E la mancanza di onestà sul mio lavoro [...] ha sparso veleno in ogni
direzione. '50
Con l’accenno alla difficoltà di essere onesto, Russell allude qui certamente al periodo intercorso tra il 7 e il 18 giugno del 1913, quando, nelle sue lettere alla Morrell, parlava ancora del suo libro come di un lavoro accantonato solo per poco tempo. Qual è l’argomento di Wittgenstein? Si tratta della richiesta che sia impossibile giudicare (credere, comprendere, ecc.) un nonsenso: “aRb v —aRb” dev'essere implicato da “aRb”.!! Nel Tractatus, Wittgenstein scrive: La spiegazione corretta della forma della proposizione “A giudica p”, deve mostrare che è impossibile giudicare un nonsenso. (La teoria di Russell non soddisfa questa condizione.)'°”
Perché mai dovrebbe essere impossibile giudicare un nonsenso? Perché, stando alla teoria del giudizio come relazione multipla, tali giudizi, se esistessero, corrisponderebbero ad autentici enunciati, ma un enunciato, al contra-
rio di una successione arbitraria di simboli, non può essere insensato. Ecco come spiega il punto Griffin: Di fatto, un nonsenso non può essere il prodotto di nessuna relazione di atteggiamento proposizionale, perché, se lo fosse, il prodotto sarebbe una proposizione insensata, e questo, dacché tutte le proposizioni sono significanti, è impossibile."
Perché la teoria di Russell non soddisferebbe la condizione di rendere impossibile giudicare un nonsenso? Ritorniamo, per un momento, al vecchio esempio di Otello che giudica che Desdemona ami Cassio. Gli oggetti del giudizio sono Desdemona, amare e Cassio. Da un punto di vista combinatorio, vi sono sei possibilità di ordinare questi oggetti:
147 In Russell [1992b], p. 459 (l’intera lettera è riportata alle pp. 459-460). Il passo è riportato anche nell’introduzione di J. G. Slater a Russell [1992a], $ III, p. xxxiv, e in Hanks [2007], p. 122; parzialmente riportato anche in Griffin [1980], p. 175, [1985a], p. 238, [1985b], p. 142, e in Hylton [1984], p. 23.
SAT passo è riportato in Griffin [1980], p. 176, in Eames [1984], p. xix, in Griffin [1985a], p. 238, in Griffin [1985b], p. 142, e in Hanks
[2007], p. 128. 14 In Russell [1992b], p. 462 (l’intera lettera è riportata alle pp. 461-462). !50 In Russell [1992b], p. 462. Il passo è riportato anche nell’introduzione di J. G. Slater a Russell [1992a], $ II, p. xxxvi; parzialmente riportato anche in Eames [1984], pp. xix-xx., Griffin [1985a], p. 239, e in Griffin [1985b], p. 143.
!5! V. Griffin [1980], pp. 176-177; [1985a], p. 240; [1985b], pp. 143-144. 152 Wittgenstein [1921], prop. 5.5422. Lo stesso punto è ripetuto due volte nelle “Notes on logic” che Wittgenstein dettò a Cambridge nel settembre del 1913: v. Wittgenstein [1913], p. 249 e p. 250.
!53 Griffin [1980], p. 179, e Griffin [1985a], pp. 124-243.
La teoria del giudizio come relazione multipla
(1) (2) (3) (4) (5) (6)
693
Desdemona, amare, Cassio; Desdemona, Cassio, amare; amare, Desdemona, Cassio; amare, Cassio, Desdemona; Cassio, amare, Desdemona; Cassio, Desdemona, amare.
Gli ordini (1) e (5) corrispondono, rispettivamente, alla credenza che Desdemona ami Cassio e alla credenza che
Cassio ami Desdemona. Gli altri quattro ordini dovrebbero essere resi impossibili dall’asserita differenza di tipo logico tra Desdemona e Cassio da una parte, e la relazione amare dall’altra, insieme con l’introduzione della for-
ma dei complessi diadici (4x)(3y)(4R)(xRy) come ulteriore termine del giudizio. Per esempio, un complesso come amare-Desdemona-Cassio sarebbe impossibile, perché non avrebbe la forma richiesta da un complesso diadico, il quale richiede, tra due particolari, una relazione, e non un terzo particolare. Naturalmente, come abbiamo già visto, la teoria dei tipi e l’introduzione della forma non distinguono tra gli ordini (1) e (5): per questi casi, Russell fa intervenire la sua nuova teoria delle relazioni non simmetriche tra oggetti dello stesso tipo logico (come, per l’appunto, la relazione amare). Sembra che tutto sia a posto, allora. Che cosa non va? Secondo Griffin," il problema sarebbe questo: che cosa accade, nella teoria di Russell, se come oggetti di giudizio si prendono degli oggetti e una forma che non possono dare, in nessun ordine, un complesso di quella forma?" Prendiamo, per esempio, lo schema di giudizio:
Js(S, A, R', B, (x) (AR) (Ay) (xRy)), se A, R' e B sono del giusto tipo per trovar luogo in un complesso della forma (4x)(4R)(Ay)(xRy), allora l’esistenza del complesso di credenza implica sicuramente (AR'B v — AR'B); ma se A, R' e B non sono del giusto tipo (sono, poniamo, tre particolari), dall'esistenza di tale complesso di credenza non segue AR'B v — AR'B. Dunque, la teoria di Russell non soddisfa il criterio di Wittgenstein, perché dal giudizio che AR'B, non segue AR'B v — AR'B senza le ulteriori premesse che, per esempio, A e B siano particolari, R' sia una relazione diadica tra particolari.'° Ma queste ulteriori premesse richiederebbero, a loro volta, altri giudizi che il soggetto S dovrebbe aver formulato prima del giudizio che AR'B, generando un regresso all’infinito. Secondo Griffin, a Russell rimarrebbe l’opzione di assegnare un ruolo alla relazione di atteggiamento proposizionale per eliminare i nonsensi, sostenendo che non esiste una relazione di giudizio, a n posti, per qualsiasi scelta possibile del tipo logico degli oggetti del giudizio, ma che esistono solo relazioni di giudizio che ammettono 0ggetti di tipi logici che si possano combinare tra loro secondo una certa forma logica." Griffin sostiene, tuttavia, che una scelta del genere condurrebbe Russell a un circolo vizioso: Russell non può adottare quest’espediente perché egli intende basare tutta la sua teoria delle proposizioni, di cui la teoria dei tipi è parte integrante, sull’analisi degli atteggiamenti proposizionali come relazioni multiple. Se questo programma dev'essere seguito, Russell non può introdurre restrizioni di tipo nella stessa relazione multipla, perché lo scopo di queste relazioni è proprio quello di generare le restrizioni di tipo di cui ha bisogno la teoria delle proposizioni.”
L’idea di Griffin è che la teoria dei tipi — essendo una teoria sulla significanza degli enunciati — dovrebbe essere basata su una dottrina che spieghi quali giudizi siano possibili: dunque non si potrebbe, senza involgersi in un circolo, far ricorso alla stessa teoria dei tipi per stabilire quali giudizi siano possibili. Nelle parole di Griffin: «che a sia di tipo logico differente da f è qualcosa che si può scoprire solo come risultato di un giudizio (non di sem-
54 V. Griffin [1980], [1985a], [1985b]. 155 Questo problema è una forma di quello che è noto, in letteratura, come problema della direzione ampio (wide direction problem), che è il problema di distinguere i giudizi possibili dai nonsensi (come, per es., “giudicare” che Desdemona cassia l’amare), in contrapposizione al già visto problema della direzione ristretto, che è quello di distinguere un giudizio da altri giudizi ottenibili ordinando gli stessi oggetti.
5 V. Griffin [1985a], p. 242. !57 V Griffin [1980], p. 178, e Griffin [1985a], p. 240. !58 Quest’interpretazione è stata fornita per la prima volta da Sommerville ([1980]).
!5° Griffin [1980], p. 179.
694
capitolo 10
plice esame)».!° Questa, secondo Griffin, fu l’impasse che costrinse Russell ad abbandonare definitivamente la sua teoria del giudizio. Anche Graham Stevens ([2003a], [2005], cap. 4, pp. 102-107) connette l’obiezione di Wittgenstein con i tipi
logici, ma in modo differente da Griffin. Stevens sostiene che l’obiezione di Wittgenstein paralizzò Russell perché mostrava il conflitto tra la teoria del giudizio come relazione multipla e l'assunzione russelliana che le entità dell’universo (a differenza dei simboli) siano tutte dello stesso tipo logico. Secondo Stevens, Russell riteneva che
la teoria del giudizio come relazione multipla gli consentisse di considerare del medesimo tipo tutte le entità, mentre l’obiezione di Wittgenstein avrebbe messo in luce che, per conservare tale teoria del giudizio, era necessario postulare differenze metafisiche di tipo tra entità." Il problema di quest’interpretazione è che — cosa che Stevens manca di rilevare — già nella parte esistente di Theory of Knowledge si ammette esplicitamente una suddivisione in tipi delle entità dell’ontologia russelliana, cioè particolari, qualità e relazioni. Landini ([1991], [2007a], cap. 2, pp. 67-72) offre un’interpretazione diversa. Egli ritiene che, l’obiezione fon-
damentale di Wittgenstein sia che la teoria di Russell cerca di dire ciò che, per Wittgenstein, può solo essere mostrato, cioè quale sia la struttura, la forma logica, della proposizione: quella forma logica che, se la proposizione è vera, è la stessa del fatto corrispondente. Le forme logiche — secondo l’interpretazione che Landini dà del punto di vista di Wittgenstein — nella teoria russelliana sarebbero solo nuove entità che si aggiungono alla lista di entità presenti alla mente in un giudizio e, come tali, non potrebbero render conto della comprensione che è impossibile, per esempio, che un particolare compaia in un complesso come relazione relazionante.'°° Ecco come Landini sintetizza la sua posizione nel suo articolo del 1991: La teoria della relazione multipla vede una proposizione, subordinata come occorrenza ‘non asserita” e funzionante come un nome apparente — cioè, una descrizione camuffata [...]. Ma Wittgenstein dice che una clausola subordinata conserva ciò che Russell considera una “caratteristica assertoria”. È solo attraverso l’asserzione [...] che si cattura il “senso” di una proposizione,. Per esempio, è solo attraverso l’asserzione che una proposizione, come “aRb” può mostrare [show] che la relazione R ha una natura predicabile. L’asserzione di una proposizione, composta pe “ @”, 0 “A giudica che aRb” deve conservare caratteristiche assertorie della clausola subordinata “aRb”, altrimenti il senso della subordinata è perduto. Cioè, R dev'essere relazionante nell’asserzione del composto, perché solo così la clausola subordinata mostra [show] il suo senso (cioè, le sue condizioni di
verità). Nelle parole di Wittgenstein, la clausola subordinata deve mostrare [show] le sue condizioni di verità immediatamente nell’asserzione del composto “senza ulteriori premesse”. Questo manca nell’analisi di Russell, perché la proposizione; subordinata si analizza come una descrizione di un complesso. Niente nell’analisi mostra che R abbia una natura predicabile e, di conseguenza, le condizioni di verità proprie (le condizioni per il senso) per “aRb” non sono assicurate. Questo, sostengo, era il punto di Wittgenstein nel rilevare che la teoria di Russell “non rende impossibile giudicare un nonsenso”.!93
Nel menzionato saggio del 2007, Landini spiega: 9?
66
Wittgenstein sostiene che le nozioni logiche [come “universale”, “particolare”, “forma logica”, “fatto”] siano pseudoconcetti. La differenza tra un universale e un particolare è una differenza logica che deve mostrarsi nella grammatica logica stessa. Non c’è facoltà che fornisca quest’informazione sugli universali, e non è d’alcun aiuto offrire una spiegazione della nostra conoscenza delle nozioni logiche reificandole come forme logiche con le quali siamo in familiarità [we are acquainted]. A modo di vedere di Wittgenstein, non è affatto incidentale che l’espressione “... è mortale” compaia in una posizione predicativa in “S crede che Socrate sia
mortale”. Perché è precisamente in virtù del suo comparire in posizione predicativa che si mostra nella grammatica del linguaggio naturale che Mortalità è un universale con una natura predicabile. Nulla meno di ciò sarà sufficiente.'° La critica di Wittgenstein è che qualsiasi caratterizzazione della relazione di corrispondenza [nella caratterizzazione della verità] deve infine dire che c’è un universale che correla i costituenti del supposto fatto che deve corrispondere allo stato di credenza. ma parlare della relazione relazionante — mettere un segno per essa in una posizione di soggetto in una frase descrittiva — è non riuscire a rappresentare la sua natura universale. La nozione di essere un “universale” è una nozione logica: deve essere data nella sintassi mantenendo i segni per universali in posizioni predicative.'9°
Peter W. Hanks ([2007]) sostiene una tesi che ha alcuni punti di contatto con quella di Landini. Alla ricostruzione di Griffin, Hanks obietta che, se Russell pensava che le relazioni in intensione si suddividessero in tipi diversi, non si vede perché le relazioni giudicare (o comprendere, ecc.) dovrebbero fare eccezione. È vero, si po190 Griffin [1985a], p. 243. ‘©! V. Stevens [2003a], pp. 25-26, e Stevens [2005], cap4,pp. 104-105 e p. 107. 162V. Landini [1991], p. 67. 63e, Landini [1991], p. 67. 4 Landini [2007a], cap. 2, p. 68. 155 I andini [2007a], cap. 2, pp. 69-70.
La teoria del giudizio come relazione multipla
695
trebbe dire, che noi possiamo constatare che, per esempio, “Cassio” non può essere sostituito ad “ama” in “Desdemona ama Otello” — cosicché non esiste il giudizio che Desdemona Cassio Otello — e che da questo possiamo trarre la conclusione che la relazione amare sia un’entità di tipo diverso rispetto a Cassio, ma ciò riflette una circostanza epistemica. Invece, che la relazione amare sia un’entità di tipo diverso da Cassio è, per Russell, un fatto metafisico, che non dipende affatto dalla circostanza, contingente, che vi siano (esseri che formulano) giudizi 196 Anche nell’interpretazione di Hanks, come in quella di Landini, l’obiezione wittgensteiniana non ha nulla a che vedere con i tipi. Hanks ritiene che essa consista nel rilievo che solo le proposizioni si possono giudicare (essere credute, o essere oggetto di altri atteggiamenti proposizionali) — non “collezioni” (seppure ordinate) di entità. Quando Wittgenstein dice che dev’essere «impossibile per un giudizio essere un nonsenso», secondo Hanks si deve interpretare come se dicesse che il contenuto di un giudizio non può essere qualcosa che non sia vero o falso: il giudizio che xRy, per esempio, deve implicare che sia vero xRy, o che sia vero —xRy; ma una semplice collezione d’oggetti non può essere vera, o falsa. Il punto, secondo Hanks, è che, se una relazione non compare tra gli oggetti di un giudizio come relazionante, non abbiamo un giudizio, ma solo una lista di entità, ordinate in modo opportuno, magari, ma priva di quella coesione che è necessaria per farne l’oggetto di un giudizio. E non si può far ricorso alle forme per unificare il giudizio, perché esse non farebbero che aggiungersi alla lista di entità. Se si esaminano quelle “Notes on logic” che Wittgenstein dettò per Russell nel settembre del 1913, prima di partire per un ritiro in Norvegia a tempo indeterminato," si trovano conferme che Wittgenstein muoveva alla teoria di Russell obiezioni simili a quelle identificate da Landini e Hanks. Non si trovano invece tracce di una connessione tra l’obiezione di Wittgenstein e i tipi logici. In questi appunti wittgensteiniani è evidentissima quell’influenza del pensiero di Frege e di Russell che Wittgenstein riconoscerà, qualche anno dopo, nella prefazione al suo Tractatus Logico-Philosophicus con queste parole: Non voglio giudicare in quale misura i miei sforzi coincidano con quelli di altri filosofi. [...] [N]on indico fonti, poiché mi è indif-
ferente se un altro prima di me abbia pensato ciò che ho pensato io. Voglio solo ricordare che devo alle grandiose opere di Frege e ai lavori del mio amico Bertrand Russell gran parte dello stimolo ai
miei pensieri. '9*
Anche nelle “Notes on logic” gli unici autori citati (criticamente, peraltro) sono Frege e Russell. Le tesi sostenute da Wittgenstein in questo scritto (v. Wittgenstein [1913]) — che saranno poi sviluppate nel Tractatus — sono chiaramente stimolate dal lavoro di Russell in 7heory of Knowledge, e difficilmente comprensibili senza aver presente quest'opera. Cerchiamo di riassumerle. Wittgenstein distingue tra senso (Sinn; sense) e significato (Bedeutung; meaning)!" di una proposizione (Satz, proposition: Wittgenstein usa questi termini in senso linguistico).'”° Il significato è il riferimento di una proposizione o di un nome. Mentre il significato di un nome è il suo portatore, il significato di una proposizione (atomica) è un fatto, uno stato di cose (v. Wittgenstein [1913], $ I, p. 232). Una proposizione (atomica) e la sua negazione hanno lo stesso significato, cioè si riferiscono allo stesso fatto (ibid.).!"! Così, per esempio, secondo Wittgenstein “Socrate è un filosofo” e “Socrate non è un filosofo” si riferiscono entrambe al fatto che Socrate è un filosofo. Ci sono anche fatti negativi, che giustificano la negazione delle sole proposizioni atomiche ($ I, p. 233).'” Il senso di 160 V. Hanks [2007], p. 131. !©7 Allo scoppio della Prima Guerra Mondiale, Wittgenstein ritornò in Austria per arruolarsi nell’esercito austriaco. Russell e Wittgenstein persero i contatti fino alla fine del conflitto mondiale, quando Wittgenstein ricontattò Russell chiedendogli di trovare un editore per il suo Tractatus. Russell si servì delle note dettate da Wittgenstein per un corso di logica che tenne nella primavera del 1914 a Harvard: nell’introduzione alle “Notes on logic”, il curatore Harry T. Costello, che fu assistente di Russell nel corso menzionato, riferisce: «[...] [Russell] aveva con sé alcune note e brani scelti, che riportavano le opinioni di un suo brillante studente, di nome Ludwig Wittgenstein, che era stato consigliato da Frege di venire presso di lui. Io ho copiato questo manoscritto, datato settembre 1913» (in Wittgenstein [1913], introduzione, p. 230). 168 Wittgenstein [1921], prefazione dell’autore, p. 2. 169 Non traduco qui, come ho fatto nel caso del Frege post-1891, il termine tedesco “Bedeutung” con “denotazione”, perché lo stesso Wittgenstein, scrivendo in inglese, si serviva del termine “meaning” in contrapposizione a “sense”, e perché il termine “denotazione” potrebbe suggerire che gli enunciati siano una sorta di nomi, cosa che, come vedremo tra poco, Wittgenstein negava recisamente. 170 Nel caso del Frege post-1891 ho tradotto “Satz” con “enunciato” (v. sopra, cap. 5, nota 72). Sebbene anche i “Stitze” di Wittgenstein siano enunciati, ritengo qui opportuno tradurre il termine con “proposizione”, perché lo stesso Wittgenstein usava l’inglese “proposition” come sinonimo di “Satz”. !?! V_ anche Wittgenstein [1921], prop. 4.0621. !72 Non sembra che, nel Tractatus, Wittgenstein sostenga ancora che vi sono fatti negativi. È vero che egli vi afferma: «Il sussistere [Beste-
696
capitolo 10
una proposizione è dato dalle sue condizioni di verità e falsità, e comprendere il senso di una proposizione atomica è la conoscenza del fatto che sussiste se essa è vera o se essa è falsa ($ I, pp. 232-233).'”? Il senso delle funzioni di verità di proposizioni atomiche è funzione del senso di queste proposizioni ($ I, pp. 235-236).!7* Le proposizioni molecolari sono funzioni di verità delle proposizioni atomiche che le costituiscono ($ II, p. IZ8) AR Chedle
proposizioni abbiano un riferimento non significa che esse, per Wittgenstein, siano assimilabili ai nomi; secondo Wittgenstein, le proposizioni non sono nomi di fatti: i fatti non possono essere nominati, ma solo descritti ($ I, p. 232).!”° Quindi, le proposizioni non possono essere semplici raggruppamenti di nomi (nomi composti) ($ II, p. 236).'”” Negando che le proposizioni siano nomi, o gruppi di nomi, Wittgenstein si contrappone esplicitamente a Frege ($ I, p. 232). Perché una proposizione atomica non può essere assimilata a un nome (semplice o complesso)? Perché, sostiene Wittgenstein, per ogni fatto ci sono due proposizioni atomiche che, tuttavia, hanno senso opposto. Uno stesso fatto costituisce sia il riferimento della proposizione “p”, sia il riferimento della proposizione “non-p”, ma le due proposizioni hanno un senso opposto, che fa sì che la prima sia vera, e la seconda falsa. Questa diversità di senso sarebbe inspiegabile se, semplicemente, le due proposizioni atomiche nominassero il medesimo fatto. Un paragone usato da Wittgenstein per illustrare la distinzione tra le proposizioni e i nomi è la seguente: «I nomi sono punti; le proposizioni frecce — esse hanno senso» ($ I, p. 235).!7 Un altro paragone è quello del dipolo: «una proposizione ha due poli (corrispondenti al caso della sua verità e al caso della sua falsità)» ($ I, p. 232). Possiamo dunque immaginare una proposizione atomica, nel senso di Wittgenstein, come una freccia che si accoppia a un’altra freccia (la proposizione è per Wittgenstein un fatto che si riferisce a un altro fatto) disponendosi nella stessa direzione (se vera) o in direzione opposta (se è falsa) ($ I, p. 235). Oppure possiamo immaginarla come un dipolo, i cui poli — vero e falso, 0 + e —, o a e d — coincidono o sono opposti ai poli del fatto che essa rappresenta. Scrive Wittgenstein: Io ora determino il senso di “xRy” ponendo la regola: quando i fatti si comportano riguardo a “xRy” in modo che il significato di “x? stia nella relazione R al significato di “y”, allora dico che questi fatti sono “di senso uguale” [of like sense” ](gleichsinnig) alla proposizione “xRy”; altrimenti “di senso opposto” [of opposite sense] (entgegengesetzi). Io correlo i fatti al simbolo “xRy” dividendoli così in fatti di senso uguale e di senso opposto.
I fatti, dice Wittgenstein, possono essere descritti solo da altri fatti ($ V, p. 243),'5° una proposizione, in senso linguistico, è per Wittgenstein un fatto ($ II, p. 236),"*' e il suo significato (il suo riferimento) è un fatto ($ I, p. 235). Così, per es., «che questo calamaio sia su questo tavolo può esprimere che io siedo su questa sedia» ($ II, p. 236). Una proposizione atomica, secondo Wittgenstein descrive un (altro) fatto rispecchiandone la forma; egli scrive: «che “a” stia in una certa relazione con “Db” [in “aRb”] dice che aRb» ($ V, p. 243).'5 In uno scritto di pochi mesi successivo, Wittgenstein spiega più chiaramente che, per es., in “aRb”, “R” non è il nome di un’ entità; piuttosto, che “R” stia tra “a” e “b” esprime una relazione. '**Wittgenstein scrive: «che una certa cosa accade [is the case] nel simbolo dice che una certa cosa accade nel mondo» ($ V, p. 243).'® Dunque, per Wittgenstein, le ce
_??
hen] e non sussistere [Nichtbestehen] di stati di cose [Sachverhalten] è la realtà [WirKlichkeit]. (Il sussistere di stati di cose lo chiamiamo
anche un fatto positivo, il non sussistere un fatto negativo)» (Wittgenstein [1921], prop. 2.06), e, poco dopo: «La realtà intera è il mondo» (Wittgenstein [1921], prop. 2.063), da cui sembra che i fatti negativi siano parte del mondo. Ma poco prima, egli scriveva: «La totalità degli stati di cose sussistenti è il mondo» (Wittgenstein [1921], prop. 2.04), e «La totalità degli stati di cose sussistenti determina anche quali stati di cose non sussistono» (Wittgenstein [1921], prop. 2.05), da cui si desume che egli non concepiva più i fatti negativi come parte del mondo, ma come determinati dai fatti che sono parte del mondo. In proposito, v. Stevens [2005], nota 26, a p. 144 del cap. 6, p. 170.
!73 V. anche Wittgenstein [1921], propp. 4.022, 4.024, 4.2, 4.4, 4.431. !74 V. anche Wittgenstein [1921], prop. 5.2341. 175 176 17? 178
V. V. V. V.
anche anche anche anche
Wittgenstein Wittgenstein Wittgenstein Wittgenstein
[1921], [1921], [1921], [1921],
prop. prop. prop. prop.
5. 3.144. 3.142. 3.144.
179 Wittgenstein [1913], $ II, p. 237. 180 V. Wittgenstein [1921], prop. 3.144. !5! V. anche Wittgenstein [1921], prop. 3.14. 182 V. anche Wittgenstein [1921], prop. 3.1431: «L'essenza del segno proposizionale diviene molto chiara se lo pensiamo composto, invece che di segni scritti, di oggetti spaziali (come tavoli, sedie, libri). La posizione spaziale reciproca di queste cose esprime allora il senso della proposizione». 183 V. anche Wittgenstein [1921], prop. 3.1432.
184 V. Wittgenstein [1914], p. 109. 155 V. anche Wittgenstein [1921], prop. 4.0311: «Un nome sta per [steht fiir] una cosa, un altro per un’altra cosa ed essi sono collegati l’uno
La teoria del giudizio come relazione multipla
697
relazioni tra oggetti, o le loro proprietà, sono simbolizzate in una proposizione atomica da relazioni tra i nomi di questi oggetti o, nel caso delle proprietà, da proprietà dei loro nomi. Nel Tractatus, Wittgenstein sosterrà esplicitamente che le proposizioni atomiche sono immagini del fatto che accade se esse sono vere, nel senso che hanno la stessa struttura, la stessa forma logica.!5° E chiaro, da quanto abbozzato, il contrasto con la teoria del giudizio come relazione multipla di Russell, che dissolve una proposizione elementare in un insieme di oggetti (un enunciato in nomi, potremmo dire), uno dei quali è una relazione (non relazionante), incollati insieme da un altro oggetto: la forma logica. Ci sono diversi punti del testo in cui Wittgenstein solleva obiezioni al lavoro di Russell. Proprio all’inizio del primo paragrafo, egli afferma che la tesi «le proposizioni corrispondono a complessi» ($ I, p. 232), attribuita a Russell, è falsa. Ciò può lasciare un po’ perplessi, d’acchito: non dice forse lo stesso Wittgenstein che le proposizioni atomiche corrispondono a fatti? e che altro sono, i fatti, se non i complessi russelliani? Ciò che intende Wittgenstein, in realtà,
parlando qui di “complessi”, non sono i fatti, ma quegli aggregati di termini in cui, secondo la teoria del giudizio come relazione multipla, si riduce una proposizione (in senso ontologico). Questo si conferma poche pagine dopo, laddove Wittgenstein scrive: «I “complessi” di Russell dovrebbero avere l’utile proprietà di essere composti, e dovrebbero combinare con essa la gradevole proprietà di poter essere trattati come “semplici”» ($ II, p. 237). L’obiezione è qui diretta proprio al nucleo dell’idea della teoria russelliana del giudizio: l’idea di risolvere le proposizioni (in senso non linguistico) nei loro costituenti. Wittgenstein contesta anche la concezione russelliana delle forme: Non c’è una cosa che sia la forma di una proposizione, né un nome che sia il nome di una forma. Di conseguenza non possiamo neanche dire che una relazione che in certi casi vale tra cose valga talvolta tra forme e cose. Questo va contro la teoria del giudizio di 187 Russell.
Le proposizioni, per Wittgenstein, hanno una forma, una forma che — se sono vere — condividono con i fatti cui si riferiscono, ma le forme non sono oggetti separati dai fatti di cui sono forme. Il passo più interessante, ai nostri fini attuali, è quello che segue: Quando diciamo: A giudica che, ecc., allora dobbiamo menzionare un’intera proposizione giudicata da A. Non funzionerà limitarsi a menzionare solo i suoi costituenti, 0 i suoi costituenti e la forma ma non nell’ordine giusto. Questo mostra che una proposizione deve comparire essa stessa nell’asserzione [statement] che essa è giudicata. Per esempio, comunque “non-p” possa essere spiegata, la domanda “Che cosa è negato?” deve avere un significato. In “A giudica (che) p”, p non può essere sostituita da un nome proprio. Questo è evidente se sostituiamo “A giudica che p è vera e non-p è falsa”. La proposizione “A giudica (che) p” consiste del nome proprio A, della proposizione p con i suoi due poli, e dell’essere A correlato a entrambi questi due poli in un certo modo. Questa ovviamente non è una relazione nel senso ordinario. Ogni teoria del giudizio giusta deve rendermi impossibile giudicare che “Questo tavolo portapenna il libro” [this table penholders the book] (la teoria di Russell non soddisfa questo requisito).'**
In questo passo — la cui parte finale corrisponde evidentemente alla proposizione 5.5422 del Tractatus sopra citata'# — Wittgenstein afferma che una proposizione possiede una sua unità, e non può essere dissolta nei suoi elementi. Né può essere assimilata (come nel primo Russell), a un nome proprio. Il giudizio di A che giudica p, dice Wittgenstein, è una relazione tra A e i due poli della proposizione (presumibilmente, la credenza che i poli della proposizione concordino con i poli del fatto corrispondente). Poi viene l’esempio del nonsenso “Il tavolo portapenna il libro”: l’idea è qui che la teoria di Russell non impedisce la formazione di giudizi in cui, per esempio, al posto di un universale, si menzioni un particolare.
Possiamo ora offrire la nostra interpretazione della difficoltà che bloccò lo sviluppo della teoria del giudizio come relazione multipla nel 1913. L’asserzione di Wittgenstein, nella citata lettera a Russell, che dall’enunciato “aRb” «‘aRb. v. -aRb” deve seguire direttamente senza l’uso di nessun’altra premessa» si spiega come un’obiezione al tentativo di Russell di introdurre le forme logiche per garantire sia l’unità degli oggetti di un giudizio, sia il loro ordine. Infatti, come già osservato, la forma di un giudizio non potrebbe eliminare un nonsenso, se non alla condizione ulteriore che gli oggetti del giudizio siano del giusto tipo per questa forma. Perché Witt-
con l’altro, così il tutto rappresenta [ste/lt vor] — come un quadro vivente [wie ein lebendes Bild] — lo stato di cose [Sachverhalt]».
!86 V. Wittgenstein [1921], propp. 4.01-4.015, e prop. 4.03.
!87 Wittgenstein [1913], $ II, p. 237. 188 Wittgenstein [1913], $ I, p. 234. 189 Cioè: «La spiegazione corretta della forma della proposizione “A giudica p”, deve mostrare che è impossibile giudicare un nonsenso. (La teoria di Russell non soddisfa questa condizione.)».
capitolo 10
698
genstein afferma che non ci debba essere un’ulteriore premessa? Perché egli considera ovvio che il fatto che un enunciato abbia senso non può dipendere dalla verità di un altro enunciato a proposito di entità cui si fa riferimento nel primo. Nel Tractatus, Wittgenstein si servirà di quest’argomento per dimostrare che gli oggetti devono essere semplici, cioè non composti di parti (v. propp. 2.021, 2.0211, 2.0212); ma la stessa tesi è già sostenuta da Wittgenstein nei primi mesi del 1914: «La questione se una proposizione abbia senso (Sinn), non può mai dipendere dalla verità di un’altra proposizione a proposito di un costituente della prima».'’ Questo è un punto, inoltre, sul quale sembra che Russell fosse d’accordo. Lo testimoniano: il suo rifiuto delle variabili ristrette e delle definizioni condizionali (v. sopra, cap. 7, $ 4); la sua teoria delle descrizioni; e infine, nei Principia, la sua preoccupa-
zione nel precisare che «le limitazioni cui è soggetta la variabile non ristretta non necessitano di essere esplicitamente indicate, poiché esse sono i limiti di significanza dell’asserzione in cui compare la variabile, e sono dunque intrinsecamente determinate da quest’asserzione».'°' Ma non avrebbe potuto Russell far uso delle relazioni del giudicare per eliminare i nonsensi, dicendo, per esempio: “le limitazioni cui sono soggetti gli oggetti di un giudizio non necessitano di essere esplicitamente indicate, poiché esse sono i limiti di significanza del giudizio stesso”? Non avrebbe potuto utilizzare la partizione in tipi delle entità postulata in Theory of Knowledge per sostenere, per esempio, che vi sono relazioni di giudizio (0 comprensione, ecc.) le quali hanno per argomenti possibili una mente, due particolari, una relazione e una forma logica, mentre non vi sono relazioni di giudizio (0 comprensione, ecc.) che hanno per argomenti possibili tre particolari e una forma logica? Allo scopo di eliminare i nonsensi con questo metodo, la partizione in tipi delle entità postulata in Theory of Knowledge non basterebbe. Infatti, poiché in Theory of Knowledge le forme logiche non sono ripartite in tipi, potremmo avere, per es., un giudizio che correla una mente con due particolari, una relazione e la forma logica (4x)(AF)(F(); ma qui gli oggetti del giudizio non sarebbero del giusto tipo per questa forma, e così saremmo tornati alla difficoltà iniziale. Per evitare questo risultato, bisognerebbe sostenere che le forme logiche sono di tipi diversi, ciascuna forma logica avendo un tipo logico differente da quello di ogni altra forma logica, e che le relazioni di giudizio sono tali da consentire solo la correlazione di una mente con oggetti di tipo tale da poter formare un complesso, e con la forma logica che avrebbe quel complesso. Russell non cercò tuttavia di modificare la teoria in questa (barocca) direzione. Egli si convinse, anzi, che Wittgenstein avesse ragione in quello che le “Notes on logic” mostrano essere il difetto centrale da lui attribuito alla teoria di Russell: la dissoluzione dell’unità degli oggetti di un giudizio. L’introduzione delle forme logiche nella teoria di 7heory of Knowledge dimostra che Russell era sensibile a questo problema. E in effetti, cinque anni dopo, nelle conferenze intitolate “The philosophy of logical atomism”, Russell richiamerà l’attenzione proprio su di esso: Supponete che io prenda “A crede che B ami C”. “Otello crede che Desdemona ami Cassio”. Qui avete una falsa credenza. Avete la strana situazione che il verbo “ama” compare in questa proposizione sembra comparire come se relazionasse Desdemona a Cassio, mentre in realtà non lo fa, ma tuttavia compare come verbo, compare nel modo in cui dovrebbe comparire un verbo. Intendo dire che quando A crede che B ami C, dovete avere un verbo nel luogo in cui compare “ama”. Non potete mettere al suo posto un sostantivo. Pertanto è chiaro che il verbo subordinato (cioè, il verbo diverso dal credere) funziona come verbo, e sembra relazionare i
due termini, ma non lo fa effettivamente quando accade che un giudizio sia falso. Questo è ciò che costituisce il puzz/e sulla natura della credenza. [...]
Questo è un punto in cui penso che la teoria del giudizio che ho dato alle stampe qualche anno fa fosse un po’ troppo semplice, perché allora trattavo il verbo oggetto come se si potesse introdurlo come un oggetto esattamente alla pari con i termini, come se si
potesse introdurre “ama” allo stesso livello di Desdemona e Cassio come termine della relazione “credere”.!°?
È plausibile che — come ritengono Landini" e Hanks!" — quello che nel brano precedente è identificato come «il puzzle sulla natura della credenza» fosse precisamente il problema sul quale l’obiezione di Wittgenstein aveva focalizzato l’attenzione di Russell fin dal 1913. Se questo è corretto, si può supporre che il problema che
bloccò lo sviluppo della teoria del giudizio come relazione multipla — in connessione con la critica di Wittgenstein — fosse, in sintesi, il seguente: una relazione può essere oggetto di giudizio come relazione multipla solo in
quanto entità non relazionante: ma questo trasforma un giudizio in una relazione con i costituenti di una lista di
190 Wittgenstein [1914], p. 116. ai [PM], vol. I, introduzione, cap. 1, p. 4.
92 Russell [1918-19], $ IV, pp. 225-226. 193 V. Landini [1991], p. 67. !°4 V. Hanks [2007], p. 139.
La teoria del giudizio come relazione multipla
699
entità; né il problema è risolto introducendo le forme come termini ulteriori del giudizio, perché esse restano, di fatto, semplicemente nuove entità che si aggiungono alla lista. Dopo il fallimento di Theory of Knowledge, Russell restò per diversi anni in grande incertezza riguardo alla teoria delle “proposizioni”. A quanto pare, egli non poteva né mettere in una forma per lui accettabile la teoria del giudizio come relazione multipla, né ritornare alla vecchia ontologia delle proposizioni come costituenti non linguistiche e non mentali del mondo — di fatto, Russell non ritornerà mai più a un’ontologia di proposizioni intese come oggetti indipendenti dal linguaggio e dal pensiero umano. Questo causò a Russell un periodo di profondo
sconforto intellettuale. In una lettera del 1916 a Ottoline Morrell, Russell scrive: La sua critica [di Wittgenstein], non credo che tu l’avessi compreso all’epoca, fu un evento di primaria importanza nella mia vita, e ha influenzato tutto ciò che ho fatto da allora. Vidi che aveva ragione, e vidi che non avrei potuto sperare ancora di svolgere del lavoro fondamentale in filosofia. Il mio impeto si frantumò, come un’onda si infrange contro un frangiflutti.!”
Nel 1918, in “The philosophy of logical atomism”, Russell mostra quanto profonda fosse stata su di lui l’influenza di Wittgenstein, adottando molte delle posizioni che quest’ultimo sosteneva già nel 1913, e che si ritrovano, più sviluppate, nel Tractatus Logico-Philosophicus." In particolare, Russell sostiene ora che ogni enunciato e il suo contraddittorio si riferiscono al medesimo fatto, che rende vero l’uno e falso l’altro; che gli enunciati non sono nomi di fatti; che i fatti non si possono nominare; che una parola designante un attributo possa comparire in un enunciato solo come verbo, e non come sostantivo.” Russell mantiene tuttavia una posizione indefinita
su quali possano essere gli oggetti degli atteggiamenti proposizionali (non si può trattare dei fatti, perché allora, per esempio, credere che Socrate fosse un filosofo e che Socrate non fosse un filosofo sarebbe la stessa cosa). Russell ritiene ora che il verbo subordinato a una relazione di atteggiamento proposizionale dovrebbe designare una relazione relazionante; ma egli osserva che questa relazione relazionante, in modo paradossale, non può realmente correlare i suoi termini, perché altrimenti non vi sarebbe più possibilità di giudicare o di comprendere il falso. Russell non offre nessuna soluzione al dilemma, scusandosi con l’uditorio per non poter far altro che «mettere in risalto le difficoltà piuttosto che proporre soluzioni chiare». °° Una nuova teoria delle proposizioni fu elaborata da Russell solo nel 1919, in “On propositions: what they are and how they mean”, sulla scorta dell’adozione di altre idee di Wittgenstein. La teoria difesa da Russell in questo scritto si può riassumere come segue. Le “proposizioni” possono essere proposizioni di parole (wordpropositions), 0 proposizioni d'immagini (image-propositions) ($ III, p. 308).°"! Nel primo caso, si tratta di enunciati; nel secondo caso, di immagini mentali, che Russell descrive come
«“copie” di sensazioni» ($ II, p. 303).
Così, per esempio, l’enunciato “La finestra è a destra del caminetto” e l’immagine mentale in cui una certa finestra è a destra del caminetto, sono, rispettivamente, una proposizione di parole e una proposizione di immagini. Una proposizione di parole, di regola, significa (means) una proposizione d’immagini ($ III, pp. 308-309). Se quest’ultima è accompagnata da un sentimento di consenso riferito alla proposizione in oggetto, abbiamo una credenza ($ HI, pp. 309-314). Proposizioni di parole e proposizioni d'immagini hanno anche ciò che Russell chiama ora un riferimento obiettivo (objective reference) ($ III, p. 309; $ IV, p. 315). Un riferimento obiettivo è un fatto, è ciò che rende vera o falsa una proposizione ($ III, p. 308), e una proposizione, sia essa di parole o di immagini è essa stessa un fatto, «avente una certa analogia di struttura — da indagarsi ulteriormente — con il fatto che la rende vera o falsa» ($ III, p. 309
Nel caso più semplice — cui, in definitiva, Russell restringe la sua attenzione —
!95 In Russell [1967-69], 1914-1944, cap. 8, p. 282. Riportato anche in Hanks [2007], p. 123 e, parzialmente, in Hylton [1984], p. 24. 196 Russell riconosce apertamente il suo debito con Wittgenstein in una breve prefazione alla pubblicazione del testo sul Monist in cui scrive che le conferenze «riguardano in gran parte la spiegazione di certe idee che ho appreso dal mio amico ed ex allievo Ludwig Wittgenstein. Non ho avuto l’opportunità di conoscere le sue opinioni dall’agosto del 1914, e non so neppure se sia vivo o morto». (Russell [191819], p. 177). Wittgenstein era partito per combattere nella prima guerra mondiale, nelle file dell’esercito austriaco. I loro contatti ripresero nel 1919, quando Wittgenstein spedì a Russell una copia del suo 7ractatus, che aveva terminato nell’estate del 1918.
97 Per una descrizione più particolareggiata della teoria di in “The philosophy of logical atomism”, v. sotto, cap. 13, $ 2.1.
!98 V. Russell [1918-19], $ IV, pp. 225-226. 199 Russell [1918-19], $ IV, p. 227.
200 V. Russell [1919b].
201 [a stessa distinzione si ritrova in The Analysis of Mind: v. Russell [1921a], lecture XII, p. 241. 202 Russell conserverà l’idea di proposizioni come entità mentali “espresse”, o “significate”, dagli enunciati in tutta la sua restante carriera filosofica: v. per es. Russell [1940], cap. 13, A, p. 189. 203 Russell sosterrà una teoria simile ancora negli anni Quaranta del Novecento. Per es., in An Inquiry into Meaning and Truth (1940), una “proposizione”, in senso linguistico, vi è definita come «“tutti gli enunciati [sentences] che hanno lo stesso significato [meaning] di un e-
nunciato dato”» (Russell [1940], introduzione, p. 12); le proposizioni in senso linguistico esprimono (express) proposizioni in senso non
10 capitolo
700
una proposizione (atomica) è vera quando la corrispondente proposizione d'immagini corrisponde alla realtà: cioè quando gli oggetti cui le immagini si riferiscono stanno nelle stesse relazioni in cui stanno gli oggetti reali. Altrimenti la proposizione è falsa ($ IV, pp. 315-316). Russell porta quest’esempio: Avete un’immagine di A che è a sinistra della vostra immagine di B: quest’occorrenza è una proposizione d’immagini. Se A è alla sinistra di B, la proposizione è vera; se A non è alla sinistra di B, essa è falsa. L'espressione [phrase] “A è alla sinistra di B” significa la proposizione di immagini, ed è vera quando questa è vera, falsa quando questa è falsa; d’altra parte, l’espressione “A non è alla sinistra di B” è vera quando la proposizione d’immagini è falsa, e falsa quando essa è vera. Così per questo caso semplicissimo abbiamo ottenuto una definizione formale della verità e della falsità, sia per le proposizioni di immagini, sia per le proposizioni di parole. È facile vedere che lo stesso genere di definizione può essere esteso a casi più complicati.?°
La teoria della verità qui sostenuta da Russell è chiaramente una variante di quella sostenuta da Wittgenstein nel Tractatus. In quest'articolo, Russell accetta gli argomenti del monismo neutro — che in precedenza aveva respinto?” contro l’esistenza del soggetto.” Anche qui, è facile riconoscere un’influenza su Russell del primo Wittgenstein.”°” Ora Russell ritiene che gli oggetti fisici e quelli mentali siano costruzioni che raggruppano diversamente le medesime entità fondamentali, le quali sarebbero “neutre”, cioè né mentali, né fisiche. Con la reiezione del
soggetto, cade la possibilità di concepire gli atteggiamenti proposizionali come relazioni tra un soggetto e altre entità. Così Russell annota: La teoria della credenza che ho difeso in precedenza, cioè, che essa consiste in una relazione multipla del soggetto con gli oggetti costituenti l’“obiettivo” [objective], cioè, il fatto che rende la credenza vera o falsa, è resa impossibile dalla reiezione del sogget208 to.
Questo resterà, nell’opera di Russell, l’epitaffio alla teoria del giudizio e degli atteggiamenti proposizionali come relazioni multiple.”
linguistico, che «si devono definire come eventi [occurrences] psicologici di qualche sorta — immagini complesse, aspettative, ecc. Tali eventi sono “espressi” [expressed] dagli enunciati, ma gli enunciati “asseriscono”
[assert] qualcos’altro» (Russell [1940], cap. 13, A, p.
189). Questo qualcos’altro, che esiste solo se la proposizione è vera, è un fatto: «Un’asserzione [assertion] ha due lati, soggettivo e oggettivo. Soggettivamente, “esprime” uno stato del parlante, che si può chiamare una “credenza”, che può esistere senza parole, e anche negli animali e negli infanti che non possiedono il linguaggio. Oggettivamente, l’asserzione, se vera, “indica” [indicates] un fatto; se falsa, intende [intends] “indicare” [indicate] un fatto, ma non riesce a farlo» (Russell [1940], cap. 13, A, p. 171).
204 Russell [1919b], $ IV, p.319. 205 V. Russell [1913a], parte I, cap. 2 e parte del cap. 3, e Russell [1914b], $ II e parte del $ III.
206 V_ Russell [1919b], $ III, pp. 305-307. 207 Nel Tractatus, Wittgenstein scrive che «l’anima il soggetto, ecc. — com’è concepita nella superficiale psicologia odierna è un’assurdità» (Wittgenstein [1921], prop. 5.5421). Quest’idea di Wittgenstein risale perlomeno all’inizio del 1914 (v. Wittgenstein [1914], p. 118).
208 Russell [1919b], $ III, pp. 306-307. 20° La teoria del giudizio come relazione multipla sarà difesa da Ramsey ancora nel 1927 (v. Ramsey [1927], pp. 153-170). Questi, tuttavia, la accetta solo per i giudizi atomici, mentre ritiene che le proposizioni molecolari e generali (intese in senso linguistico) esprimano l'accordo e il disaccordo con le possibilità di attribuzione di valori di verità alle proposizioni atomiche che li compongono. Così, per esem66 99 pio, utilizzando “p” e “g” come variabili metalinguistiche che prendono enunciati come valori, un enunciato della forma "p Ag, esprimerebbe l’accordo con la possibilità p-vero e g-vero, e il disaccordo con le possibilità p-falso e g-vero, p-vero e g-falso, p-falso e g-falso. Un enunciato generale della forma ' (v)Av',dove Av è una formula contenente la variabile v, esprimerebbe invece l’accordo con tutti gli enunciati atomici della forma ' Ac! risultanti dalla sostituzione della variabile v con una costante c. (Per l’uso delle virgolette “...”?, v. sopra, cap. 3, nota 344, e sotto, cap. 11, nota 197).
CAPITOLO 11 LA TEORIA DEI TIPI DEI PRINCIPIA
L’elaborazione dei Principia Mathematica richiese quasi un decennio. Nella seconda metà del 1902, Russell e Whitehead cominciarono a collaborare fattivamente a quello che avrebbe dovuto essere il secondo volume dei Principles of Mathematics. La cooperazione tra Russell e Whitehead risaliva al 1901: Whitehead aveva assistito Russell nella stesura definitiva dei Principles, e, all’inizio di ottobre del 1901, i due progettavano di scrivere insieme un libro dal titolo On the Logic of Relations” Nell’estate del 1902, il progetto si era trasformato nell’intenzione di scrivere insieme un secondo volume dei Principles. Il primo volume — all’epoca già consegnato all’editore, ma sul quale Russell continuò a intervenire fino alla fine del 1902 — sarebbe stato volto a una trattazione filosofica e programmatica degli argomenti; il secondo, invece, avrebbe dovuto realizzare fattivamente la
teoria, presentando in dettaglio la derivazione simbolica dei teoremi fondamentali della matematica pura.’ Per realizzare il secondo volume, tuttavia, occorreva aver risolto in modo soddisfacente il problema dei paradossi, e questo si rivelò un compito molto più difficile del previsto, che richiese diversi anni, durante i quali la filosofia di Russell andò incontro a importanti cambiamenti. Una rapida carrellata: già nel 1903, Russell aveva accettato numerosi punti del lavoro di Frege, che lo avevano condotto a rivedere totalmente la propria teoria delle classi e — a causa del rifiuto delle definizioni condizionate — la logica proposizionale sostenuta nei Principles; nel 1905, la teoria delle descrizioni definite condannò l’intera teoria della denotazione proposta nei Principles; dopo il 1905, l’ontologia di Russell non includeva più classi, e la sua teoria logica — nel tentativo di trovare una soluzione ai paradossi —
era cambiata drasticamente; infine, tra la fine del 1906 e il 1907 Russell cominciò a du-
bitare delle proposizioni, nel senso ontologico non linguistico dei Principles, e poco dopo le eliminò dalla propria ontologia. I Principles divennero irrimediabilmente obsoleti sotto troppi aspetti che coinvolgevano, per di più, proprio quello che avrebbe dovuto essere lo scopo primario di quel libro, cioè la chiarificazione delle basi filosofiche del programmato secondo volume. Così, strada facendo, il secondo volume dei Principles si trasformò in un’opera autonoma, che intendeva provvedere sia le basi filosofiche, sia lo sviluppo simbolico rigoroso del logicismo di Russell e Whitehead. Nacquero così i Principia Mathematica.* La divisione del lavoro tra i due autori è descritta così da Russell in My Philosophical Development (1959): I problemi con cui dovevamo lottare erano di due tipi: filosofici e matematici. Parlando in generale, Whitehead lasciava a me i problemi filosofici. Quanto ai problemi matematici, Whitehead inventò la maggior parte della notazione, eccetto quanto fu ripreso da Peano; io feci la maggior parte del lavoro concernente le serie e Whitehead fece la maggior parte del resto. Ma questo si applica solo alle prime stesure. Ogni parte era rifatta tre volte. Quando uno di noi aveva prodotto una prima stesura, la mandava all’altro, che
| Nella prefazione alla prima edizione dei Principles — terminata 2 dicembre del 1902 e ricevuta dall’editore il 10 dello stesso mese — si legge: «A ogni stadio del mio lavoro [sui Principles], sono stato assistito, più di quanto io possa esprimere, dai suggerimenti, dalle critiche e dal generoso incoraggiamento di Mr A. N. Whitehead; egli ha anche gentilmente letto le mie bozze, e ha molto migliorato l’espressione finale di un grandissimo numero di passaggi» (Russell [1903a], p. xxiii; ediz. orig. p. vili). 2 In una lettera a Couturat del 2 ottobre 1901, Russell scrive: «Conto di fare con Whitehead un libro “Sulla logica delle relazioni, con applicazioni all’aritmetica, alla teoria dei gruppi, e alle funzioni e alle equazioni del Calcolo logico”. Ma avremo bisogno di almeno due anni per completarlo» (in Russell [2001a], p. 259) ? Il frontespizio della prima edizione dei Principles riporta la dicitura “VOL T”. Nella prefazione si legge: «Il secondo volume [di quest’opera], per il quale ho avuto la grande fortuna di assicurarmi la collaborazione di Mr. A. N. Whitehead, sarà rivolto esclusivamente ai matematici; esso conterrà catene di deduzioni dalle premesse della logica simbolica attraverso l’aritmetica, finita
e infinita, fino alla geometria, in un ordine simile a quello adottato nel presente volume; esso conterrà anche vari sviluppi originali, in cui il metodo del professor Peano, completato dalla logica delle relazioni, si è mostrato uno strumento potente di ricerca matematica. Il presente volume, che può essere considerato tanto un commento, quanto un’introduzione, al secondo volume, è rivolto in ugual misura al filosofo e al matematico; ma alcune parti saranno più interessanti per l’uno, altre per l’altro» (Russell [1903a], p. xxi; ediz. orig., p. vi). 4 Nell’introduzione al quarto volume dei Co/lected Papers di Russell, Alasdair Urquhart rileva (v. Russell [1994a], p. xv) che il primo rife-
rimento a un cambio di titolo del progettato secondo volume dei Principles compare in una lettera di Russell a Couturat datata 21 agosto 1906: «Purtroppo», scrive Russell a Couturat, «manca ancora molto tempo alla fine del nostro lavoro sul secondo volume. Pensiamo di far-
ne un libro indipendente, che chiameremo “Principia Mathematica”» (in Russell [2001a], p. 616).
702
capitolo 11 di solito la modificava in modo considerevole. Dopodiché, chi aveva compiuto la prima ILE la poneva nella forma definitiva. E difficile che vi sia anche una sola riga in tutti e tre i volumi che non sia un prodotto comune.
In una lettera del dicembre 1932 Russell offre altri particolari: Il compito di redigere il libro nella sua forma finita per la casa editrice ricadde su di me, perché Whitehead aveva molto del suo tempo impegnato dall’insegnamento, mentre io non avevo obblighi professionali. Ci incontravamo spesso, ma la parte più impor-
tante della collaborazione doveva essere fatta scrivendo, perché gli argomenti interessati erano troppo difficili per un trattamento verbale. Spesso una stesura di qualche frammento andava avanti e indietro tra noi diverse volte prima che fossimo soddisfatti.°
Notizie più dettagliate si trovano in un articolo che Russell pubblicò su Mind nel 1948: I capitoli 10, 11 e 13 dei Principia["] sono, nella sostanza, opera sua [di Whitehead]. [...] Nelle parti successive, la responsabilità più forte ricadde su Whitehead per l’aritmetica cardinale e su di me per l’aritmetica delle relazioni. Egli da solo fu responsabile della sezione sulla convergenza e sui limiti delle funzioni, nonché della parte VI, sulla quantità. Whitehead diede anche il suo contributo ad alcuni settori di cui si sarebbe potuto pensare che appartenessero piuttosto al mio campo, per esempio la “Prefatory statement of symbolic conventions” all’inizio del vol. II che tratta dei tipi e dell’ambiguità sistematica. Egli scrisse anche la maggior parte del primo capitolo dell’introduzione.*
Come ci si può aspettare dal travaglio intellettuale che ne accompagnò la nascita, le varie parti dei Principia dovettero essere riscritte ex novo più volte. La stesura definitiva cominciò all’inizio del 1907, quando Russell concepì la teoria esposta in “Mathematical logic as based on the theory of types”, di cui abbiamo parlato nel capitolo 9. Russell consegnò buona parte del manoscritto dei Principia alla casa editrice — la Cambridge University Press — nell’ottobre del 1909, ma il lavoro non era ancora finito: restava da scrivere una parte del terzo volume,’ e il grosso lavoro della correzione delle bozze, che impegnò gli autori dall’ autunno del 1909 fino al febbraio del 1913. Il terzo volume avrebbe dovuto contenere anche una parte sulla geometria, di cui sarebbe stato autore il solo Whitehead. Tuttavia, poiché questa parte richiedeva più tempo del previsto, nel gennaio del 1913 gli autori e la casa editrice decisero di pubblicare il terzo volume senza la trattazione della geometria, rinviando quest’ultima a un progettato quarto volume." I tre volumi che costituiscono l’opera uscirono, rispettivamente, nel dicembre del 1910, nell’aprile del 1912,"! e nell’aprile del 1913. Whitehead lavorò al quarto volume per alcuni anni, forse fino al 1918, ma il libro, sembra a buon punto, non fu mai completato. Purtroppo, egli espresse la volontà che, alla propria morte, tutti i suoi manoscritti non pubblicati fossero distrutti — una volontà che fu esaudita dalla sua vedova nel 1947. Il lavoro del quarto volume dei Principia è quindi definitivamente perduto. Nel 1923, la Cambridge University Press propose a Russell una seconda edizione dei Principia. Russell accettò, tornando per qualche tempo a occuparsi di logica, in una fase della sua ricerca filosofica ormai contrassegnata in modo stabile da prevalenti interessi epistemologici. La seconda edizione fu pubblicata tra il 1925 (primo volume) e il 1927 (secondo e terzo volume), a nome di entrambi gli autori, ma effettivamente a cura del solo Russell."
° Russell [1959], cap. 7, p. 74. ° Lettera a Geza Revesz del 6 dicembre 1932: il passo è pubblicato nell’introduzione di J. G. Slater a Russell [1992a], $ I, p. xv.
? Rispettivamente intitolati: “Teoria delle proposizioni contenenti una variabile apparente”; “Teoria di due variabili apparenti”; “Tdentità”. * Russell [1948b], pp. 137-138. ? In una lettera del 18 ottobre 1909, Russell scrive all’amica Lucy Donnelly: «Da quando è arrivata la tua lettera sono stato troppo impegnato per scrivere fino ad ora, ma ora ho il tempo di scrivere, essendo arrivato a un grande momento: domani vado a Cambridge, portando con me il MS del libro per i tipografi. C’è una certa quantità alla fine che non è ancora terminata, ma oltre 4.000 pagine sono pronte, e il resto si può finire facilmente. Ho lavorato come un negro per fare le ultime revisioni in tempo per la mia visita a Cambridge di domani, e ora il MS è confezionato in due grandi gabbie da imballaggio [...]» (la lettera è pubblicata in Russell [1992b], pp. 325-328; il passo riportato è alle pp. 325-326) !© In una lettera del 19 gennaio del 1913 a Ottoline Morrell, Russell scrive: «[...] abbiamo deciso di pubblicare subito ciò che è stampato di Principia Mathematica in un volume esile (circa 480 pagine) [...]. Ciò che rimane da farsi per il libro è affare di Whitehead — il suo MS non sarà pronto fino all’autunno al più presto» (il passo è riportato nell’introduzione di J. G. Slater a Russell [1992a], $ I, p. xvi). !! L’uscita del secondo volume fu ritardata di qualche mese perché, nel gennaio del 1911, Whitehead scoprì di avervi usato l’assunzione dell’esistenza di un’infinità di individui (il cosiddetto “assioma dell’infinito” dei Principia: v [PM], vol. II, *120.03) senza restrizioni, cosa
che costrinse gli autori a sospendere la pubblicazione dell’opera, in modo che Whitehead potesse rielaborare diverse dimostrazioni e aggiungere una prefazione al volume. ? Russell ci lavorò soprattutto durante le estati del 1923 e del 1924. Inizialmente, Whitehead si era mostrato disponibile a collaborare al progetto: in una lettera a Russell del 24 maggio 1923, aveva promesso che gli avrebbe mandato materiale per un’“appendice” in cui intendeva fornire chiarimenti sul concetto di “funzione” e proporre possibili modificazioni della teoria dei tipi (v. Grattan-Guinness [2000], $
La teoria dei tipi dei Principia
703
Il testo della seconda edizione resta sostanzialmente immutato, rispetto a quello della prima edizione — salvo piccole correzioni, molte delle quali già incluse negli Errata dei tre volumi della prima edizione —, ma al primo volume sono aggiunti: una lunga nuova introduzione, tre appendici e un (utilissimo) elenco dei simboli utilizzati nei tre volumi. Le novità contenute in queste nuove parti consistono principalmente nell’adozione del tratto di Sheffer “’° come unico connettivo! (al posto di “V” e “—’) e nell’esplorazione di quanto è possibile fare rinunciando all’assioma di riducibilità e assumendo, in sua vece, alcuni principi mutuati dal Wittgenstein del Tractatus." In questo capitolo ci concentreremo sulla teoria dei tipi della prima edizione dei Principia, cercando di chiarirne i presupposti ontologici.
1. LE FUNZIONI PROPOSIZIONALI NEI PRINCIPIA 1.1. PREDICATI O ATTRIBUTI? La teoria dei tipi dei Principia è basata su una gerarchia di funzioni proposizionali (propositional functions). Per comprendere questa teoria occorre dunque rispondere a una domanda fondamentale: che cosa sono le “funzioni proposizionali” dei Principia? A una prima lettura si resta confusi: sembra che Russell chiami “funzione proposizionale’” a volte un enunciato aperto, a volte un predicato (in senso linguistico), a volte un’entità intensionale. Questo, abbiamo visto, accadeva anche nei Principles e in “Mathematical
logic...”. Non si può, tuttavia,
considerare la questione già risolta con la discussione delle opere precedenti di Russell, perché l’ontologia dei Principia è diversa sia da quella dei Principles sia da quella dell’articolo del 1907: in particolare, le proposizioni, come corrispondenti ontologici degli enunciati, che avevano accompagnato Russell per più di un decennio, non esistono più, spazzate via dalla teoria del giudizio come relazione multipla. È dunque opportuno riesaminare la questione dello statuto ontologico delle funzioni proposizionali. In letteratura si trovano tesi opposte. Alcuni esempi: Quine, in vari luoghi,'° afferma che la locuzione “funzione proposizionale”’ è usata ambiguamente, nei Principia, talvolta per riferirsi a simboli e talvolta per riferirsi a entità intensionali; John Richards ([1980]), Nino Cocchiarella ([1980], pp. 101-102, e [1987b], pp. 193-194, p. 196, e
pp. 200-202), Peter Hylton ([1990a], cap. 7) e Darryl Jung ([1998]) sostengono che le funzioni proposizionali dei Principia sono entità intensionali; Gregory Landini ([1996a], [1998a], cap. 10, [2007a], cap. 5, pp. 150-157), Kevin C. Klement ([2004a], $ 9, [2009], pp. 8-9, e [2010a], p. 37) e Graham Stevens ([2005], cap. 3, pp. 81-89) sostengono invece che esse sono semplicemente simboli. La tesi di Landini, Klement e Stevens è minoritaria, nel
complesso della letteratura russelliana, ma sembra acquistare terreno, negli ultimi anni. Leggendo 1 passi dell’introduzione dei Principia in cui il termine “funzione proposizionale” è definito, sembra che le funzioni proposizionali debbano essere intese come successioni di simboli; precisamente, enunciati aperti:
8.4.4, p. 441, e Grattan-Guinness [2002], p. 453: nel primo testo, come data della lettera si indica il 29 giugno 1923, nel secondo si indica il 24 maggio 1923). Ma infine Whitehead non aveva preso parte alcuna alla nuova edizione. Lo puntualizza egli stesso in una lettera al direttore di Mind del 5 novembre 1926 (v. Whitehead [1926], p. 130). In questa lettera, Whitehead coglie anche l’opportunità di precisare che «le porzioni della prima edizione — ristampate anche nella seconda edizione — che corrispondono a questi nuovi contenuti [della seconda edizione dei Principia] erano dovute a Mr. Russell, il mio ruolo in queste parti essendosi limitato alla discussione e all’adesione finale. La sola eccezione minore è rispetto a #10 [...]» (Whitehead [1926], p. 130). Un’annotazione in un articolo del 1926 di Susanne K. Langer — all’epoca allieva di Whitehead a Harvard — conferma: «Abbiamo l’autorità del Prof. Whitehead nell’affermare che Mr. Russell è il creatore [originator] della teoria dei tipi, e l’unico autore della nuova Introduzione alla seconda edizione di Principia Mathematica» (Langer [1926], p. 222, nota). È possibile che la mancata partecipazione di Whitehead alla seconda edizione dei Principia fosse dovuta a una mancanza di consenso con Russell sull’importanza attribuita da quest’ultimo alle idee di Wittgenstein. Whitehead proporrà le sue idee sulle modifiche da apportare al sistema dei Principia in Whitehead [1934] — un difficile articolo che costituirà il suo ultimo contributo alla ricerca sui fondamenti della matematica. '3 Per una spiegazione del significato del segno “|” di Sheffer, detto “tratto di Sheffer”, v. sopra, cap. 6, nota 108. In realtà, l’unico effetto concreto dell’adozione dell’incompatibilità di Sheffer nelle formule del materiale aggiunto alla seconda edizione dei Principia fu di renderle poco leggibili — cosa che contribuì, insieme con gli scarni risultati conseguiti nella nuova impostazione, al fatto che questo materiale sia rimasto pressoché ignorato (un’eccezione è Godel [1944]) per circa mezzo secolo.
14 Per maggiori dettagli sull’impostazione della seconda edizione dei Principia, v. sotto, cap. 12, $ 2.4. !S V. sopra, cap. 10. 16 Per es., v. Quine [1940], $ 22, p. 121, nota; [1953b], $ 5, p. 122; [1969a], $ 34, p. 245.
704
capitolo 11 Sia @x un’asserzione [statement] contenente una variabile x e tale che divenga una proposizione quando a x si dà un determinato valore fissato. Allora @x è detta una “funzione proposizionale”; non è una proposizione, poiché data l'ambiguità di x essa non costituisce affatto un asserto [assertion].!?
Per “funzione proposizionale” intendiamo qualcosa che contiene una variabile x, ed esprime [expresses] una proposizione non appena si assegna un valore a x. Vale a dire, essa differisce da una proposizione solamente per il fatto che è ambigua: contiene una variabile il cui valore non è assegnato. '*
Una variabile — secondo la concezione standard — è un simbolo, e questo sembra valere anche nei Principia, laddove si definisce una variabile come «qualsiasi simbolo il cui significato non è determinato». Nei brani sopra citati, si dice che questo simbolo è contenuto nella funzione proposizionale, che sembra dunque essere, essa stessa, una successione di simboli. Inoltre, almeno nel secondo dei passi riportati, si asserisce che una funzione pro-
posizionale esprime una proposizione, una volta che si sia assegnato un valore alla variabile che essa contiene: 0ra, ciò che esprime qualcosa, sembra essere, per l’appunto, un’espressione, un simbolo, non un'entità non linguistica.” A questo proposito, dal confronto dei due brani, emerge una difficoltà connessa con l’uso del termine “proposizione” (proposition): nel primo passo si dice che, assegnando un valore alla variabile x otteniamo una proposizione; nel secondo si dice invece che otteniamo qualcosa che esprime una proposizione. Il problema si risolve però facilmente quando si considera che nei Principia — proprio come nei precedenti scritti di Russell! — il termine “proposizione” è usato ambiguamente, talora per designare le (supposte) entità non linguistiche espresse dagli enunciati, talora per designare gli enunciati stessi. Laddove, per esempio, si spiega la necessità di introdurre degli “indicatori d'ambito” per le descrizioni definite, dicendo che, se una descrizione definita «compare in una proposizione che è parte di una proposizione più ampia, resta in dubbio se [ciò da cui la descrizione dev'essere eliminata] sia la proposizione più piccola o la più ampia [...]»,?? è evidente che “proposizione” è usato per indicare un’entità linguistica, perché una descrizione definita non è, essa stessa, altro che un’entità linguistica. Ma laddove, per esempio, si afferma che «una “proposizione” nel senso in cui una proposizione è supposta essere l'oggetto di un giudizio, è una falsa astrazione, perché un giudizio ha diversi oggetti, non uno solo», o laddove, poche righe più sotto, si asserisce che «l’espressione [phrase] che esprime [expresses] una proposizione è ciò che chiamiamo un simbolo “incompleto”»,”' è evidente che “proposizione” non è usato per indicare un enunciato, ma il suo (supposto) riferimento. Si possono dunque interpretare i due passi citati sopra in modo coerente con l’interpretazione delle funzioni proposizionali come enunciati aperti. Che le funzioni proposizionali dei Principia siano enunciati aperti appare confermato anche quando, per spiegare l’ “ambiguità” delle funzioni proposizionali, Russell scrive: «Quando diciamo che “@x? denota ambiguamente pa, gb, gc, ecc. intendiamo che “@x” significa uno degli oggetti ga, gb, gc, ecc., sebbene non uno definito, ma uno indeterminato». Poco più avanti, però, Russell precisa meglio il suo punto di vista distinguendo le funzioni proposizionali dagli enunciati aperti: E necessario, in pratica, distinguere la funzione stessa da un valore indeterminato della funzione. Possiamo considerare la funzione
stessa come ciò che denota ambiguamente, mentre un valore indeterminato della funzione è ciò che è ambiguamente denotato. Se il valore indeterminato è scritto ‘“@x”, scriveremo la funzione stessa ‘“@ %”. [...] La funzione stessa, @ % , è la cosa singola che denota ambiguamente i suoi molti valori; mentre @x, dove x non è specificato, è uno degli oggetti denotati, con l’ambiguità propria della maniera di denotare.” !? [PM], vol. I, introduzione, cap. 1, p. 14.
!8 [PM], vol. I, introduzione, cap. 2, $ II, p. 38. Si confrontino i passi riportati con la definizione presente nell’articolo di Russell “On the notion of cause”, dell’epoca della pubblicazione della prima edizione dei Principia: «Una funzione proposizionale è un’espressione [expression] contenente una variabile, 0 costituente indeterminato, e che diviene una proposizione non appena si assegna un valore definito alla variabile» (Russell [1913c], p. 182, nota 1). po [PM], vol. I, introduzione, cap. 1, p. 4.
20.n quest’interpretazione, naturalmente, nel primo dei passaggi citati sarebbero opportune virgolette di citazione intorno a ‘“@x”, che invece sono omesse. 2A VII proposito, sopra, cap. 6, $ 7.4, cap. 9, $ 2.2.1, e sotto, cap. 13, $ 2.1.
22 [PM], vol. I, #14, sommario, p. 173. 23 [PM], vol. I, introduzione, cap. 2, $ III, p. 44.
24 Ibid.
25 [PM], vol. I, introduzione, cap. 2, $ II, p. 39. 26 [PM], vol. I, introduzione, cap. 2, $ II, p. 40. La distinzione tra simbolo funzionale ed enunciato aperto è tracciata anche nel cap. l
dell’introduzione, p. 15: «Quando vorremo parlare della funzione proposizionale che corrisponde a “x è ferito”, scriveremo “ & è ferito”.
La teoria dei tipi dei Principia
705
Sebbene siano distinte dagli enunciati aperti, anche qui le funzioni proposizionali sembrano intese come simboli complessi; si dice infatti che una funzione “denota” i suoi molti valori, la qual cosa suggerisce immediatamente che le funzioni proposizionali siano ciò che oggi chiameremmo “predicati”, monadici o poliadici.”” A favore del punto di vista secondo cui le funzioni proposizionali dei Principia sarebbero simboli, si può anche addurre che, in quest'opera, si dice che una funzione proposizionale «concorda con le ordinarie funzioni della matematica nel fatto di contenere una variabile non assegnata; laddove essa differisce è nel fatto che i valori della funzione sono proposizioni».*Orbene, le «ordinarie funzioni della matematica» sono quelle che nei Principia sono dette funzioni descrittive, «perché descrivono un certo termine per mezzo della sua relazione con il loro argomento», e nei Principia si dice esplicitamente che queste funzioni sono simboli — anzi, simboli incompleti: «Le funzioni descrittive, come le descrizioni in generale, non hanno significato in se stesse, ma solo come costituenti
di proposizioni». Se è così, sembrerebbe che anche le funzioni proposizionali, come quelle del tipo “senx”, “2 + x, “l’attuale re di x’, ecc., siano simboli.
Ma, se le cose sono così chiare, perché la maggior parte degli interpreti ha ritenuto che i Principia facciano riferimento a funzioni proposizionali come entità intensionali? In realtà, nel testo sono presenti molte ambiguità. Per esempio, i termini “proprietà” (property) e “funzione proposizionale” sono usati in maniera intercambiabile; anzi, le proprietà sono definite come funzioni proposizionali: «[u]na “proprietà” di x si può definire come una funzione proposizionale soddisfatta da x». Se si suppone, com’è usuale, che una proprietà non sia un simbolo, ma sia ciò che è espresso da un predicato monadico, si deve concludere che le funzioni proposizionali non possano essere solo simboli, ma debbano essere (anche) la denotazione di questi simboli. Altro esempio: nell’introduzione dei Principia si legge: [...] useremo lettere come a, b, c, x, y, z, w, per denotare oggetti che non sono né proposizioni né funzioni. Chiameremo tali oggetti
individui. Tali oggetti saranno costituenti di proposizioni o funzioni, e saranno costituenti genuini, nel senso che essi non scompaiono nell’analisi te.
Se, come si dice in questo brano, gli individui possono essere costituenti delle funzioni proposizionali sembra che le funzioni proposizionali non possano essere solo dei simboli. In un altro passo dell’introduzione dei Principia leggiamo [...] due funzioni possono essere formalmente equivalenti senza essere identiche; per esempio x= Scott .=;.x= l’autore di Waverley ma la funzione “ 2 = l’autore di Waverley” ha la proprietà che Giorgio IV voleva sapere se il suo valore per l'argomento “Scott” era vero, mentre la funzione “ î = Scott” non ha tale proprietà, e quindi le due funzioni non sono identiche.”
Qui si stabilisce che due funzioni proposizionali possono non essere identiche anche se hanno la medesima estensione. Ma non sembra che ci si possa riferire a simboli: che i simboli “ 2 = l’autore di Waverley” e “2 = Scott” non siano identici è immediatamente evidente a prescindere da qualsiasi considerazione circa le curiosità di Gior-
Pertanto “ * è ferito” è la funzione proposizionale e “x è ferito” è un valore ambiguo di tale funzione. Di conseguenza sebbene sia possibile distinguere fra “x è ferito” e “y è ferito” quando compaiano nello stesso contesto, “ % è ferito” e “ $ è ferito” non comunicano alcuna distinzione di significato. In termini più generali, gx è un valore ambiguo della funzione proposizionale @ % , e quando si sostituisce a x una significazione definita a, ga è un valore non ambiguo di @ % ». La notazione con l’accento circonflesso su variabili di un enunciato aperto, per simboleggiare funzioni proposizionali, fu suggerita a Russell da Whitehead nell’aprile del 1904 (v. l'introduzione di A. Urquhart a Russell [1994a], $ III, p. xxiv).
2? Nei Principia, la parola “predicato” è usato, come vedremo, in un senso differente da quello oggi usuale. Nei Principles, Russell chiamava “predicati” gli attributi monadici (ma anche, talora, i simboli che li esprimono). 2 [PM], vol. I, introduzione, cap. 2. $ II, p. 38.
2° [PM], vol. I, +30, sommario, p. 232.
°° Ibid.
Ù Questa stessa ragione a favore dell’interpretazione delle funzioni proposizionali come espressioni linguistiche era già stata addotta nella nostra discussione dello statuto delle funzioni proposizionali nel contesto della teoria dei tipi sostenuta da Russell in “Mathematical lo-
gic...” (v. sopra, cap. 9, $ 2.2.2). 22 V., per es., [PM], vol. I, introduzione, cap. 2, $ VI, pp. 55-56.
33 [PM], vol. I, *12, p. 166. 3 [PM], vol. I, introduzione, CAP EZASAVANISIE
3 [PM], vol. I, introduzione, cap. 3, pp. 83-84.
706
capitolo 11
gio IV. L'argomento appare, invece, del tutto sensato se si suppone che con “funzione proposizionale”, si intenda qui un attributo, un’entità intensionale corrispondente a un predicato.
Ancora: nell’introduzione al secondo volume dei Principia, una funzione proposizionale sembra essere distinta dalla forma simbolica della funzione proposizionale:?° È conveniente chiamare la forma simbolica di una funzione proposizionale semplicemente “forma simbolica”. Così, se una forma simbolica contiene simboli di tipo ambiguo essa rappresenta [represents] diverse funzioni proposizionali secondo come sono diversamente stabiliti i tipi dei suoi simboli ambigui.”
Perché introdurre la nozione di ‘forma simbolica” di una funzione proposizionale, se le funzioni proposizionali fossero già null’altro che (concatenazioni di) simboli?
Si aggiunga, ancora, che, nei Principia, il tipo logico degli individui è sistemato in un’unica gerarchia con i tipi logici delle funzioni proposizionali.?’ Pare tuttavia strano che il tipo più basso sia rappresentato da entità, se quelli successivi sono tipi di simboli: la gerarchia dei Principia dovrebbe rappresentare una gerarchia di simboli, o una gerarchia di entità, o una gerarchia di entità rispecchiata in una gerarchia di simboli, ma come si può pensare che essa presenti una gerarchia costituita in parte di simboli e in parte di entità? Lo stesso uso, nei Principia, della parola oggetti, per riferirsi agli elementi della gerarchia dei tipi — siano essi individui o funzioni proposizionali — suggerisce che le funzioni proposizionali siano (anche) entità non linguistiche.'° Si richiami, a questo proposito, che, dopo la prima edizione dei Principia — per esempio in Theory of Knowledge —, Russell si serve spesso dell’idea, che dà per dimostrata (dove, se non nei Principia?), secondo cui gli universali (che indubbiamente, per Russell, sono entità) devono essere di un tipo logico diverso da quello degli individui e differente tra loro a seconda che siano monadici, diadici, ecc.
Tutto ciò conduce a riprendere in esame con maggiore attenzione quei passi dei Principia che inducono a pensare che le funzioni proposizionali siano simboli. In quei passi, abbiamo visto, si afferma che le funzioni proposizionali contengono variabili e che denotano ambiguamente i loro valori: non implica questo, al di là di ogni possibile dubbio che, almeno qualche volta, le funzioni proposizionali siano intese come simboli? Se si rammentano alcune delle tesi che Russell sosteneva all’epoca dei Principles, si comprenderà che la situazione non è così chiara. Prendiamo, prima di tutto, la questione del “denotare”. Oggi si assume che ciò che “denota” non possa che essere un simbolo; ma nel capitolo 6 abbiamo visto che, nel significato tecnico che Russell attribuisce a questo termine nei Principles, non sono le parole a denotare, bensì certi concetti, cioè certe entità intensionali: i concetti
denotanti.*' È possibile che, nei passi dei Principia in cui parla delle funzioni proposizionali come denotanti, Russell stia ancora usando la parola “denotare” in un senso simile a quello dei Principles? L’ipotesi può essere suggerita dalla somiglianza della tesi dei Principia secondo cui: (a)
«“@x” significa uno degli oggetti ga, bd, 9c, ecc., sebbene non uno definito, ma uno indeterminato»
con la tesi, sostenuta nei Principles, secondo la quale il concetto denotante qualsiasi a: (b)
«denota a; 0 4,0
... an, dove o significa che non ha importanza quale prendiamo».
È vero che in (a) “@x” è posto tra virgolette, suggerendo così che si parli di un simbolo (un enunciato aperto), ma bisogna tener conto del fatto che la spiegazione secondo cui sarebbe “@x” a denotare ambiguamente @a, gb, @c, ecc., è solo una spiegazione preliminare, precisata alla pagina successiva dei Principia, in un passo già riportato più sopra:
59 Questo è rilevato da Hylton ([1990b], p. 170, nota 35). 37 [PM], vol. II, “Prefatory statement of symbolic conventions”, p. xii.
°* Fornirò la mia interpretazione di questo brano alla fine del $ 4.5 del presente capitolo.
? V. [PM], vol. I, #12, p. 161. 40 V_, per es., [PM], vol. I, *12, p. 161: «La divisione degli oggetti [objects] in tipi è resa necessaria dalle fallacie del circolo vizioso che altrimenti sorgerebbero». 4! V. sopra, cap. 6, $ 4.
4 [PM], vol. I, introduzione, cap. 2, $ II p. 39. 43 Russell [1903a], $ 61, p. 59.
La teoria dei tipi dei Principia
707
E necessario, in pratica, distinguere la funzione stessa da un valore indeterminato della funzione. Possiamo considerare la funzione stessa come ciò che denota ambiguamente, mentre un valore indeterminato della funzione è ciò che è ambiguamente denotato. Se il
valore indeterminato è scritto “@x”, scriveremo la funzione stessa ‘“@ % ”. [...] La funzione stessa, @ % , è la cosa singola che denota ambiguamente i suoi molti valori; mentre @x, dove x non è specificato, è uno degli oggetti denotati, con l'ambiguità propria della maniera di denotare.
Si osservi l’uso delle virgolette in quest’ultimo passo: «Se il valore indeterminato è scritto “@x”, scriveremo la funzione stessa “@ *”». Qui ci si riferisce ai simboli, cioè a ciò che si deve scrivere usando le virgolette. È corretto non porre le virgolette intorno a “@x” in: «mentre @x, dove x non è specificato, è uno degli oggetti denotati, con l’ambiguità propria della maniera di denotare»; infatti, di gx si dice che è uno degli oggetti denotati, non che designa uno di questi oggetti. Ma, nella clausola che precede la frase appena citata, leggiamo: «La funzione stessa, QX, è ciò che denota ambiguamente i suoi molti valori»; sembra dunque che sia @ % (la funzione in senso ontologico) non “@ %” (il predicato) a denotare i diversi valori della funzione. Si può dunque essere indotti a supporre che le funzioni proposizionali dei Principia siano entità intensionali le quali denotano (nel senso tecnico dei Principles) “uno qualsiasi” dei loro valori. In effetti, questo era esattamente il modo in cui Russell intendeva le funzioni proposizionali nel 1904, quando introdusse per la prima volta (seguendo un suggerimento di Whitehead) la notazione con l’accento circonflesso su variabili di un enunciato aperto per simboleggiare funzioni proposizionali in opposizione ai loro valori. In un manoscritto dell’epoca, Russell spiegava infatti: Quando vogliamo parlare della funzione stessa, ossia del significato costante, scriviamo P 2 q -2.
p > q .2.
q invece dip>.q92.9.In
q, non abbiamo un termine indeterminato della denotazione, ma quel significato costante [concetto o complesso de-
notante] che denota i termini della denotazione. L’accento circonflesso ha lo stesso genere di effetto delle virgolette [adoperate, secondo uno degli usi di Russell fin dai Principles, per designare concetti denotanti]. Per es. diciamo Qualsiasi uomo è bipede; “Qualsiasi uomo” è un concetto denotante. La differenza trap > .q92.9€
P 2 q
3.
q corrisponde alla differenza fra qualsiasi uomo e “qualsiasi uomo”.
Se la concezione delle funzioni proposizionali dei Principia fosse questa, parlare di denotazione delle funzioni proposizionali e, nel contempo, intendere le funzioni proposizionali come entità intensionali non comporterebbe una confusione tra uso e menzione dei segni. Veniamo ora all'affermazione dei Principia secondo cui le funzioni proposizionali conterrebbero variabili. Oggi si pensa immediatamente: ciò che contiene una variabile — che è un simbolo — dev'essere un'entità linguistica. Tuttavia, sappiamo che, all’epoca dei Principles, Russell non concepiva le variabili (solo) come simboli, ma (anche) come entità significate da simboli: stando ai Principles, il simbolo “x indica un concetto denotante che, a
sua volta denota qualsiasi termine, o meglio, qualsiasi termine «per come entra in una funzione proposizionale».*° Si potrebbe dunque essere indotti a pensare che anche le variabili dei Principia non siano solo simboli e che, dunque, le funzioni proposizionali in senso ontologico possano contenere variabili. Richards ([1980]) è tra i sostenitori dell’interpretazione delle funzioni proposizionali dei Principia come entità intensionali. Di fronte all’obiezione che, nei Principia, si parla anche di funzioni proposizionali come espressioni,
egli replica che Russell usa la parola “espressione” (expression) per indicare entità intensionali: Russell ammetteva che entità non linguistiche possano “esprimere”, e quindi “espressione” si dovrebbe prendere semplicemente CISA È 4 come un modo di riferirsi a qualcosa che esprime.
Dicendo che Russell ammetteva che entità non linguistiche possano “esprimere”, Richards si riferisce certamente alla dottrina russelliana dei “concetti denotanti”, ma qui vi sono due problemi. In primo luogo, tale dottrina è rifiutata da Russell a partire da “On denoting”, e dunque è impossibile che nei testi successivi al 1905 egli faccia ancora riferimento alla semantica dei concetti denotanti dei Principles. C'è poi un’obiezione più specifica alla tesi
4 [PM], vol. I, introduzione, cap. 2, $ II, p. 40. 45 Russell [1904e], pp. 128-129. 4° Russell [1903a], $ 93, p. 94. Per maggiori spiegazioni su questo punto, v. sopra, cap. 6, $ 4.
4 Richards [1980], pp. 327-328.
capitolo 11
708
che Russell parli di “espressioni” nel senso indicato da Richards. In secondo luogo, anche nel periodo in cui Russell sostiene la teoria dei concetti denotanti, non usa mai “to express” nel senso indicato da Richards. I concetti
denotanti, secondo il linguaggio tecnico dei Principles non “esprimono” ma denotano. Nei Principles, “expression” e “to express” non hanno un significato tecnico particolare, anche se troviamo talora “expression” indubbiamente usato per indicare simboli, come in quest’esempio tratto dall’ appendice B del libro: IS “L’attuale re d’Inghilterra” è, secondo Frege, un nome proprio, e “Inghilterra” è un nome proprio che è parte di esso. Così qui possiamo considerare Inghilterra come l’argomento, e ‘l’attuale re di” come funzione. Siamo così condotti a “l’attuale re di x”.
Quest’espressione [expression] avrà sempre un significato [meaning], ma non avrà un’indicazione [indication] se non per quei va-
lori di x che attualmente sono monarchie. La precedente funzione non è proposizionale. Ma “Cesare conquistò la Gallia” conduce a “x conquistò la Gallia”; qui abbiamo una funzione proposizionale.**
Russell attribuisce però un significato tecnico al verbo “to express” in un manoscritto di poco successivo alla È S . -— Pi. GG . o 40 5 5 OL + a pubblicazione dei Principles: “On meaning and denotation”.' Secondo tale significato, sono solo i simboli a “esprimere”. La terminologia proposta da Russell in questo manoscritto si può riassumere come segue:
e
e e
e
Il rapporto che lega un nome proprio al suo oggetto o il rapporto tra un'espressione che esprime un concetto denotante e l’oggetto denotato da questo concetto è detto da Russell designazione (designation).”® Russell chiama significati (meanings) i concetti denotanti e le proposizioni, così come la designazione dei nomi propri. Alcuni significati (i concetti denotanti) sono espressi (expressed) da simboli complessi (phrases), e denotano delle entità (che sono ciò che i segni corrispondenti designano). Isignificati complessi (complex meanings) sono concetti denotanti costituiti dai riferimenti di diverse espressioni, o sono proposizioni. Per esempio, un uomo — cioè il riferimento di “un uomo” — sarebbe un significato semplice, mentre un presidente degli Stati Uniti — cioè il riferimento di ‘un presidente degli Stati Uniti” — sarebbe un significato complesso, che ha tra i suoi costituenti il concetto presidente e gli Stati Uniti (non, SI badi, un'idea, ma gli Stati Uniti veri e propri, completi di deserti e foreste, montagne e pianure, città e villaggi).
A parte la lieve differenza terminologica, la teoria della denotazione di “On meaning and denotation” non è differente da quella dei Principles: Ci sono espressioni [phrases] che hanno a che fare solo con la denotazione [denotation] [cioè, i nomi], altre che hanno a che fare solo con il significato [meaning] [cioè, gli enunciati], e altre ancora che hanno a che fare con entrambi [cioè, le espressioni per concetti denotanti]. Le espressioni che hanno a che fare con entrambi hanno una relazione differente con i due: la denotazione è ciò che essi designano [designate] [...], e il significato si può dire ciò che essi esprimono [express]. Ma sia il designare sia l’ esprimere han-
no a che fare con il linguaggio: la questione logicamente importante è la relazione tra ciò che è espresso e ciò che è designato. Perché quando un nome designa ed esprime, ciò non è arbitrario, ma si deve a una relazione tra gli oggetti designati ed espressi. Questa relazione è ciò che chiamerò denotare [denoting]. Così è il significato, non il nome, che denota la denotazione; e il denotare è un
fatto che riguarda la logica, non la teoria del linguaggio o del nominare. Le cose, quindi, stanno come segue: Un’espressione [phrase] come “l’attuale Primo Ministro d’Inghilterra” designa [designates] un’entità, in questo caso Mr. Arthur Balfour, mentre esprime [expresses] un significato, che è complesso, e non include, di regola,
l’entità designata come costituente; la relazione del significato espresso con l’entità designata è quella del denotare. Il significato si
48 Russell [1903a], $ 480, p. 506. 4 V. Russell [1903g]. 50 Nei Principles non esiste un termine tecnico corrispondente, anche se Russell sembra usare, a volte, il termine “denotare” (to denote) anche in questo senso. Per esempio, quando dice: «Gli oggetti denotati [denoted] per mezzo di [by] tutti [all], ogni [every], qualsiasi [any], un [a] e qualche [some] [...]» (Russell [1903a], $ 59, p. 56), sembra intendere che le parole “tutti”, “ogni”, “qualsiasi”, “un” e “qualche” sono usate per comporre espressioni attraverso le quali si può esprimere un concetto che, a sua volta, denota qualcosa (nel significato tecnico dei
Principles). Non parrebbe invece corretto interpretare l'affermazione di Russell come se egli intendesse dire che i concetti tutti, ogni, qualsiasi, un e qualche sono usati per comporre concetti denotanti che denotano qualcosa: infatti, secondo quanto si afferma nei Principles ($ 72, pp. 72-73), non esistono affatto concetti indicati dalle espressioni “tutti”, “ogni”, “qualsiasi”, “un” e “qualche”, prese in isolamento, ma solo concetti indicati da espressioni come “tutti gli a”, “ogni a”, “qualsiasi 4”, “un a” e “qualche a”, dove a è un concetto-classe. °! Scrive Russell: «Il significato [meaning] di una proposizione o di un'espressione non si deve supporre essere qualcosa di psicologico. Il significato è un oggetto per la mente che lo comprende [apprehend], e non è esso stesso la comprensione [apprehension]. Quando dico “Mr. Arthur Balfour è l’attuale Primo Ministro d’Inghilterra”, esprimo un significato complesso, di cui Mr. Arthur Balfour e l’Inghilterra sono parti; ma questi non sono parti di nessun pensiero. Non sono l’idea di Arthur Balfour e l’idea di Inghilterra a essere in questione; perché la prima non è un Primo Ministro, e la seconda non ha un Primo Ministro» (Russell [1903g], p. 316).
La teoria dei tipi dei Principia
709
può chiamare una descrizione [description] dell’entità, e l’espressione [phrase] si può chiamare un’espressione descrittiva [descriptive phrase].”
Il fatto sembra essere semplicemente che il denotare è indefinibile e fondamentale, che certi complessi [complexes] hanno la proprietà di denotare qualcosa di diverso da se stessi, e che, quando tali complessi sono costituenti di proposizioni, le proposizioni non vertono sui complessi [are not about the complexes], ma vertono su ciò che i complessi denotano.”
Illustriamo questo brano con un paio di esempi. Nell’enunciato “Barack Obama è un democratico” Russell avrebbe detto che il nome “Barack Obama” designa Barack Obama, che è ciò su cui verte la proposizione corrispondente all’enunciato: Barack Obama (l’uomo reale) è un costituente di tale proposizione. Nell’enunciato “Il presidente degli Stati Uniti nel 2015 è un democratico”, Russell avrebbe sostenuto che l’espressione descrittiva “Il presidente degli Stati Uniti nel 2015” designa sempre Barack Obama, ma lo fa esprimendo il significato complesso il presidente degli Stati Uniti nel 2015, il quale significato complesso denota Barack Obama; secondo quest'idea, Barack Obama non è un costituente della proposizione corrispondente all’ enunciato “Il presidente degli Stati Uniti nel 2015 è un democratico” — Barack Obama è solo ciò su cui la proposizione verte —, ma ne è un costituente il significato complesso i/ presidente degli Stati Uniti nel 2015, il quale significato complesso — si badi — secondo Russell contiene gli Stati Uniti come costituente. In definitiva: la proposizione Barack Obama è un democratico avrebbe Barack Obama tra i suoi costituenti e verterebbe su Barack Obama; la proposizione // presidente degli Stati Uniti nel 2015 è un democratico non avrebbe Barack Obama tra i suoi costituenti, ma gli Stati Uniti — sebbene essa non verta sugli Stati Uniti, ma sempre su Barack Obama. Lo scritto appena esaminato dimostra che, anche all’epoca dei Principles, Russell non pensava affatto alla denotazione come una forma di espressione, né ai concetti denotanti come espressioni: ciò che “esprime” — un’espressione — era vista anche in quell’epoca come un'entità linguistica. Né le cose cambiano in seguito. Per esempio, nella versione originale inglese di “Les paradoxes de la logique” (1906), leggiamo: Quindi per conciliare il campo illimitato della variabile con il principio del circolo vizioso, cosa che poteva sembrare impossibile a prima vista, dobbiamo costruire una teoria in cui ogni espressione [expression] che contiene una variabile apparente (ossia che contiene parole come tutti, ogni, qualche, il) si riveli come una semplice facon de parler |... To°
Non si può pensare che una “expression” che contiene parole come “tutti, “ogni”, ecc., e che costituisce semplice facon de parler, sia altro da un’espressione linguistica. (Si noti, anche qui, la trascuratezza di Russell tenere distinti i segni dalle loro denotazioni: il passo appena riportato, infatti, continua così: «[...] una cosa b non ha maggiore realtà indipendente di quella che appartiene a (per esempio) — 0 Î ». È evidente che ciò
una nel che che
a
Russell intende non è che la facon de parler sia priva di realtà, come di fatto dice, ma che è priva di realtà la supposta denotazione di tale facon de parler.) Nel cap. 9 ($ 2.2.1) abbiamo visto che in “Mathematical logic...” (1907) “expression” è usato esclusivamente per riferirsi a simboli. Anche nei Principia, sono i simboli a “esprimere”: A causa della pluralità di oggetti di un singolo sta è distinta dall’espressione [phrase] che la sprime [expresses] una proposizione è ciò che de qualche integrazione al fine di assumere un
giudizio, ne segue che ciò che chiamiamo una “proposizione” (nel senso in cui queesprime) non è affatto una singola entità. Vale a dire, l’espressione [phrase] che e-
chiamiamo un simbolo “incompleto”; [...] non ha significato in se stessa, ma richiesignificato completo.
A sostegno della sua tesi sul significato di “expression” e sullo statuto ontologico delle funzioni proposizionali nei Principia, Richards porta un esempio proveniente dall’articolo di Russell “On some difficulties in the theory of transfinite numbers and order types”,°° terminato il 2 novembre del 1905. In questo scritto, il concetto di “funzione proposizionale” è spiegato così:
°2 Russell [1903g], pp. 317-318. 93 Russell [1903g], p. 327. 5 Russell [1906d], $ ITI, p. 206. 9 [PM], vol. I, introduzione, cap. 2, $ III, p. 44. 5 V. Russell [1906a].
capitolo 11
710
Una funzione proposizionale di x è qualsiasi espressione [expression] @! x il cui valore, per ogni valore di x, è una proposizione; tale è “x è un uomo” oppure “senx = 1”. Analogamente scriviamo @! (x, y) per una funzione proposizionale di due variabili; e così via. SO DE E 6a . RAS useròN le parole norma [norm], proprietà [property], e funzione proposizionale come sinonimi. In questo scritto
Proprio come nei Principia, Russell dichiara qui di usare come sinonimi i termini “proprietà” e “funzione proposizionale”; al tempo stesso, asserisce che le funzioni proposizionali sono “espressioni”. Richards commenta: Russell dice che una funzione proposizionale è un’espressione [expression]. E siamo portati a concludere da ciò che con “espressione” Russell intenda realmente un’“entità linguistica”. Sembrerebbe dunque che Russell fosse indeciso riguardo alla natura delle funzioni proposizionali. Lasciando da parte il punto che nessuno ha mai accusato Russell di sostenere che una proprietà (che è sinonimo di funzione proposizionale) sia un’entità linguistica, che base abbiamo per assumere che “espressione” significhi “entità linguistica” per Russell? Russell ammetteva che entità non linguistiche possano “esprimere”, e quindi “espressione” si dovrebbe prendere semplicemente come un modo di riferirsi a qualcosa che esprime.”
Ma l’identificazione delle funzioni proposizionali con proprietà non può significare qui che Russell le concepisca come entità intensionali, per la semplice ragione che le teorie proposte in “On some difficulties...” consistono tutte nel negare che i simboli funzionali si riferiscano sempre a entità intensionali e, almeno una di esse, la “teoria
senza classi” — quella preferita da Russell —, afferma che questi simboli non si riferiscono mai a entità intensionali.” Russell identifica le funzioni proposizionali con proprietà solo perché assume come punto di partenza il punto di vista del senso comune preteorico, che vede in un simbolo funzionale un riferimento a una proprietà; ma egli nega che le proprietà siano, in generale, entità — una posizione per lui antica quanto i Principles. Lo stesso accade in “Sur la relation des mathématiques à la logistique” (1905), un articolo di Russell pubblicato originariamente in francese sulla Revue de Métaphysique et de Morale. Qui, dopo aver constatato che «[m]olte confusioni sono causate dai diversi sensi che si possono attribuire alla parola funzione», Russell si propone di fornire delle spiegazioni che possano «evitare fraintendimenti».° Egli scrive: L’indefinibile da cui parto è la nozione [...] di un’enunciazione [énonciation][°] che contiene una o più variabili, come “x è un
uomo”, “x è più grande di 2”, “x implica y”, e così via. Io rappresento con @! x tutte le enunciazioni che contengono x; similmente con @! (x, y) tutte le enunciazioni che contengono x e y; ecc. Tali enunciazioni sono delle funzioni proposizionali: si dicono semplici, doppie, triple, ecc., secondo il numero di variabili che contengono.
Russell identifica qui una “funzione proposizionale” con una “énonciation”; poco più avanti, però, egli afferma: «Quanto alle relazioni, una relazione in comprensione [compréhension]® è semplicemente una funzione proposizionale doppia @! (x, y)». Russell sembra dunque affermare che un’“énonciation” è un'entità intensionale. Sarebbe incredibile voler spiegare quest’uso di ‘“énonciation” secondo il suggerimento di Richards, soprattutto in un contesto in cui Russell afferma di voler essere chiaro. Poiché quest'articolo è dello stesso periodo di “On some difficulties...”?,°° la spiegazione dev'essere la stessa:°” le funzioni proposizionali sono, in primo luogo, notazioni, bA-14
57 Russell [1906a], $ I, pp. 136-137.
°* Richards [1980], pp. 327-328. VE sopra, cap. 8, $ 1.
90 V. Russell [1905e]. Il saggio consiste in una replica alle critiche mosse a Russell dal filosofo Pierre Boutroux in un articolo dal titolo “Correspondance mathématique et relation logique”, pubblicato nello stesso volume della Revue de Métaphysique et de Morale. Il manoscritto originale inglese non ci è pervenuto. La traduzione è di Couturat, ma riveduta e corretta dallo stesso Russell.
°! Russell [1905e], p. 623. °2 Si osservi che la scelta di “énonciation” in questo brano è di Russell: Couturat aveva inizialmente tradotto “jugement” (v. in Russell [2001a], p. 541: lettera di Russell a Couturat datata 23 ottobre 1905). La traduzione inglese che compare in Russell [1973] (pp. 260-271) e in Russell [1994a] (pp. 524-532) rende “énonciation” con “expression”.
93 Russell [1905e], pp. 623-624. % La traduzione inglese che compare in Russell [1973] e in Russell [1994a] reca “intension”.
5 Russell [1905e], p. 624. °° Il manoscritto inglese di “Sur la relation des mathématiques à la logistique” fu spedito a Couturat, perché lo traducesse in francese per la Revue de Métaphysique et de Morale, il 15 ottobre 1905 (v. la lettera di Russell a Couturat con la stessa data, in Russell [2001a], p. 536). Couturat inviò la traduzione a Russell il 21 ottobre (v. la lettera di Couturat a Russell con la stessa data, in Russell [2001a], p. 537). Il 23 ottobre ringraziò Couturat della traduzione «che è molto precisa» (très exacte) (in Russell [2001a], p. 541) aggiungendo una breve lista di
correzioni. ©? Si osservi che lettera di Russell a Couturat del 23 ottobre 1905 in cui Russell corregge alcuni punti della versione francese di “Sur la relation des mathématiques à la logistique” (v. nota precedente) è proprio quella in cui è tratteggiata per la prima volta (v. sopra, cap. 8, nota 67) la teoria sostituzionale russelliana, secondo la quale non esistono né classi, né funzioni proposizionali in senso ontologico non linguisti-
La teoria dei tipi dei Principia
711
notazioni che i/ senso comune interpreta come riferentisi a proprietà o relazioni in comprensione, cioè a funzioni proposizionali in senso ontologico; ma ciò non implica che Russell sottoscriva l’idea secondo cui vi sono, in realtà, funzioni proposizionali in senso non linguistico. Torniamo all’affermazione dei Principia secondo cui le funzioni proposizionali contengono variabili. Se le variabili sono (anche) entità intensionali, è evidente che anche le funzioni proposizionali devono esserlo; se, viceversa, le variabili sono solo simboli, anche le funzioni proposizionali non possono essere altro che simboli complessi. Che cosa sono le “variabili” dei Principia? Il testo fornisce, anche qui, indicazioni ambigue. Nel cap. 1 dell’introduzione si legge: [(1)] Nella logica matematica, qualsiasi simbolo il cui significato non è determinato è chiamato variabile, e le varie determinazioni di cui suo significato è suscettibile sono chiamati valori della variabile.
Qui non paiono esservi dubbi: le variabili sono simboli. Tuttavia, proprio nella pagina successiva, leggiamo: [(2)] Le variabili saranno denotate [denoted] da lettere singole, e così certe costanti; ma una lettera che è stata assegnata una volta a una costante da una definizione non deve successivamente essere usata per denotare una variabile. [...] Delle lettere rimanenti, p,
q, r saranno chiamate lettere proposizionali, e staranno per proposizioni variabili [...] f, g, @, V, XY, @ e (fino a #33) F saranno chiamate lettere funzionali e saranno usate per funzioni variabili.
Leggendo 1 Principia, già Frege si era mostrato perplesso, di fronte ai passaggi che qui abbiamo contrassegnato con “(1)” e “(2)”. In una lettera a Jourdain del 28 gennaio 1914 egli scrive: Mi è molto difficile leggere i Principia di Russell; mi blocco quasi a ogni frase. [...] Se una variabile è designata [bezeichnet ist] da una singola lettera, il significato [Bedeutung] di questa lettera è una variabile,
quindi un simbolo secondo Russell, e il significato di questo simbolo non è determinato. Abbiamo dunque un segno di un segno. Nello stesso modo le costanti sembrano dover essere simboli, tali però che il loro significato [Bedeutung] è determinato, e anche alcuni di questi simboli saranno designati [so/len bezeichnet werden] da singole lettere. Più avanti compare l’espressione “variable propositions”. Quindi si deve supporre che secondo Russell una proposition sia un simbolo. [...] La lettera “p” designerà [wird bezeichnen] di conseguenza un simbolo, perciò sarà segno di un segno. Compare anche l’espressione “variable functions”. Di conseguenza anche una funzione, almeno se essa è variabile, sarà un simbolo. Ma anche una funzione costante è verosimilmente un simbolo, tale però che il suo meaning è determinato. La lettera “/° è allora segno di un segno.”
Poiché sostenere contemporaneamente (1) e (2) porta a risultati che appaiono lontani dalle intenzioni di Russell, uno dei due passaggi dev'essere considerato inaccurato. Coerentemente con la sua interpretazione delle funzioni proposizionali, Richards ([1980], p. 330) sostiene le variabili dei Principia siano primariamente entità intensionali, prendendo per buona alla lettera (2) e sostenendo che (1) costituisca per Russell solo un’approssimazione preliminare a (2). Un’interpretazione del tutto diversa da quella di Richards è fornita da Landini ([1996a], pp. 294-295). Coerentemente con la sua opinione che le funzioni proposizionali dei Principia debbano essere intese come semplici espressioni linguistiche, Landini prende per buona la definizione (1) e ritiene che (2) sia espresso in un linguaggio trascurato. Secondo Landini, in (2) Russell dice che le variabili sono denotate da lettere singole intendendo dire che esse sono lettere singole. L’ipotesi di Landini era già stata avanzata da Frege, nella lettera a Jourdain sopra citata: Oppure ho frainteso le parole di Russell? Forse che l’ enunciato “Variables will be denoted by single letters” non vuol dire: le variabili saranno designate [sol/len bezeichnet werden] da singole lettere, ma: le variabili sono singole lettere? Allora sarebbe la singola lettera, per es. “x” stessa, il simbolo il cui significato non è determinato.”
Frege osserva che però, in questo caso, l’enunciato dei Principia «Let @x be a statement containing a variable x and such that it becomes a proposition when x is given any fixed determined meaning. Then gx is called a “pro-
CO.
® [PM], vol. I, introduzione, cap. 1, p.4.
© [PM], vol. I, introduzione, cap. 1, job SL 7 In Frege [1976], pp. 129-130. 7! In Frege [1976], p. 131.
TAR
capitolo11
positional function” [...]>," si sarebbe dovuto propriamente scrivere: «Let “x” be a statement containing a variable “x and such that it becomes a proposition when “x” is given any fixed determined meaning». Non bisogna,
tuttavia, fare troppo caso all’uso delle virgolette in Russell, perché egli è quasi sempre molto trascurato, in proposito.”* Ma, se l’interpretazione di Landini secondo cui le funzioni proposizionali non sono altro che simboli è corretta, sembra che sorgano dei problemi nell’interpretazione di un brano dei Principia già riportato sopra: [...] useremo lettere come a, b, c, x, y, z, w, per denotare oggetti che non sono né proposizioni né funzioni. Chiameremo tali oggetti individui. Tali oggetti saranno i costituenti di proposizioni o funzioni, e saranno costituenti genuini, nel senso che essi non scompaiono nell’analisi E
Russell qui parla di oggetti (objects) che sono denotati, e che sono costituenti di funzioni proposizionali: come possono, allora, le funzioni proposizionali essere solo delle entità linguistiche? Landini ([1996a]) non considera questo passo come problematico per la sua interpretazione ma, al contrario, lo vede come una conferma della tesi secondo cui Russell intenderebbe le funzioni proposizionali come simboli. Landini scrive: «Nei Principia non ci sono proposizioni in senso ontologico. Quindi come può, per es. a denotare una proposizione e come può un individuo (in quanto entità del mondo) essere un suo costituente?».”° Egli ne conclude che Russell usa qui il termine “propositions” (proposizioni) per riferirsi agli enunciati e il termine “individuals” (individui) per riferirsi non a individui in senso ontologico, ma a variabili individuali. Secondo Landini, qui «Russell is just sloppy».”” Quest’interpretazione è certamente possibile. È vero che Russell è sovente molto trascurato nel distinguere i simboli da ciò cui i simboli si riferiscono;'* è vero che il termine “proposition” è usato spesso, nei Principia, per riferirsi a enunciati;”” ed è vero, infine, che l’uso del termine “individuo”, da parte di Russell, anche per indicare
variabili individuali, si riscontra già in scritti del 1906,°° in “Mathematical logic...”,*' si trova nei Principia,*” ed è ancora presente nell’introduzione alla seconda edizione dei Principia,* è però possibile suggerire un’interpretazione un po’ diversa del passo riportato. Sappiamo che, all’inizio della redazione definitiva dei Principles, Russell pensava che ogni segno denotasse un'entità, ciò che lo portava a considerare inutilmente pedante distinguere tra entità linguistiche e i loro significati, e a usare promiscuamente uno stesso termine per indicare sia le une sia gli altri. Quest’ ambiguità investiva pressoché tutto il vocabolario tecnico russelliano: “variabile”, “denotare”, “aggettivo”, “nome”, “verbo”, “asserzione”, “termine”, “individuo”, ‘funzione proposizionale”, “proposizione”. Nello sviluppo successivo della filosofia russelliana, la corrispondenza uno-uno tra espressioni simboliche ed entità viene meno in molti casi, ma spesso Russell continua a usare intercambiabilmente un termine per significare sia simboli sia i loro significati, nei casi in cui esiste, e anche in quelli in cui si suppone esistere, per mera comodità argomentativa, un corrispondente ontologico del termine. Quest’uso è teorizzato in un articolo del 1911 in cui Russell scrive:
72 [PM], vol. I, introduzione, cap. 1, p. 14. 73 In Frege [1976], p. 131. 74 Per l’uso delle virgolette nei Principles, v. sopra, cap. 6, $ 7.3. Il tardo Russell (anni Quaranta dello scorso secolo) si sforza di essere più accurato nell’uso delle virgolette, ma non sempre con esiti inappuntabili (per alcuni esempi tratti da Russell [1940] si veda, sotto, la nota
238) iS [PM], vol. I, introduzione, cap. 2, $ V, p. 51.
7 Landini [19962], p. 294.
! Ibid.
“Sin proposito, v. sopra, cap. 6, $ 7, e cap. 9, $ 2.2; v. anche, sotto, cap. 13, $ 2.1.
7° Ma — come abbiamo già rilevato — il termine “proposizione” non è usato sempre, nei Principia, per riferirsi a enunciati; non lo è, per esempio, quando si dice che «una “proposizione” nel senso in cui una proposizione è supposta essere l'oggetto di un giudizio, è una falsa astrazione, perché un giudizio ha diversi oggetti, non uno» ([PM]], vol. I, introduzione, cap. 2, $ III, p. 44); o quando, poche righe più sotto,
si dice che «l’espressione [phrase] che esprime [expresses] una proposizione è ciò che chiamiamo un simbolo “incompleto”» (ibidem). S° In un manoscritto della fine del 1906, “Types”, Russell scrive, per esempio: «Un individuo è ciò che non può comparire a sinistra di un’esclamazione [shriek: con questo termine, Russell si riferisce al punto esclamativo “!’’ che compare dopo i simboli funzionali, come per es. in “@! x°]» (Russell [1906h], p. 498), e, più oltre: «Non abbiamo mai bisogno di sapere che una costante è un individuo, perché le costanti con cui trattiamo sono tutte di tipo più alto» (Russell [1906h], p. 498). 8! In proposito, v. sopra, cap. 9, $ 2.2.3. *° Dove si legge, per es., che “@!x”, considerata come «una funzione di due variabili, ossia @! 2 ex[...] contiene una variabile (ossia @! 2) che non è un individuo [...]» ([PM], vol. I, *12, p. 163). 83 Dove si legge, per es.: «Vogliamo ora considerare il caso in cui le variabili sono individui [...]» (Russell [1925], $ II, 1, p.xxi).
La teoria dei tipi dei Principia
713
La seconda distinzione logica di cui abbiamo bisogno [...] [sJi può esprimere come la distinzione tra verbi [verbs] e sostantivi [substantives), 0, più correttamente, tra gli oggetti denotati dai verbi e gli oggetti denotati dai sostantivi [...] (Poiché quest’espressione [expression] è lunga e impacciata, userò in generale l’espressione [phrase] più breve per significare la stessa cosa. Quindi, quando parlo di verbi, intendo gli oggetti denotati dai verbi, e similmente per i sostantivi).**
Poiché nei Principia Russell identifica le funzioni proposizionali sia con espressioni sia con proprietà, o oggetti, possiamo concluderne che egli chiama funzioni proposizionali sia certi simboli (enunciati aperti e predicati monadici o poliadici) sia le supposte denotazioni dei predicati. Parallelamente, Russell chiama “proposizioni” sia gli enunciati, sia le loro supposte denotazioni. Ma non c’è finora prova che Russell intenda queste supposte denotazioni come entità — anzi, nel caso delle proposizioni (in senso ontologico) sappiamo per certo che esse non sono considerate entità extralinguistiche. Il penultimo brano riportato si trova in un punto dei Principia che precede l'esposizione della teoria del giudizio come relazione multipla, secondo cui non esistono “proposizioni” in senso ontologico. Russell assume dunque, in via provvisoria, quello che, fin dai Principles, era stato per lui il punto di vista più spontaneo e naturale sulle proposizioni. Egli parla, per semplificare il discorso, come se esistessero proposizioni (e funzioni proposizionali) in senso ontologico: dire che gli individui sono costituenti delle proposizioni non sembra essere altro, per Russell, che un modo semplificato di dire che gli individui sono le reali entità in cui si risolvono quelle che sarebbero le proposizioni (in senso non linguistico), se gli enunciati non fossero, in realtà, simboli incompleti. Questo gli consente di evitare una faticosa perifrasi, che sarebbe anche inopportuna in un punto del testo in cui la teoria degli enunciati come simboli incompleti non è stata neppure accennata. Si noti che lo stesso uso della parola “proposizione”, da parte di Russell, si riscontra — per le stesse ragioni — anche in The Problems of Philosophy (1912). Anche qui — come nei Principia — Russell difende una forma di teoria del giudizio come relazione multipla, secondo cui non esistono proposizioni in senso ontologico; eppure, qualche capitolo prima di aver esposto la sua teoria secondo cui gli enunciati sarebbero simboli incompleti, parlando del contrasto tra conoscenza per familiarità (acquaintance)” e conoscenza per descrizione, egli enuncia il principio dell’acquaintance come se esistessero proposizioni in senso ontologico: «Ogni proposizione che possiamo comprendere dev’essere interamente composta di costituenti con i quali siamo in familiarità [we are acquainted]|»."° Qui non potremmo dire: “In The Problems of Philosophy non ci sono proposizioni in senso ontologico; quindi Russell, parlando di ‘proposizioni’ si sta riferendo a enunciati, e dice che ogni enunciato che possiamo comprendere dev'essere composto interamente di simboli che conosciamo per familiarità, e non per descrizione”. La teoria dell’acquaintance non è certo questa: essa era già formulata negli stessi termini in “On denoting” — in un'epoca, cioè, in cui Russell sosteneva l’esistenza di proposizioni come entità non linguistiche — e consiste nel sostenere che, per comprendere un enunciato, dobbiamo conoscere per acquaintance le entità di cui è costituito il corrispettivo ontologico dell’ enunciato: Un interessante risultato della precedente teoria del denotare [la teoria delle descrizioni definite] è questo: quando c’è una cosa qualsiasi con la quale non abbiamo familiarità immediata [immediate acquaintance], ma solo una definizione per mezzo d’espressioni denotanti [denoting phrases], allora le proposizioni in cui questa cosa è introdotta per mezzo di un’espressione denotante non contengono realmente questa cosa come costituente, ma contengono invece i costituenti espressi dalle diverse parole dell’espressione denotante. Così in ogni proposizione che possiamo comprendere [apprehend] (ossia non solo in quelle della cui verità o falsità possiamo giudicare, ma in tutte quelle alle quali possiamo pensare), tutti i costituenti sono realmente entità [enzities] con cui abbiamo familiarità immediata.*”
Se l’asserzione che gli individui possono essere i costituenti delle proposizioni non implica che, nei Principia, si sostenga l’esistenza di proposizioni in senso ontologico, per lo stesso motivo, l’asserzione che gli individui possono essere costituenti di funzioni proposizionali non implica che, nei Principia, si debba sostenere l’esistenza di
84 Russell [1912d], pp. 107-108. 85 Per la traduzione del russelliano “acquaintance”, v. sopra, cap. 7, nota 10. © Russell [1912a], cap. 5, p. 91; corsivo di Russell. La stessa caratterizzazione provvisoria del principio dell’acquaintance si trova in “Knowledge by acquaintance and knowledge by description” (v. Russell [1911e], p. 219) — saggio del quale, del resto, il cap. 5 di 7he Problems of Philosophy costituisce una modificazione. La motivazione è la stessa: Russell vi enuncia il principio dell’acquaintance prima di aver spiegato la sua teoria del giudizio come relazione multipla. Lo stesso principio è riformulato alla pagina successiva, dopo che Russell ha tratteggiato la sua nuova teoria del giudizio, in questi termini: «Ogni volta che è presente una relazione di supporre o giudicare, i termini con cui la mente giudicante è relata dalla relazione di supporre o giudicare devono essere termini con cui la mente in questione è in familiarità [is acquainted]» (Russell [191 1e], pp. 220-221; corsivo di Russell).
*” Russell [1905c], p. 56.
714
capitolo 11
funzioni proposizionali in senso extralinguistico. In effetti, come ora argomenteremo, nei Principia non esistono
funzioni proposizionali in senso ontologico non linguistico.
1.2.
FUNZIONI PROPOSIZIONALI, PROPOSIZIONI E UNIVERSALI
Nell’introduzione dei Principia si legge che una funzione proposizionale presuppone i suoi valori, e i suoi valori sono proposizioni. Tuttavia, secondo la teoria del giudizio esposta poche pagine dopo, le proposizioni (in senso ontologico) non esistono: gli enunciati sono in realtà simboli incompleti che, comparendo in un contesto appropriato, danno luogo a un’espressione che tutta intera si deve parafrasare in modo che in essa compaiano solo simboli per particolari, qualità (attributi monadici) e relazioni in intensione (attributi poliadici). Se si identificano le funzioni proposizionali con qualità e relazioni in intensione, sorge una grossa difficoltà. La difficoltà è che non si può sostenere, senza involgersi in un circolo vizioso, che una funzione proposizionale non sia definita finché non sono definite le proposizioni che ne costituiscono i valori, e contemporaneamente che le proposizioni sono solo entità fittizie, mentre le uniche entità reali sono i loro costituenti, vale a dire — identificando qualità e relazioni in
intensione con funzioni proposizionali (in senso ontologico) — individui e funzioni proposizionali (in senso ontologico). Secondo Landini ([1987], pp. 196-197), se non si vuol attribuire qui a Russell una palese inconsistenza, si deve concludere che per lui le funzioni proposizionali devono distinguersi dalle qualità e dalle relazioni: Sono solo le seconde che devono essere considerate come singole entità in quanto ‘l’universo consiste di oggetti che hanno varie qualità e che stanno in varie relazioni” — oggetti alcuni dei quali sono complessi (come ‘a-nella-relazione-R-con-b’) e consistono di parti interrelate come a e 6 che stanno nella relazione R (p. 43) [il riferimento è alla pagina del primo volume dei Principia]. È a queste qualità e relazioni che la mente può essere molteplicemente relata nel giudizio. Quindi, il giudizio “a è umano” sarebbe analizzato come: J{Mente, a, Umanità},
e qui nessuna funzione proposizionale è considerata come un costituente dei suoi valori.8*
E invece chiaro che, se s’interpreta il giudizio “a è umano” come J{Mente, a, % è umano},
la funzione % è umano dev'essere considerata come un costituente dei suoi valori. Ma questo è esplicitamente negato nei Principia: E abbastanza ovvio, in qualsiasi caso particolare, che un valore di una funzione non presuppone la funzione. Così per esempio la proposizione “Socrate è umano” può essere appresa alla perfezione senza considerarla come un valore della funzione “x è umano”. 89
Nino Cocchiarella ([1980], pp. 101-102) difende una posizione opposta a quella di Landini. Egli ritiene che le funzioni proposizionali dei Principia debbano identificarsi con gli universali e, coerentemente, ne ricava che le due posizioni espresse da Russell, circa la dipendenza delle funzioni dalle proposizioni e circa la dipendenza delle proposizioni da particolari e universali, siano in contraddizione. Per ripristinare la coerenza dei Principia, Cocchiarella propone di ignorare la prima tesi: secondo Cocchiarella, quando Russell dice che le funzioni proposizionali non possono essere determinate prima che lo siano i loro valori (le proposizioni), sta semplicemente riprendendo il suo punto di vista precedente, secondo cui le proposizioni sono singole entità di diversi ordini. Ma la posizione ufficiale dei Principia — secondo Cocchiarella — è, al contrario, che le funzioni proposizionali sono, insieme agli individui, le reali entità in cui le proposizioni si dissolvono nell’analisi, secondo la teoria del giudizio come relazione multipla. Con la sua tesi, Cocchiarella salvaguarda l’interpretazione dei giudizi generali e molecolari come relazioni multiple (v. sopra, cap. 10, $ 3). Tuttavia, l'evoluzione della teoria del giudizio come relazione
multipla dopo i Principia rende inverosimile che Russell possa aver mai pensato ai giudizi generali come reazioni multiple tra una mente e diverse funzioni proposizionali. Per esempio, non si comprende per quale motivo, in
#8 Landini [1987], p. 197. 3 [PM], vol. I, introduzione, cap. 2, $ II, p. 39.
La teoria dei tipi dei Principia
715
Theory of Knowledge, siano introdotte le forme se, per motivi indipendenti da quello dell’ordine dei costituenti di un giudizio, fossero già state disponibili, come possibili oggetti di giudizio, funzioni proposizionali in senso ontologico. Church ([1956], $ 58, nota 577, pp. 347-348, [1976], nota 4, p. 748, [1984], p. 513) segue una strada simile a
quella di Cocchiarella nell’espungere, alla ricerca di un’interpretazione coerente, una parte delle spiegazioni fornite nei Principia. Anche Church identifica le funzioni proposizionali dei Principia con attributi ma, all'opposto di Cocchiarella, egli ritiene che sia la teoria del giudizio come relazione multipla a dover essere espunta, in quanto aggiunta tardiva ai Principia, la cui logica richiede l’assunzione di proposizioni come entità denotate dagli enunciati. È tuttavia evidente che — a torto 0 a ragione — Russell non vedesse alcuna contraddizione tra la dottrina dei Principia e la teoria del giudizio come relazione multipla: egli continuò a lavorare per almeno cinque anni con questa teoria, assumendo anche la correttezza della dottrina dei tipi stabilita nei Principia — un’interpretazione storica non può semplicemente trascurare questo. La lettura proposta da Bernard Linsky ([1988]) ha il vantaggio — rispetto a quelle di Cocchiarella e di Church — di non richiedere emendamenti dei Principia: Linsky ritiene che Russell intendesse sostenere sia-la tesi secondo cui le funzioni proposizionali presuppongono le proposizioni, sia la tesi secondo cui le proposizioni sono, a loro volta, destinate a scomparire nell’analisi in termini di particolari e universali. Linsky concilia i due punti di vista sostenendo che Russell «aveva due sorte di entità intensionali nella sua ontologia»,”° da un lato funzioni proposizionali, dall’altro universali, cioè qualità e relazioni in intensione. Scrive Linsky: La mia proposta è che Russell volesse sostenere sia la teoria del giudizio come relazione multipla, sia la concezione che le funzioni proposizionali sono derivate dalle proposizioni. Russell deve aver avuto in mente qualcosa come ciò che segue. Le proposizioni sono “costruzioni logiche” nel senso che i simboli che apparentemente le designano sono in realtà simboli incompleti, proprio come sono incompleti le descrizioni definite e i nomi di classi. Parlare di proposizioni dev'essere infine analizzato in termini di espressioni che stanno per i particolari e gli universali che sono i veri oggetti del giudizio, gli stessi particolari e universali con cui dobbiamo essere in familiarità [be acquainted] se comprendiamo gli enunciati. Per esempio la comprensione dell’enunciato “Socrate è umano” richiede familiarità [acquaintance] con l’universale umanità (0 piuttosto con i costituenti dell’analisi di “umanità”) e con i costituenti dell’analisi di “Socrate”. (Poiché Socrate ci è noto solo per descrizione, anch'essi saranno verosimilmente
universali.)
Questi universali, e questi particolari, sono i costituenti ultimi della proposizione “Socrate è umano”. Le funzioni proposizionali, invece, sono a loro volta “costruzioni” di qualche sorta effettuate a partire dalle proposizioni. Una
funzione proposizionale è come un frammento di proposizione, ciò che rimane quando o uno o più argomenti sono rimossi. Noi potremmo esprimere una concezione del genere identificando una funzione proposizionale con una classe di proposizioni che differiscono l’una dall’altra solo in una certa posizione. Così “ * è umano” si potrebbe identificare con la classe consistente delle proposizioni “Socrate è umano”, “Platone è umano”, ecc. 0, invece, con la classe delle coppie ordinate di tali oggetti e delle proposizioni che li contengono, {{(Socrate, (Socrate, umanità)), (Aristotele, (Aristotele, umanità))...} (Si noti che l’argomento ricompare come costituente della proposizione che è il valore della funzione.) Naturalmente Russell non potrebbe usare queste costruzioni perché attraverso la teoria senza classi egli voleva ridurre tutto il parlare di classi al parlare di funzioni proposizionali. Russell di fatto non dice quale sorta di analisi darebbe delle funzioni proposizionali, e solo per le proposizioni suggerisce una spiegazione per un particolare contesto come “x giudica che aRb”.°!
Quest’interpretazione pone tuttavia un problema. Se nei Principia esistono funzioni proposizionali in senso ontologico, dobbiamo: o identificare, per es., la denotazione di ‘“% è umano” con l’universale umano — tornando così alla difficoltà, da cui siamo partiti, che le funzioni proposizionali siano costituenti dei loro valori —, oppure sostenere che la denotazione di “© è umano” sia un’entità intensionale differente da umano. Ma è davvero difficile vedere che cosa potrebbe distinguere queste due supposte entità intensionali. Gli stessi argomenti di Linsky sembrano piuttosto puntare in un’altra direzione, secondo cui non vi sarebbero affatto funzioni proposizionali in senso ontologico, nei Principia. Uno degli argomenti di Linsky è che sembra esservi una distinzione ovvia tra gli universali che sono richiesti come mattoni basilari nella teoria degli atteggiamenti proposizionali come relazioni multiple e le funzioni proposizionali.” Gli universali richiesti nella teoria degli atteggiamenti proposizionali come relazioni multiple sono termini ultimi in cui le proposizioni sono analizzate; essi sono quegli universali che dobbiamo conoscere, secondo Russell, per familiarità (by acquaintance), se siamo in grado di comprendere un enunciato. Ovviamente, le fun-
zioni proposizionali (in senso ontologico) non hanno sempre questa caratteristica. Per esempio, osserva Linsky, °0 B. Linsky [1988], p. 448. 2! B. Linsky [1988], p. 451. Le stesse tesi sono riproposte in B. Linsky [2002a], pp. 402-403.
°2 V_ B. Linsky [1988], p. 452.
716
capitolo 11
per render conto della nostra comprensione dell’enunciato “A è rosso o è blu” non vi è alcuna necessità di ammettere, accanto agli universali semplici rosso e blu un terzo universale designato dal simbolo “£ è rosso o £ è blu” — conoscere il significato di (cioè, secondo Russell, essere in una relazione di familiarità (acquaintance) con ciÒ
che è indicato dalle espressioni) “rosso” e “blu” è perfettamente sufficiente a farci comprendere cosa vuol dire giudicare che una cosa è rossa o blu. Il punto è che le funzioni proposizionali possono avere ogni grado possibile di complessità e, secondo Russell, non corrispondono sempre a universali. Russell lo dice esplicitamente in questo passo di un suo articolo del 1906: L’inconveniente delle relazioni in intensione, dal punto di vista della logica simbolica, è che non tutte le funzioni proposizionali di due variabili corrispondono a relazioni in intensione, proprio come non tutte le funzioni proposizionali di una variabile corrispondono a predicati [qui, “attributi monadici”]. Una proposizione come “Se Filippo non avesse preparato la strada, le conquiste di Alessandro sarebbero state impossibili” non può senza distorsioni essere messa in una forma che asserisce una relazione in intensione tra Filippo e Alessandro: ma essa dà origine a una matrice Ri
Alla fine dell’articolo del 1911 “On the relations of universals and particulars”, Russell riassume così la sua posizione ontologica: Abbiamo quindi una divisione di tutte le entità in due classi: (1) particolari, che entrano nei complessi solo come i soggetti dei predicati [“predicati” è uno dei termini già usato nei Principles per designare gli attributi monadici] o i termini delle relazioni [...]; (2)
universali, che possono comparire come predicati o relazioni nei complessi [...].°
Qui gli universali sono identificati con certi componenti di complessi. Questa posizione implica che se, per es., si ha un complesso come A-è simile a-B, vi sia un universale essere simile a, ma non implica affatto che vi sia un
ulteriore universale come % è simile a B. E, in realtà, l’esistenza di un tale universale appare esplicitamente negata in questo passo di “Knowledge by acquaintance and knowledge by description” (1910): Ci sono così almeno due sorte di oggetti di cui siamo consapevoli [aware], particolari e universali. Tra i particolari io includo tutti gli esistenti, e tutti i complessi di cui uno o più costituenti sono esistenti, come questo-prima-di-quello, questo-sopra-quello, lagiallezza-di-questo. Tra gli universali io includo tutti gli oggetti di cui nessun particolare è un costituente. Quindi la disgiunzione “universale-particolare” include tutti gli oggetti.”
È chiaro che, secondo questa spiegazione, £ è simile a B non può essere considerato un universale, perché avrebbe come costituente il particolare B. Questi testi, naturalmente, hanno qui un notevole interesse, perché riportano l’ontologia russelliana nel periodo dell’uscita della prima edizione dei Principia. Più tardi, in Theory of Knowledge, Russell mostrerà di non concepire neppure tutti i simboli di funzioni proposizionali semplici come corrispondenti a universali: infatti, i simboli corrispondenti a supposte relazioni non simmetriche e omogenee, come per esempio “precede”, o “segue”, sono considerati simboli incompleti cui non corrisponde nessun universale. Così, per esempio, Russell argomenta che “precede”, da solo, non denoti nulla — vale a dire, non stia per un universale —, mentre avrebbe un significato nel contesto di un giudizio della forma “A precede B”.°° Che i simboli di funzione proposizionale, nei Principia, non corrispondano sempre a universali non significa che essi non vi corrispondano mai. Interpretandoli nel contesto opportuno, troveremmo che (alcuni) simboli funzionali semplici — come, per esempio, ‘“% è mortale”, o “% è uguale a $” — corrispondono a universali — come mortalità o uguaglianza. Che in alcuni, ma non tutti, i casi i simboli di funzione proposizionale corrispondano a universali è una posizione che Russell sosteneva fin dai Principles. Mentre, infatti, nei Principles si nega che le cosiddette “asserzioni” (assertions) — cioè le supposte indicazioni (riferimenti) dei simboli funzionali in isolamento — siano in generale entità, si afferma che, nei casi più semplici, un simbolo di funzione proposizionale potrebbe essere considerato come indicante un’entità: In alcuni casi semplici, è ovvio che l’analisi [della proposizione] in soggetto e asserzione è legittima [corsivi miei]. In “Socrate è un uomo”, possiamo certamente distinguere Socrate e qualcosa che si asserisce di lui; potremmo ammettere senza esitazione che la
93 Russell [1906c], pp. 174-175. 24 Russell [1912d], pp. 123-124. °° Russell [1911e], pp. 213-214. FAL sopra, cap. 10, $ 2.
La teoria dei tipi dei Principia
FAO
stessa cosa si può dire di Platone o di Aristotele. Quindi possiamo considerare una classe di proposizioni contenenti l’asserzione, e questa sarà la classe di cui un membro[?”] tipico è rappresentato da “x è un uomo”.°*
La stessa tesi secondo cui, nei casi semplici, i simboli di funzione proposizionale potrebbero intendersi come denotanti universali è riaffermata da Russell anche dopo i Principles. Per esempio, in un passo del manoscritto del 1903 “On meaning and denotation”, Russell scrive: Se diciamo “x è un uomo”, c’è un’asserzione [statement] definita fatta a proposito di [abowr] x, che si può fare a proposito di qualsiasi entità; cosìsu “essere un uomo” può essere presa come la funzione. [...] Quest’analisi è inappuntabile [fau/tless] finché x compare una sola volta nel complesso; ma quando x è ripetuto, troviamo delle difficoltà.”
Tuttavia, sebbene i simboli di funzione proposizionale dei Principia corrispondano talora a universali, anche in questi casi essi non denotano universali. Proprio come, per esempio, la descrizione definita “il presidente degli Stati Uniti nel 2015” non denota, secondo Russell, Barack Obama —
sebbene corrisponda a Barack Obama, nel
senso che questi è l’unico individuo che la soddisfa. Solo così si spiega l’asserzione dei Principia secondo cui «la proposizione “Socrate è umano” può essere appresa alla perfezione senza considerarla come un valore della funzione “x è umano”».' Russell vuole sottolineare come la riduzione delle funzioni proposizionali alle proposizioni, insieme con la riduzione di queste ultime ai loro costituenti, non si chiuda in un circolo vizioso: non si chiude
in un circolo perché le funzioni proposizionali non sono tra le entità in cui le proposizioni si risolvono (particolari e universali) — non sono mai universali. Qui c’è però un’altra difficoltà interpretativa. Supponiamo che nei Principia valga:
(1)
Le funzioni proposizionali si distinguono dagli universali.
Nei Principia, gli individui sono definiti come quegli oggetti che non sono né proposizioni né funzioni proposizionali;"" se quindi si ammette (1), si deve concludere che gli universali sono individui. Ma gli individui sono, secondo i Principia, tutti dello stesso tipo logico: il tipo logico cui appartengono anche i particolari. Ne segue che gli universali devono essere dello stesso tipo dei particolari. Tuttavia, come abbiamo visto nel precedente capitolo, in Yheory of Knowledge (1913), Russell assume che: (2)
Gli universali sono di tipo logico diverso dai particolari e diverso tra loro a seconda che siano qualità, relazioni diadiche, triadiche, ecc.
Ciò non è argomentato, in Theory of Knowledge, ma si ricava da vari punti del testo. Per esempio: [...] il soggetto [in senso ontologico] e il predicato [in senso ontologico] differiscono logicamente, e non semplicemente come differiscono due particolari [. Aa
I soggetti [in senso ontologico] e i predicati [in senso ontologico] appartengono a divisioni logiche diverse, e non si può propriamente dire né che siano simili né che siano dissimili, perché questo darebbe loro “posizioni” simili in un unico complesso, mentre, se compaiono entrambi in un unico complesso, essi devono avere differenze di “posizione” corrispondenti al fatto che possono formare un complesso soggetto-predicato.'° Una data relazione duale è ancora una di una classe di entità più o meno simili, cioè delle relazioni duali; ma “relazione duale” in se stessa, benché possa sembrare un membro di una classei cui altri membri sarebbero la “relazione tripla”, ecc., in realtà, in un senso molto importante, è unica, e non un membro di nessuna classe contenente qualsiasi termine diverso dalla relazione duale stessa.
Qualsiasi nozione logica, in un senso molto importante, è o comporta [involves] un summum genus, e risulta da un processo di ge-
neralizzazione che è stato portato al limite estremo.
Lai
NCAI posto di “membro” (member) l'edizione di riferimento dei Principles reca “numero” (number).
93 Russell [1903a], $ 81, p. 84. °° Russell [1903g], p. 337. !00 [PM], vol. I, introduzione, cap. 2, $ II, p. 39. OLE, [PM], vol. I, introduzione, cap. 2, $ V, p. 51, e *9, p. 132.
!02 V. [PMI], vol. I, #9.131. 103 Russell [1913a], parte I, cap. 8, p. 90. 104 Russell [1913a], parte I, cap. 8, p. 92.
718
capitolo 11 Prendiamo, per esempio, la proposizione “Socrate precede Platone”. Questa ha la forma di un complesso duale: possiamo simbolizzare la forma naturalmente con “xRy”, laddove usiamo una diversa sorta di lettera per la relazione, perché la differenza tra la relazione e i suoi termini è una differenza logica. Quando siamo arrivati alla forma “xRy” abbiamo effettuato la massima generalizzazione che sia possibile partendo da “Socrate precede Platone”.!® RR
6
,
5
È
5
Gui
7
$
Ò
ò
D
5
+ 106
La familiarità [acquaintance] con gli universali dev'essere suddivisa secondo il carattere logico degli universali coinvolti.
L’espressione simbolica naturale per la forma di un dato complesso è l’espressione ottenuta rimpiazzando i nomi dei costituenti del complesso con lettere rappresentanti variabili, usando generi diversi di lettere per costituenti di generi logici diversi, o indicando la differenza di genere con parentesi o qualche metodo simile. Così possiamo indicare la forma generale di un complesso duale con “xRy” o con R (x, y); e possiamo indicare la forma generale di un complesso soggetto-predicato con &(x), in cui @ è il predicato e x = il soggetto,
o con x €
Ù 7 @ In cul
66-19?
E
î serve semplicemente,
come
7 art ne : 107 una parentesi, a indicare una posizione relativa.
L’apparente inconsistenza tra (1) e (2) sembra impedire di considerare vere, nel contesto dei Principia, entram-
be queste tesi. Possibile che Russell avesse cambiato idea, in proposito, tra la pubblicazione dei Principia e la redazione, nella primavera del 1913, di Theory of Knowledge? In letteratura, troviamo tesi diverse a questo proposito.
Cocchiarella ([1980], pp. 101-102, [1987b], pp. 200-202), come sappiamo, identifica le funzioni proposizionali dei Principia con gli universali. Negando che nella teoria dei Principia valga (1) e considerata la definizione di “individuo” dei Principia, Cocchiarella nega che gli universali siano parte degli individui dei Principia: per Cocchiarella, gli individui dei Principia — diversamente dagli individui dei Principles of Mathematics — sono solo i particolari (v. Cocchiarella [1987b], p. 203). Griffin ([1980], p. 173), assume che nei Principia, valga (1). Dalla definizione di “individuo” dei Principia, egli giunge quindi, coerentemente, alla conclusione che gli universali, nei Principia, sono considerati individui, e quindi sono dello stesso tipo dei particolari. Landini ([1998a], $ 10.6), seguito in ciò da Klement ([2004a], pp. 24-25), e da Stevens ([2005], cap. 3, pp. 8586) sostiene la medesima tesi: gli universali dei Principia sono individui, e sono quindi dello stesso tipo dei particolari. Landini, Klement, e Stevens ritengono che la dottrina delle variabili totalmente non ristrette dei Principles e delle teorie sostituzionali del 1906 sia conservata nei Principia, e concordano nell’interpretare le variabili funzionali e proposizionali dei Principia come variabili sostituzionali (v. sotto, $ 1.4). Landini ritiene che le variabili individuali dei Principia siano, al contrario, da interpretarsi come variabili oggettuali che variano sia su particolari, sia su universali. Klement ritiene invece, per omogeneità di trattamento, che anche le variabili individuali dei
Principia siano da interpretarsi come sostituzionali, sebbene ammetta che «le loro istanze sostituzionali — i “nomi logicamente propri” — sono sempre [a differenza delle istanze sostituzionali delle altre variabili] rappresentanti diretti di individui» (Klement [2004a], p. 28, nota). Secondo Landini (ibid.), Klement ([2004a], pp. 22-23; [2009], pp. 25-26) e Stevens ([2005], cap. 3, p. 63), il vantaggio che Russell vedeva nella teoria dei Principia rispetto a quella di “Mathematical logic...’ — e la ragione sostanziale dell’abbandono di quest’ultima, che secondo questi autori è una versione di teoria sostituzionale — consisteva proprio nel non dover assumere diversi tipi di entità. Bernard Linsky ([1988], pp. 456-457), sostiene invece che i Principia intendano affermare sia la tesi (1), secondo cui le funzioni proposizionali devono distinguersi dagli universali, sia la tesi (2), secondo cui gli universali sono di tipo diverso dagli individui. Riguardo alla definizione di “individuo” dei Principia: «Diremo che x è un “individuo” se x non è né una proposizione né una funzione»,' che appare escludere questa possibilità, Linsky scrive: La [definizione] pone una distinzione tra le entità denotate dai simboli del linguaggio dei Principia. Ma nei Principia nessun “simbolo in isolamento”, nessun termine, denota un universale, cosicché questa definizione semplicemente distingue espressioni ben ESAa n GC -99, formate come “@ x”, “p” e “a”. Il primo rappresenta una funzione proposizionale, il secondo una proposizione, e il terzo un individuo. Gli universali proprio non compaiono qui.!°
105 Russell [1913a], parte I, cap. 9, pp. 97-98. 106 Russell [1913a], parte I, cap. 9, p. 100. 107 Russell [1913a], parte II, cap. 1, p.113.
108 [PM], vol. I, #9, p. 132. 109 B. Linsky [1988], p. 457.
La teoria dei tipi dei Principia
119
Se ciò fosse corretto, nei Principia non esisterebbero variabili che possano prendere come valori degli universali. Quindi esisterebbero, nell’ontologia intesa dei Principia, delle entità di cui il linguaggio dei Principia non può parlare — un’idea difficoltosa. Di fatto, Theory of Knowledge è il primo testo in cui Russell sostiene la tesi secondo cui gli universali sarebbero di un tipo logico diverso dai particolari. Si potrebbe essere tentati di retrodatare la distinzione di tipo logico tra particolari e universali di Theory of Knowledge all’epoca dei Principia, osservando che, in articoli precedenti Theory of Knowledge, proprio nell’epoca della prima edizione dei Principia, Russell afferma che gli universali esistono, ma non nello stesso modo dei particolari. In “L’importance philosophique de la logistique” (1911), per esempio, Russell scrive: La logica e la matematica ci obbligano [...] ad ammettere un genere di realismo nel senso scolastico, vale a dire, ad ammettere che c’è un mondo di universali e di verità che non si appoggiano direttamente su tali e tali esistenze particolari. Questo mondo di universali deve sussistere [subsist], sebbene esso non possa esistere [exist] nello stesso senso in cui esistono i dati particolari. -
In “Le réalisme analytique” (sempre del 1911), leggiamo: Gli universali [...] non esistono nello stesso senso dei particolari; è meglio dire che essi sussistono [subsistent]. La loro sussistenza non dipende in nessun modo dalle menti che li conoscono; le scienze astratte hanno, dunque, come loro oggetto qualcosa di completamente indipendente da qualsiasi elemento mentale.!!!
Una posizione che non appare diversa da quella sostenuta due anni dopo in Theory of Knowledge, dove i particolari sono in effetti considerati di un “tipo” logico diverso dagli universali: Un predicato, inoltre, è affine a un universale scolastico, e sostenendo che ci siano predicati ci stiamo classificando con i realisti scolastici. Ma dicendo che “ci sono” predicati non stiamo dicendo necessariamente che essi hanno la stessa sorta di “realtà” che hanno i particolari. [...] Ciò che affermiamo è che ci sono complessi di cui i predicati sono costituenti, e che i predicati compaiono nell’inventario logico del mondo. Ma quando diciamo “ci sono” predicati, è precipitoso affermare che queste parole abbiano precisamente lo stesso significato di quando diciamo “ci sono” particolari.!!?
Ma, in questi brani, Russell non intende alludere a una differenza di tipo logico tra particolari e universali: egli si riferisce solo alla contrapposizione, già stabilita nei Principles, tra ciò che esiste nel tempo, e ciò che è, in maniera atemporale. Il seguente passo di 7he Problems of Philosophy (1912) chiarisce bene il punto: Riterremo conveniente parlare di cose esistenti [existing] solo quando esse siano nel tempo, vale a dire, quando possiamo indicare qualche tempo in cui esse esistano (senza escludere la possibilità che esse esistano in ogni tempo). Così pensieri e sensazioni [feelings], menti e oggetti fisici esistono [exist]. Ma gli universali non esistono in questo senso; diremo che essi sussistono [subsist] 0
hanno l’essere [have being], dove “essere” è opposto a “esistenza” in quanto essere senza tempo [time/ess]. Il mondo degli universali, pertanto, si può anche descrivere come il mondo dell’essere. Il mondo dell’essere è immutabile, rigido, esatto, la delizia del
matematico, del logico, del costruttore di sistemi metafisici, e di tutti quelli che amano la perfezione più della vita. Il mondo dell’esistenza è effimero, vago, senza confini netti, senza nessun disegno o assetto chiaro, ma contiene tutti i pensieri e sentimenti,
tutti i dati del senso, e tutti gli oggetti fisici, tutto ciò che può fare bene o male, tutto ciò che conta per il valore della vita e del mondo. Secondo i nostri temperamenti, preferiremo la contemplazione dell’uno o dell’altro. Quello che non preferiamo ci sembrerà probabilmente una pallida ombra di quello che preferiamo, e indegno di essere considerato in qualche senso reale. Ma la verità è che Caltambi hanno lo stesso diritto alla nostra attenzione imparziale, entrambi sono reali, ed entrambi sono importanti per il meta-
fisico. !!*
Fin dai Principles, Russell aveva sostenuto che i particolari differiscono dagli universali anche per il possibile ruolo logico nelle proposizioni (in senso ontologico): i primi possono svolgere solo il ruolo di soggetti logici; i secondi possono svolgere sia il ruolo di soggetti logici, sia quello di predicati. Poiché possono entrambi svolgere il ruolo di soggetti logici di proposizioni, nei Principles sia gli universali sia i particolari sono rubricati come individui, e nell’appendice B del libro, dove è esposto un primo tentativo di teoria dei tipi, da ciò si trae la conclusione che essi sono dello stesso tipo logico.'!* Gli universali sono considerati individui ancora nel contesto della teoria 1° Russell [1911c], p. 293. !!! Russell [1911b], p.410. 12 Russell [1913a], parte I, cap. 8, pp. 92-93.
!!3 Russell [1912a], cap. 9, p. 155-157. !!4 Nell’appendice B dei Principles, Russell scrive: «Un termine o individuo è qualsiasi oggetto che non sia un decorso di valori [range]. Questo è il tipo più basso di oggetti. [...] Sembrerebbe che tutti gli oggetti designati da singole parole, siano essi cose 0 concetti [corsivo
720
capitolo 11
sostituzionale,'! e nella teoria dei tipi di “Mathematical logic...”.'!° Russell non ha cambiato idea, sulla possibile duplice occorrenza degli universali, neppure nel periodo della pubblicazione della prima edizione dei Principia, già nel contesto della sua teoria del giudizio come relazione multipla. Il seguente passo di “Le réalisme analytique” (1911) non lascia spazio a dubbi: Si osserverà anche che in tutti i complessi ci sono due specie [espèces] di costituenti: ci sono dei termini e la relazione che li correla: oppure ci può essere (forse) un termine e il predicato che lo qualifica. Si deve sottolineare che i termini di un complesso possono
essere essi stessi relazioni [corsivo mio]: per esempio, nel giudizio che la priorità implica diversità. Ma ci sono alcuni termini che possono comparire solo come termini e non possono mai comparire come predicati o relazioni. Questi termini, li chiamo particola-
ri. Gli altri termini dei complessi, quelli che possono apparire come predicato o come relazione, li chiamo universali. Essi sono in effetti idee platoniche. Solo non si deve supporre che gli universali esistano [existent] nel medesimo senso dei particolari; è meglio dire che essi sussistono [subsistent].!!"
In Theory of Knowledge, per la prima volta universali e particolari vengono esplicitamente assegnati a categorie logiche diverse, ma ritengo che Russell non avesse cambiato idea in modo sostanziale, riguardo alla natura degli universali. Se si rileggono con attenzione i passi di Theory of Knowledge riportati sopra, vediamo che, in effetti, Russell non vi afferma che un universale che compare come predicato (in senso ontologico) in un complesso non possa comparire in un altro complesso come soggetto logico (in senso ontologico): egli rileva la differenza di ruolo logico tra i particolari e gli universali che compaiono come relazioni relazionanti in un complesso dato. Da questa differenza segue — secondo Russell — che la naturale espressione «per la forma di un dato complesso è l’espressione ottenuta rimpiazzando i nomi dei costituenti del complesso con lettere rappresentanti variabili, usando generi diversi di lettere per costituenti di generi logici diversi, o indicando la differenza di genere con parentesi o qualche metodo simile». Ciò implica che se, per es., in un giudizio (come relazione multipla) una mente è in relazione con alcuni oggetti e con la forma rappresentata da “xRy” (oppure, se si vuole, da ‘“(4x)(4y) (AR) ARy)), l’oggetto di giudizio che si intende correlato con la lettera “R” della rappresentazione simbolica della forma non
può essere un particolare, ma dev'essere un universale. In conclusione, in Theory of Knowledge, gli universali sono ancora individui: in effetti, nell’ultimo passo riportato Russell dice esplicitamente che anch'essi possono essere designati da nomi. Un mutamento sostanziale, da parte di Russell, avviene solo dopo Theory of Knowledge, allorché Russell fa propria la tesi di Wittgenstein che le parole che stanno per universali possano comparire in un enunciato solo in posizione predicativa, e mai come termini individuali. In “The philosophy of logical atomism” (1918), Russell scrive: [...] un predicato non può mai comparire [occur] se non come predicato. Quando sembra comparire come soggetto, l’espressione [phrase] dev'essere sviluppata e spiegata, a meno che, naturalmente, non parliate della parola stessa. [...] Quando comprendete “rosso” significa che comprendete proposizioni della forma “x è rosso”. [...] Esattamente lo stesso si applica alle relazioni, e di fatto a tutte quelle cose che non sono particolari. Prendete, per esempio “prima”, in “x è prima di y”: comprendete “prima” quando comprendete che cosa ciò significherebbe se fossero dati x e y. [...] Una relazione non può mai comparire se non come relazione,
mai come soggetto."
Il tipo logico degli individui comprende ora solo i particolari, e gli universali sono quindi di un tipo logico diverso da quello degli individui, e di tipo diverso tra loro a seconda del numero di posti di argomento dei predicati che li esprimono. Questo spiega passi come i seguenti, sempre da “The philosophy of logical atomism”: L’affermazione che un qualsiasi particolare non è un universale è affatto insensato — non falso, ma strettamente ed esattamente un nonsenso. Non potete mai porre un particolare nella sorta di posto in cui dovrebbe essere un universale, e viceversa. Se dico “a non è b”, 0 se dico “a è b”, questo implica che a e d siano dello stesso tipo logico.!!° [...] potete discendere in teoria, se non in pratica, a semplici basilari [ultimate simples], di cui il mondo è costituito [...]. I semplici,
come ho cercato di spiegare, sono di un numero infinito di sorte [sorts]. Ci sono particolari e qualità e relazioni di vari ordini, tutta
mio], siano di questo tipo» (Russell [1903a], $ 497, p. 522). “Range” — che rappresenta, nei Principles, la traduzione russelliana del frege-
ano “Werthverlauf? — è il vocabolo con cui, nell’appendice B dei Principles, si indica una qualsiasi classe o relazione in estensione. Va
sopra, cap. 8, $ 4.1.2.
!!° V. sopra, cap. 9, nota 58.
!!” Russell [1911b], p. 412. 1!8 Russell [1918-19], $ III, pp. 205-206. 11° Russell [1918-19], $ VII, p. 258.
La teoria dei tipi dei Principia
721
una gerarchia di diverse sorte di semplici, ma tutte, se siamo nel giusto, hanno nei loro vari modi qualche genere di realtà che non appartiene a nient’altro.'?° /
È
.
2
Questa posizione non sarà mai abbandonata da Russell. All'epoca della seconda edizione dei Principia (1925), per es., Russell colloca i particolari — o individui (i termini “particolare” e “individuo” sono trattati come sinonimi, nell’introduzione alla seconda edizione dei Principia) — in un tipo logico diverso dagli universali, i quali, a loro volta, sono collocati in tipi logici diversi a seconda del loro numero di argomenti, cosicché un simbolo per un particolare non può mai sostituire significativamente, in un enunciato, un simbolo per un universale, e il simbolo per un universale n-adico “R,’” può significativamente sostituire in un enunciato il simbolo per un universale madico “R,,” se e solo se n= m."! In An Inquiry into Meaning and Truth (1940) — un libro in cui l’ultimo Russell sostiene ancora un’interpretazione nominalista di proposizioni" e funzioni proposizionali, e un’ontologia di particolari e relazioni (monadiche e poliadiche) in intensione molto simili a quelle dei Principia'? — i simboli di relazione (monadica o poliadica) sono di un tipo logico diverso da quelli per i particolari, e di tipi diversi tra loro. Questo perché — sostiene Russell — le condizioni di significanza di un enunciato di percezione (un enunciato atomico, dunque, ossia privo di variabili e di connettivi) richiedono che un nome possa essere sostituito solo da un altro nome, e che un simbolo di relazione possa essere sostituito solo da un altro simbolo di relazione che abbia lo stesso numero di posti d’argomento."?* È importante non identificare i tipi logici in cui sono ripartite le entità nelle opere successive a Theory of Knowledge con i tipi che costituiscono la gerarchia dei Principia. Si tratta di cose affatto distinte. La gerarchia dei Principia — sosterrò — è una gerarchia di simboli, cui in generale non corrispondono singole entità. C'è un solo tipo di entità, nella prima edizione dei Principia: il tipo degli individui, comprendente universali e particolari. I tipi di entità delle opere successive a Theory of Knowledge sono una partizione degli individui della prima edizione dei Principia, che non conduce affatto a una gerarchia di ordini e tipi simile a quella dei Principia, ma semplicemente distingue tra generi di entità a seconda del ruolo logico delle parole che le designano negli enunciati atomici." Si osservi, in proposito, che la gerarchia di “ordini” cui fa riferimento nell’ultimo passo riportato da “The philosophy of logical atomism” non è nulla di simile alla gerarchia degli ordini delle funzioni proposizionali dei Principia, ma è semplicemente una gerarchia di relazioni secondo il loro numero di argomenti: per es., una relazione diadica è considerata del second’ordine, una triadica è considerata del terzo ordine, ecc. 160
Concludiamo quindi concordando con Griffin, Landini, Klement e Stevens che gli universali, all’epoca della prima edizione dei Principia, erano concepiti da Russell come individui, allo stesso modo che nei Principles, e quindi come entità dello stesso tipo logico dei particolari.
1.3. LE
FUNZIONI PROPOSIZIONALI COME SIMBOLI
Riprendiamo il brano dei Principia già riportato nel $ 1.1: [...] due funzioni possono essere formalmente equivalenti senza essere identiche; per esempio x= Scott .=,.x=l’autore di Waverley ma la funzione “ 2 = l’autore di Waver/ey” ha la proprietà che Giorgio IV voleva sapere se il suo valore per l’argomento “Scott” era vero, mentre la funzione “ 2 = Scott” non ha tale proprietà, e quindi le due funzioni non sono identiche. '?”
120 Russell [1918-19], $ VIII, p. 270. 121 V. Russell [1925], $ II, 1, p. xix. V. anche Russell [1924a], pp. 332-334. PianNell’ /Inquiry, Russell riconosce l’esistenza di proposizioni in senso non linguistico, ma queste sono caratterizzate in modo psicologico, come immagini mentali e disposizioni al comportamento. Naturalmente, queste immagini e disposizioni non costituiscono, per Russell, l’indicazione degli enunciati (che egli assume essere costituita da fazti, se gli enunciati sono veri, e da nulla, se sono falsi) ma solo ciò che essi esprimono (soggettivamente). Le proposizioni, intese come ciò che gli enunciati esprimono, non sono assunte, nell’/ngquiry, come valori di variabili proposizionali vincolate. Ra
sotto, $ 1.4.
124 v, per es., Russell [1940], cap. 13, C, p. 195. '25 [ andini sostiene questa stessa posizione in Landini [2007a], cap. 2, p. 53, e pp. 57-58, e Landini [201 1a], cap. 5, pp. 260-261. 126 Scrive Russell, nello stesso saggio: «[...] potete ottenere una riduzione formale delle (poniamo) relazioni monadiche a diadiche, o diadiche a triadiche, o di tutte le relazioni sotto un certo ordine [order: corsivo mio] a relazioni sopra quell’ordine, ma la riduzione inversa non è
possibile» (Russell [1918-19], $ II, p. 206). Si osservi ancora che, nell’introduzione alla seconda edizione dei Principia, Russell non chiama “ordine” di una relazione il suo numero di argomenti. 127 [PM], vol. I, introduzione, cap. 3, pp. 83-84.
TRE
capitolo 11
Questo passo ci aveva fatto supporre che Russell non stesse parlando di simboli, perché, per vedere che i simboli “$ = l’autore di Waverley” e “ î = Scott” non sono identici è certamente superfluo ricorrere a un ragionamento sulle curiosità di Giorgio IV. Come si spiega questo in un’interpretazione, come la nostra, che fa delle funzioni proposizionali solo dei simboli? Per rispondere, si deve osservare che, quando Russell usa il termine “proposizione” (proposition) per designare entità linguistiche, non lo usa, di solito, come sinonimo di “enunciato” (sentence).
Egli ritiene, infatti, che tutti gli enunciati sinonimi di un certo enunciato contino come /a stessa proposizione. Per esempio, nell’introduzione di An Inquiry into Meaning and Truth, Russell dice: «Possiamo, almeno per il momento, definire una “proposizione” come “tutti gli enunciati [sentences] che hanno lo stesso significato di qualche e-
nunciato dato”».'°* Così, le proposizioni in senso linguistico, sono per Russell enunciati, con l’avvertenza, però, che una medesima proposizione è in genere rappresentata da enunciati differenti. Poiché le funzioni proposizionali sono parti di proposizioni, è chiaro che due espressioni predicative diverse potranno contare come la stessa funzione proposizionale, a condizione che siano sinonime. Se teniamo conto di ciò, vediamo che, per stabilire che due funzioni proposizionali, come entità simboliche, non sono identiche, non basta confrontare la successione dei
simboli che le compongono. Per esempio, “
= a” e “(@)(9!
225 p! a) sono la stessa funzione, secondo la defi-
nizione di identità dei Principia, eppure sono costituite di simboli diversi; 0, per tornare all’esempio iniziale, “2 =
l’autore di Waverley” e “î = colui che scrisse Waverley” sarebbero probabilmente considerate da Russell come la stessa funzione, pur essendo graficamente diverse. L’esempio saliente dell’ambiguità dei Principia è tuttavia nell’uso intercambiabile dei termini “proprietà” (property) e “funzione proposizionale’” monadica; anzi, le proprietà sono definite come funzioni proposizionali monadiche: «Una “proprietà” di x si può definire come una funzione proposizionale soddisfatta da x». Questo come si spiega? Avevamo letto il brano in cui Richards osservava che «nessuno ha mai accusato Russell di sostenere che una proprietà (che è sinonimo di funzione proposizionale) sia un’entità linguistica»,' desumendone che le funzioni proposizionali russelliane sono entità intensionali.'' Primariamente, certo, una proprietà è un’entità non linguistica. Ma, contrariamente a quanto suppone Richards, Russell usava questo termine anche per riferirsi a entità linguistiche.'* La prova che voglio portare è in un brano di My Philosophical Development. Russell sta parlando del linguaggio logico, che — egli spiega — aveva inteso come un linguaggio in cui si possa dire «tutto ciò che potremmo voler dire» e in cui, inoltre, «la struttura sia sempre resa esplicita». «In tale linguaggio», continua Russell, «avremmo bisogno di parole che esprimano la struttura, ma avremmo anche bisogno di parole che denotino i termini che hanno la struttura. Questi ultimi termini, così sostenevo, sarebbero denotati dai nomi propri». '5 Questo il contesto. Ora veniamo al brano in cui si trova “proprietà” usato per designare entità linguistiche: Tradizionalmente, c'erano due sorte di nomi: nomi propri e nomi comuni. “Socrate” era un nome proprio; “uomo” era un nome comune. I nomi comuni, comunque, non sono necessari. L’asserzione [statement] “Socrate è un uomo” ha lo stesso significato di
“Socrate è umano”, cosicché il nome comune “uomo” non è necessario e può essere rimpiazzato dal predicato “umano”. È necessario distinguere tra un predicato e una proprietà. L'ultimo è un concetto più ampio che include il primo. Un predicato sarà qualcosa che può comparire in una proposizione che non contiene nient’altro tranne un nome — per es. “Socrate è un uomo”. Una proprietà sarà ciò che rimane di qualsiasi proposizione in cui compare un nome quando quel nome è omesso o rimpiazzato da una variabile. Potete dire, per esempio, ‘“Se Socrate fosse stato più conciliante, non avrebbe dovuto bere la cicuta”. Ciò si può considerare come asserente una proprietà di Socrate, ma non in quanto gli assegna un predicato.'*
Alcune righe più avanti, Russell suggerisce una definizione sintattica di “nome proprio”; egli scrive: 128 Russell [1940], introduzione, pra
129 [PM], vol. I, *12, p. 166. 150 Richards [1980], p. 327. 15! Più recentemente, anche William Demopoulos ([2007], p. 163, nota) legge come «asserzioni esplicite» che le funzioni proposizionali non sono espressioni linguistiche i passi di “Mathematical logic...” e dei Principia in cui “funzione proposizionale” e “proprietà” sono trattati come sinonimi.
152 La cosa non è poi così strana: lo stesso uso ambiguo si trova in “The logicist foundations of mathematics” (1931) di Carnap. Sebbene Carnap qui si riferisca spesso alle proprietà come ciò che è definito dai predicati (in senso linguistico), talora chiama proprietà i predicati stessi. Verso la fine dell’articolo, per esempio, Carnap scrive: «Come gli intuizionisti, noi [logicisti] riconosciamo come proprietà solo quelle espressioni (più precisamente, espressioni della forma di un enunciato contenenti una variabile libera) che sono costruite in un numero finito di passi da proprietà primitive indefinite [...]» (Carnap [1931a], $ IV, p. 52).
153 Russell [1959], cap. 14, p. 165. 134 Russell [1959], cap. 14, p. 166.
La teoria dei tipi dei Principia
fi
Possiamo dire che un nome proprio è una parola che non denota un predicato o una relazione, la quale può comparire in una proposizione che non contiene variabili.'*°
Si osservi che Russell non parla affatto di proprietà, come possibili oggetti denotati diversi dai riferimenti dei nomi propri, ma solo di predicati e relazioni. Se le proprietà fossero anche entità non linguistiche — come Russell evidentemente suppone qui essere i predicati e le relazioni — la definizione di “nome proprio” appena riportata avrebbe l’effetto di includere le proprietà (in senso ontologico non linguistico) tra le denotazioni dei nomi propri — cosa che certamente non è qui nelle intenzioni di Russell. In altri termini, le “proprietà” sono qui solo simboli. Del resto è evidente — anche se Russell qui non lo dice — che una “proprietà”, definita come sopra, non è altro che una “funzione proposizionale”: Ciò che la logica richiede sono le funzioni proposizionali — cioè espressioni [expressions] in cui c’è una o più variabili e che sono tali che, quando si assegnano valori alle variabili, il risultato è una proposizione. '?°
E le funzioni proposizionali, in My Philosophical Development, sono solo simboli: [...] una funzione proposizionale non è altro che un’espressione [is nothing but an expression]. Da sola, non rappresenta alcunché [It does not, by itself, represent anything). Ma può formare parte di un enunciato [sentence] che dice qualcosa, di vero o di falso: “x era un Apostolo” non dice nulla, ma “ci sono dodici valori di x per cui ‘x era un Apostolo” è vero” è un enunciato completo." Ci sono quindi tre cose che si possono fare con una funzione proposizionale: la prima è sostituire una costante, al posto della variabile; la seconda è asserire tutti i valori della funzione; e la terza è asserire qualche valore o almeno un valore. La funzione proposizionale stessa è solo un’espressione [is only an expression]. Non asserisce né nega nulla. Una classe, nello stesso modo, è solo un'espressione. '88
L’ultima frase citata ci permette un'osservazione più generale, riguardo al linguaggio russelliano. Accade spesso che Russell identifichi una supposta entità con il simbolo che si suppone esprimerla, proprio per indicare che essa non esiste (o non si assume esistere: in questo contesto non è importante distinguere la franca negazione dall’agnosticismo). Il caso delle classi è emblematico. Dopo il 1905, quando abbandona un’ontologia di classi, è frequente che Russell si esprima come se identificasse le classi con dei simboli.'!’ Per esempio, in “On the substitutional theory of classes and relations” (1906) — dove Russell espone la sua teoria sostituzionale — si legge che «[I]e matrici non sono nient'altro che abbreviazioni verbali o simboliche»,!4 ma anche che «le relazioni identificate con le ma-
trici duali sono (approssimativamente) relazioni in estensione»,"! e che «[l]a matrice 9/p, a) è detta classe di classi se [...]»;4 sembra dunque che classi e relazioni in estensione siano identificate con simboli. In una lettera del 2 novembre 1905, in cui Russell dice per la prima volta a Jourdain che sta lavorando sulla sua
teoria sostituzionale, leggiamo: «Credo di poter ora affrontare in modo soddisfacente tutte le varie contraddizioni; lo faccio negando assolutamente [who//y] che vi siano cose come classi e relazioni, che tratto nello stesso modo in cui ho trattato le espressioni denotanti nel Mind corrente [...] [Russell si riferisce, naturalmente, al fascicolo di
Mind in cui fu pubblicato il suo articolo “On denoting”]».!* Qui Russell dice di trattare le classi nello stesso modo in cui ha trattato delle espressioni. Un passo di “Les paradoxes de la logique”, del 1906, è particolarmente indicativo:
135 Russell [1959], cap. 14, p. 167.
50 Ibid.
!37 Russell [1959], cap. 6, p. 69.
138 Russell [1959], cap. 7, p. 82. 139 Questo è stato osservato già all’inizio degli anni 30 del Novecento da Susan Stebbing, la quale scrive: «Mr. Russell è caduto nell’errore di dire che una classe è un simbolo» (Stebbing [1930], prima ediz., cap. 9, $ 2, p. 149). V. anche Stebbing [1930], seconda ediz. (1933), CApio N99 pal9S:
140 Russell [1906c], p. 177. 14! Russell [1906c], p. 174. 142 Russell [1906c], p. 176.
143 In Grattan-Guinness [1977], p. 56.
724
capitolo 11 Nei paradossi riguardanti le classi, sfuggiamo dal circolo vizioso per il fatto che le classi ora non sono singole entità, ma matrici, che sono composte di due entità, p e 4, e sono solo parti di espressioni significanti, senza essere esse stesse significanti in isolamen144
to.
Russell qui afferma che le classi sono matrici — cioè simboli — e che queste matrici sono composte di due entità, e non sono significanti in isolamento, ma solo come parti di espressioni significanti. Ma ciò che egli intende sostenere è molto più sensato: le classi non sono entità; i simboli di classe non denotano singole entità, ma sono ma-
trici, cioè simboli in cui figurano i nomi di due entità, p e a, e che non hanno un significato in isolamento, ma solo come parti di espressioni significanti. Ancora alcuni esempi. Nei Principia si legge che «un’estensione (che è lo stesso di una classe), è un simbolo
incompleto»,! e che «[I]e relazioni in estensione, come le classi, sono simboli incompleti».'*° In “The philosophy of logical atomism” (1918), Russell scrive: «Ci sono moltissime altre sorte di simboli incompleti oltre alle descrizioni. Queste sono classi, di cui parlerò la prossima volta, e relazioni prese in estensione, e così via. Tali raggruppamenti di simboli sono in realtà la stessa cosa di ciò che io chiamo “finzioni logiche” [.. .]}>.!” Più avanti, nello stesso saggio, si legge: «[...] le classi, come verrò a mostrare, sono simboli incompleti nello stesso senso in cui lo sono le descrizioni [...]».! Nell’ Introduction to Mathematical Philosophy (1919), Russell prospetta la tesi secondo cui i simboli di classe sono simboli incompleti — cioè, secondo la quale non esistono classi, in senso ontologico — in questo modo: Potremo allora dire che i simboli per le classi sono semplici convenienze, che non rappresentano oggetti chiamati “classi” e che le .
6
fata
o
nata
A
a
ALA
classi sono di fatto, come le descrizioni, finzioni logiche, o (come diciamo noi)
da
+3> 149
“simboli incompleti”.
Ciò che Russell intende dire è chiaro: non che le classi siano simboli, e che questi simboli siano ‘finzioni logiche”, ma semplicemente che le classi non esistono (0 non si suppongono esistere). Più analiticamente, egli intende dire che gli enunciati in cui compaiono simboli di classe devono essere analizzati in modo tale che, nelle loro analisi, non rimanga infine nessun simbolo che si supponga denotare una classe. A essere finzioni logiche, per Russell, non sono affatto i simboli di classe, ma le classi stesse. Anche nel caso delle proposizioni, Russell tende a esprimersi in modo analogo. Si prenda il seguente passo di Theory of Knowledge (1913): «E questo a sua volta, poiché ripugna ammettere la realtà di proposizioni false, ci costringe a cercare una teoria che consideri le proposizioni vere e false come ugualmente irreali [unrea]], ossia come simboli incompleti».' Nell’introduzione dei Principia, ciò che Russell intende è spiegato dapprima in modo inappuntabile: A causa della pluralità di oggetti di un singolo giudizio, ne segue che ciò che chiamiamo una “proposizione” (nel senso in cui questa è distinta dall’espressione [phrase] che la esprime [expresses]) non è affatto una singola entità. Vale a dire, l’espressione [phrase] che esprime [expresses] una proposizione è ciò che chiamiamo un simbolo “incompleto” [...].!}!
Ma solo otto righe più sotto, leggiamo: «Il fatto che le proposizioni siano “simboli incompleti” è filosoficamente importante [...]». Se questo non suona strano come nel caso delle classi è solo perché “proposizione” ha un duplice uso, in Russell: talora indica un’entità linguistica, talora il suo significato. Infine, in “The philosophy of logical atomism” (1918), Russell si esprime in modo simile proprio riguardo alle funzioni proposizionali. Egli le definisce come segue: Una funzione proposizionale è semplicemente [simply] qualsiasi espressione [any expression) contenente un costituente indeterminato, o diversi costituenti indeterminati, e che diviene una proposizione non appena si determinano i costituenti indeterminati. Se
dico “x è un uomo” o “x è un numero”, questa è una funzione proposizionale; tale è qualsiasi formula dell’algebra, come (x + y) (x —
144 Russell [1906d], $ III, p. 210. e” [PM], vol. I, introduzione, cap. 3, p. 72.
14° [PM], vol. I, introduzione, cap. 3, p.81.
147 148 14° 150 !5!
Russell [1918-19], $ VI, p. 253. Russell [1918-19], $ VII, p. 262. Russell [1919a], cap. 17, p. 182. Russell [1913a], parte II, cap. 1, p. 109. [PM], vol. I, introduzione, cap. 2, $ III, p. 44.
La teoria dei tipi dei Principia
TEO
29060 ; E: x 0 Pale ; 5 Y) = x° — y°. Una funzione proposizionale non è nulla [a propositional function is nothing], ma, come la maggior parte delle cose di cui si vuol parlare in logica, non perde la sua importanza per questo. °°
Poche pagine dopo, Russell ribadisce: «Come si diceva un momento fa, una funzione proposizionale in sé non è nulla [in itself is nothing]: è meramente uno schema [it is merely a schema)."* È chiaro che, dicendo che una funzione proposizionale non è nulla, perché è solo uno schema, Russell non intende dire che uno schema, una successione di simboli, non sia nulla, ma che non corrisponde a nessun’ entità.
L’identificazione delle proprietà con funzioni proposizionali, nei Principia, non implica che queste ultime siano entità intensionali, ma, al contrario, che le prime —
identificate con dei simboli —
non sono affatto entità.
Semplicemente, gli enunciati in cui compaiono simboli di funzione proposizionale dovrebbero essere analizzati in modo tale che tali simboli infine scompaiano, per lasciare il posto a simboli che si riferiscono esclusivamente a entità genuine: particolari e universali. In breve: le funzioni proposizionali dei Principia sono, nel linguaggio russelliano, simboli incompleti. Nei Principia si dice che una funzione proposizionale «differisce da una proposizione solamente [solely] per il fatto che è ambigua: contiene una variabile il cui valore non è assegnato»; se le proposizioni dei Principia sono simboli incompleti,
è immediato concludere che anche ciò che differisce da una pro-
posizione solamente per il fatto che è ambigua — una funzione proposizionale — dev'essere a sua volta, a fortiori, un simbolo incompleto. L’affermazione secondo cui, nei Principia, le “proprietà”, in generale, non sono nulla, al di là dei simboli corrispondenti, non significa che secondo i Principia non vi siano attributi, in quanto entità intensionali non linguistiche: gli attributi, per Russell, esistono (0 meglio, sussistono); ma, come ha rilevato Bernard Linsky ([1988], pp.
453-454), Russell non li chiama generalmente proprietà (properties): li chiama qualità (0 predicati, per es., nei Principles e in Theory of Knowledge), se monadici, o relazioni in intensione, se poliadici. Scrive Russell: L’universo consiste di oggetti che hanno varie qualità e che stanno in diverse relazioni. '°°
Il mondo esistente consiste di molte cose con molte qualità e relazioni. Una descrizione completa del mondo esistente richiederebbe non solo un catalogo delle cose, ma anche una menzione di tutte le loro qualità e relazioni. Dovremmo conoscere non solo questa, quella, o quell’altra cosa, ma anche quale sia rossa, quale gialla, qualche sia prima di quale, quale sia tra altre due, e così via.!5° Di fatto, se qualcuno volesse negare del tutto che vi siano cose come gli universali, riconosceremmo che non possiamo strettamente dimostrare che esistono cose come le qualità, ossia gli universali rappresentati da aggettivi e sostantivi, mentre possiamo dimostrare che ci devono essere relazioni, ossia la sorta di universali generalmente rappresentati da verbi e preposizioni.”
Russell si serve del termine “qualità” per designare le proprietà semplici, come rosso, rotondo, ecc. “Proprietà” è un termine che Russell usa in modo generico, per designare sia le proprietà semplici, sia le (supposte) proprietà complesse. Quando c’è una contrapposizione tra “proprietà” e “qualità”, il primo termine è adoperato per designare le proprietà complesse. Questa terminologia, si badi, non è peculiare di Russell, ma era quella standard (perlomeno) nei testi filosofici dei primi decenni del Novecento. Ne è una testimonianza un passaggio da uno scritto di Ramsey del 1922:'* «[...] salvo che la proprietà [property] non debba essere semplice o ciò che si chiama ordinariamente [corsivo mio] una qualità [quality]» (p. 5). ”° In questo scritto, Ramsey sostiene che nell’arredo ontologico del mondo vi siano, oltre agli individui, solo qualità e relazioni in intensione, non proprietà complesse. Ma la cosa più interessante, dal nostro punto di vista, è che egli informa che le sue idee in proposito derivano da conversazioni con Russell, esprimendo il dubbio che non ci avrebbe mai pensato da solo.'°” Anche nell’articolo “Universals”, del 1925, Ramsey ripropone la stessa tesi,'°" distinguendo tra “qualità” e “proprietà”, laddove «solo una proprietà semplice è una qualità»,'°° e riassumendo così la posizione di Russell:
!52 Russell [1918-19], $ V, p. 230; corsivi di Russell. 153 Russell [1918-19], $ V, p. 234; corsivo mio. !54 [PM], vol. I, introduzione, cap. 2, $ II, p. 38. !55 [PM], vol. I, introduzione, cap. 2, $ III, p. 43.
5° Russell [1914a], lecture II, p. 60 (1° ediz., p. 51). !57 Russell [1912a], cap. 9, p. 149; corsivi di Russell. V. anche Russell [1912a], cap. 8, p. 139, cap. 9, pp. 147, 151, cap. 10, pp. 158, 171. 158 Questo scritto di nove pagine, non pubblicato, è datato 29 aprile 1922, e reca il testo di una relazione letta alla “Società degli Apostoli” del Trinity College di Cambridge. Ne offre un resoconto dettagliato Koslow [2005].
5° Riportato in Koslow [2005], p. 97. 160 V. in Koslow [2005], p. 90. !6! [argomento usato in “Universals” per negare che esistano proprietà complesse è il seguente: «Per rendere le cose più chiare prendiamo un caso più semplice, una proposizione della forma “aRb”; allora questa teoria [cioè, la teoria
726
capitolo 11
Secondo Mr. Russell la classe degli universali è la somma della classe dei predicati e della classe delle relazioni [...]. [...] Secondo lui i termini [terms] sono divisi in individui o particolari, qualità e relazioni, qualità e relazioni essendo raggruppate insieme come universali; e qualche volta le qualità sono anche incluse tra le relazioni come relazioni a un termine distinte dalle relazioni a due, tre o molti termini.!93
Si trova un riscontro puntuale a queste affermazioni di Ramsey nel passo finale dell’articolo di Russell del 1911 “On the relations of universals and particulars” che abbiamo già riportato nel precedente paragrafo. Nei Principia, qualità e relazioni in intensione sono realmente entità, sono gli universali che, insieme con i particolari, costituiscono l’arredo ontologico del mondo;'** ma le proprietà, nei Principia — come già accadeva in ‘““On some difficulties in the theory of transfinite numbers and order types” (1905)!° e in “Mathematical logic...” (1907)! —, non S’identificano con qualità o relazioni in intensione — non sono, in genere, assunte come univer-
sali. Dal punto di vista filosofico, dunque, le “proprietà” — le funzioni proposizionali in quanto supposte denotazioni dei predicati — nei Principia sono generalmente non-entità, proprio come le classi e le proposizioni. Ma se le funzioni proposizionali sono solo simboli, come si spiega che, nei Principia, si parli talora delle funzioni proposizionali come di “oggetti” (objects)? La risposta è che il termine “oggetto” è usato nei Principia anche in riferimento alle proposizioni" e alle classi,'°* ma sappiamo per certo che non vi sono né proposizioni, in senso ontologico non linguistico, né classi, nei Principia. Dunque “oggetto” non è, nei Principia, una parola avente implicazioni ontologiche.
1.4. LA QUANTIFICAZIONE
In Human Knowledge (1948), Russell identifica le funzioni proposizionali con simboli: Una forma di parole [form of words] contenente una variabile indeterminata — per esempio, “x è un uomo” — è detta “funzione proposizionale” se, quando si assegna un valore alla variabile, la forma di parole diviene una proposizione. Così “x è un uomo” non è né vero né falso, ma se al posto di “x metto “Mr. Jones” ottengo una proposizione vera, e se ci metto “Mrs. Jones” ne ottengo una falsa. 169
Dieci anni dopo, in My Philosophical Development, Russell identifica esplicitamente con simboli le funzioni proposizionali dei Principia: Whitehead e io p pensammo una funzione proposizionale come un’espressione [expression] contenente una variabile indeterminata e p P che diviene un enunciato [sentence] ordinario appena si assegna un valore alla variabile: “x è umano”, per esempio, diviene un enunciato ordinario appena sostituiamo un nome proprio a ‘“x?.!?°
che afferma l’esistenza di proprietà complesse] sosterrà che ci siano tre proposizioni strettamente correlate; una asserisce che la relazione R sussiste tra i termini a e b, la seconda asserisce il possesso da parte di a della proprietà complessa di “avere R con b”, mentre la terza asserisce che b ha la proprietà complessa che a ha R con esso. Queste devono essere tre proposizioni diverse perché esse hanno insiemi diversi di costituenti, e tuttavia esse non sono tre proposizioni, ma una proposizione, perché dicono tutte la stessa cosa, cioè che a ha R con db. Quindi la teoria degli universali complessi è responsabile di una trinità incomprensibile, tanto senza senso quanto quella della teologia» (Ramsey [1925b], pp. 405-406; Ramsey [1931], p. 118).
L'argomento non è cogente per chi non chi non condivida la tacita presupposizione atomistica che una proposizione si possa scomporre in parti ultime in un unico modo; ma è interessante notare che si tratta di una presupposizione che Russell avrebbe condiviso e che, inoltre, l’argomento è replicabile nel contesto della teoria russelliana del giudizio come relazione multipla, ragionando su complessi, invece che su proposizioni.
162 163 !©4 165
Ramsey [1925b], p. 411; Ramsey [1931], p. 125. Ramsey [1925b], p. 402; Ramsey [1931], p. 113. V_ [PM], vol. I, introduzione, cap. 2, $ III, p. 43. V_ sopra, cap. 8, $ 1.
100VE sopra, cap. 9. 9 Per esempio, quando gli autori scrivono: «“@x” significa uno degli oggetti pa, gb, pc, ecc., sebbene non uno definito, ma uno indeterminato» ([PM], vol. I, introduzione, cap. 2, $ II, p. 39), o quando gli individui sono descritti come «oggetti che non sono né proposizioni né funzioni» ([PM], vol. I, introduzione, cap. 2, $ V, p. 51).
°8 Per esempio, nei Principia si legge che «una classe è un oggetto derivato da una funzione» ([PM], vol. I, introduzione, cap. 2, $ VII
DO 62-63). 10° Russell [1948a], parte VI, cap. 4, B, p. 468 (ediz. americana, p. 450).
170 Russell [1959], cap. 10, p. 124. Voglio dire una parola sull’enunciato che segue immediatamente il brano riportato, perché, a una lettura frettolosa, può sembrare che esso smentisca la nostra interpretazione. Russell continua così: «In questa concezione delle funzioni proposi-
La teoria dei tipi dei Principia
727
Quine ammette che le funzioni proposizionali dei Principia siano entità linguistiche ma, come già accennato, ritiene che esse debbano essere anche entità intensionali: L'espressione “funzione proposizionale” è usata ambiguamente nei Principia Mathematica; talvolta significa un enunciato aperto e talvolta significa un attributo.!”! L’esposizione propria di Russell [nei Principia] semplicemente offuscava la distinzione tra l’espressione astrattiva (o anche l’enunciato aperto) e la funzione proposizionale (o attributo o relazione) [...].'??
La ragione che egli adduce è teorica, piuttosto che testuale, e si può riassumere così: l’uso di una variabile (quan-
tificabile) richiede l’esistenza di entità che ne costituiscano i valori; nel linguaggio dei Principia ci sono variabili di funzione proposizionale che possono entrare nei quantificatori; dunque, il sistema dei Principia richiede l’assunzione di funzioni proposizionali in senso ontologico (almeno, di quelle funzioni proposizionali che Russell chiama ‘“predicative” che, come vedremo, sono le uniche su cui è ammessa la quantificazione).'?
Quine suggerisce che Whitehead e Russell non si fossero resi conto dell’assunzione ontologica implicita nel permettere ai simboli di funzione proposizionale di entrare nei quantificatori: Ponendo “@” “w?, ecc. nei quantificatori Whitehead e Russell saltano dalla teoria della quantificazione a una teoria degli attributi — una teoria implicante in aggiunta alla quantificazione la nozione di attribuzione. Ma questa nuova nozione non è mai esplicitamente riconosciuta. Le distinzioni rilevanti sono offuscate dall’uso dell’espressione “funzione proposizionale” per riferirsi indiscriminatamente sia alle espressioni del genere che ho chiamato matrici [cioè, enunciati aperti] sia agli oggetti del genere che ho chiamato attributi.'?* Si osservi che la definizione contestuale dei nomi di classe di Russell [...] non elimina le entità astratte, ma elimina solamente le cosiddette classi in favore di proprietà. Questo punto è offuscato dall’ambiguità dell’espressione “funzione proposizionale”, che talora significa “proprietà” e talora “matrice di asserzioni” [statement matrix].'”®°
Appare tuttavia implausibile che Russell non si rendesse conto delle implicazioni ontologiche della quantificazione oggettuale. Douglas P. Lackey ([1974]) ha messo in luce come, in un manoscritto del 1906 intitolato “The
paradox of the liar”, Russell avesse già esplicitamente anticipato il celebre criterio quineano d’impegno ontologiL
o
c
È
È
co: “Essere è essere il valore di una variabile”.
176
3
È
">
‘’ Nel manoscritto citato Russell scrive:
[...] ciò che può essere una v[ariabile] a[pparente] deve avere qualche genere d’essere [corsivo mio]. Ora noi, inoltre, siamo perve-
nuti alla conclusione che le funzioni devono essere v[arianbili] a[pparenti]. Quindi qualsiasi essere sia implicato nell’essere una v[ariabile] a[pparente] deve appartenere alle funzioni."””
zionali, esse sono costituite per mezzo di intensioni [are constituted by intensions] eccetto che per quanto riguarda la variabile o le variabili» (ibid.). Orbene, poiché Russell sta qui parlando di funzioni proposizionali come simboli — simboli che contengono variabili —, se egli avesse avuto intenzione di dire che questi simboli denotano intensioni, è chiaro che avrebbe dovuto scrivere: “esse sono costituite da parole che denotano intensioni”. Suggerisco dunque che qui Russell stia qui usando “intensioni”’ con il medesimo significato che, come abbiamo già osservato sopra ($ 1.3), egli attribuisce in altri passi dello stesso libro al termine “proprietà”: cioè per denotare simboli. Trovo conferma di quest’uso in un altro brano dello stesso libro, laddove Russell obietta contro la teoria di Wittgenstein che nega significato alla nozione di identità: «C'è un’altra conseguenza [di questa teoria di Wittgenstein], cioè, che non possiamo costruire [manufacture] un’intensione che debba essere comune e peculiare a un dato insieme di oggetti enumerati. Supponiamo, per esempio, di avere tre oggetti, a, b, c, allora la
proprietà di essere identico ad a o identico a d o identico a c è comune e peculiare a questi tre oggetti. Ma, nel sistema di Wittgenstein, queBEL] sto metodo non è disponibile» (Russell [1959], cap. 10, p. 116). Qui “intensione” è usato come sinonimo di “proprietà”, ma che questa proprietà — che possiamo simboleggiare con “% =av % =bv Xx =’ — non sia un universale, di per sé sussistente, appare confermato dal fatto che Russell parli di “costruirla”.
17! Quine [1953b], $ 5, p. 122. !72 Quine [1969a], $ 34, p. 245. 173 V., per esempio, Quine [1953b], $ 5, pp. 114-115, e Quine [1969a] $ 34, pp. 243-244 e passim.
174 Quine [1941],p. 145. 175 Quine [1940], [1951a], $ 22, p. 121, nota. 176 Questo punto è già accennato da Lackey nella sua introduzione alla parte IV di Russell [1972], “Classes and the paradoxes”, pp. 133134. 177 Russell [1906g], p. 367. Il passo è riportato (dal ms., f. 106) in Lackey [1974], p. 30. In un altro punto dello stesso manoscritto, Russell
osserva che se non vi sono proposizioni in senso ontologico «una proposizione variabile è inammissibile», perché «la variazione può essere solo applicata a entità; quindi [se non vi sono proposizioni] la variazione di proposizioni è impossibile» (Russell [1906g], p. 325; il passo è riportato (dal ms., f. 16) in Stevens [2005], cap. 3, p. 62).
728
capitolo 11
Il punto è chiarissimo. Russell afferma che ciò su cui si quantifica deve avere qualche sorta di essere. Poiché — sulla base dell’argomentazione condotta nel manoscritto (che non è rilevante riportare qui) — si giunge alla conclusione che la quantificazione sulle funzioni è indispensabile, Russell inferisce che le funzioni proposizionali devono avere qualche sorta di essere. Questa non è una posizione occasionale, in Russell. Nei Principles, per esempio, la prima soluzione (in ordine
di tempo) fornita per il paradosso di Russell consiste nel negare la possibilità di variabili che varino su funzioni proposizionali, e la base di questa dottrina è la tesi, sostenuta nel cap. 7 dei Principles, secondo cui le asserzioni (assertions) o parti funzionali delle funzioni proposizionali non sono “entità separabili” — cioè, non sono entità affatto. In seguito, sempre nei Principles, Russell non sostiene più l’illegittimità di variabili funzionali, ma sostiene sempre che, per ammettere tali variabili, è indispensabile trovare delle effettive entità che costituiscano i loro valori. Per esempio, nel cap. 10 dei Principles Russell scrive: La dottrina del Capitolo VII, che @ non è un’entità separabile, potrebbe far sembrare illegittima una tale variabile; ma quest’obiezione si può superare sostituendo a @ la classe di proposizioni @x, o la relazione di gx a ve
Nell’appendice A dei Principles, Russell è anche più esplicito: Nella notazione @(x), il @ è essenzialmente variabile; se desideriamo che non sia tale, dobbiamo prendere qualche particolare pro-
posizione riguardo a x, come “x è una classe” o “x implica x”. Così @(x) contiene due variabili. Ma, se abbiamo deciso che @ non è un'entità separabile, non possiamo considerare @ stesso come la seconda variabile. Sarà necessario prendere come nostra variabile o la relazione di x con @(x), 0 la classe di proposizioni @(y) per differenti y ma per @ costante. Ciò non è importante dal punto di vista formale, ma è importante per la logica essere chiari quanto al significato di ciò che appare come la variazione di Poeti
La tesi di Russell qui è chiara: noi potremmo esprimerla dicendo che, se “@” non è una lettera schematica che rappresenta qualche particolare enunciato intorno a x, essa è una variabile vincolabile; diviene quindi necessario avere delle entità che possano costituirne il dominio di variazione. Che le variabili funzionali non siano possibili senza entità su cui variare è sostenuto da Russell anche in altri scritti posteriori ai Principles. Il già citato manoscritto del 1903 “On meaning and denotation” è interessante perché mostra quanto fosse importante, per Russell, trovare delle entità che corrispondessero alle variabili funzionali. Soffermiamoci un po’ su di esso. Il punto di vista qui sostenuto sulla variabile è identico a quello dei Principles: La variabile indipendente significa “qualsiasi cosa” [anything] e denota qualsiasi cosa, ossia denota ciò che denota “qualsiasi cosa”. Ora il punto degno di nota a proposito di “qualsiasi cosa” è che, sebbene qualsiasi cosa sia inclusa nella sua denotazione, tuttavia esso, per così dire, denota ciascuna cosa separatamente, e così la sua denotazione è una singola cosa, sebbene una cosa perfettamenMRO te arbitraria.
Russell si serve qui delle virgolette per indicare un concetto denotante. Egli intende che simbolo come “x” significa il concetto denotante qualsiasi cosa; questo concetto denotante denota, a sua volta, una cosa qualsiasi. I valori di una variabile — dice Russell — «sono le varie entità che essa denota».'! Questa è l’analisi di ciò che, nel contesto di “On meaning and denotation”, Russell chiama variabile indipendente. La variabile dipendente è invece 6_.99
[...] ciò che in matematica è comunemente detta una funzione. Qualsiasi complesso contenente una variabile indipendente è una variabile dipendente. Così “x è un uomo”, “se x è un uomo, x è mortale”, x, sen x, e ecc. sono tutte variabili dipendenti. 8°
Tra le variabili dipendenti — cioè tra le funzioni —, Russell distingue due generi fondamentali: quelle denotanti (denoting) e quelle non-denotanti (undenoting): Dobbiamo distinguere due generi fondamentalmente diversi di variabile dipendente. Quando i valori della variabile dipendente no proposizioni o significati complessi, i valori corrispondenti della variabile indipendente sono costituenti reali dei valori della riabile dipendente. Così “Socrate è un uomo” è un valore di “x è un uomo”, e Socrate (che è il corrispondente valore di x) è un stituente di “Socrate è un uomo”. Ma se prendiamo casi come sen x, ogni valore della nostra variabile dipendente è qualcosa di
178 179 180 18! 182
Russell Russell Russell Russell Russell
[1903a], [1903a], [1903g], [1903g], [1903g],
$ 103, p. 104. $ 482, pp. 509-510. p. 330. p. 335. p. 331.
sovacode-
La teoria dei tipi dei Principia
729
notato da un significato corrispondente, e il valore di x non ne è un costituente. Così sen 7/2 = 1, ma 7/2 non è un costituente di |.
fer] Limitandoci, per cominciare, alle funzioni di una variabile, possiamo definirle come denotanti o non-denotanti a seconda che esse
assomiglino a “il padre di x° o a “x è un uomo”, ossia a seconda che i loro valori siano denotati da significati contenenti i corrispondenti valori della variabile indipendente, o siano essi stessi complessi contenenti i corrispondenti valori della variabile indipendente. Troveremo che la funzione stessa denota sempre, essendo la sua denotazione composta dei suoi valori; ma la chiameremo non-denotante quando i suoi valori sono del predetto genere. È chiaro che tutte le ordinarie funzioni della matematica sono funzioni denotanti, mentre le funzioni proposizionali (ossia le funzioni i cui valori sono proposizioni) sono non-denotanti.'**
Poco dopo, tuttavia, Russell usa “funzione” in un senso un po’ diverso, secondo cui la funzione non è fx, ma so-
lo fi La questione che c’interessa ora è la questione riguardo alla natura delle funzioni. L’f per se stesso è ciò che chiameremo una funzione; lx è il suo argomento, fx, per un particolare valore di f ma non di x, è una variabile dipendente; per un particolare valore sia di fsia di x, è un valore della funzionef.Ciò che dobbiamo chiedere è: Che sorta di cosa è fseparato dal suo argomento?!8*
Russell si pone questa domanda perché è interessato a trovare delle entità che possano costituire i valori delle variabili di funzione proposizionale. Qualche pagina prima egli aveva scritto: Nell’espressione [expression] fx, due elementi variabili, dicevamo, sono implicati, cioè lf e l'x. Ma se si deve sostenere questo pun-
to di vista, è necessario che, in qualsiasi complesso [per es., una proposizione], noi siamo in grado, rispetto a ciascun costituente del significato [per es., rispetto a ciascun costituente della proposizione], di analizzare il tutto in un elemento indipendente da quel costituente, insieme con quel costituente. '*°
Qui Russell dice che, per considerare f come una variabile, è necessario che f abbia dei valori; nel caso delle funzioni proposizionali, questi valori dovrebbero essere quelle (supposte) entità che, nei Principles, egli aveva chiamato parti funzionali delle funzioni proposizionali, 0, più semplicemente, asserzioni; ciò implica che, data una proposizione e un suo costituente (per es. Socrate) la proposizione si possa sempre considerare come costituita da due entità: quel costituente e un’“asserzione” su di esso (per es., un’asserzione su Socrate). Ma Russell continua: «Questo [cioè l’analisi di ogni proposizione in un termine e un’asserzione (in senso ontologico) fatta su questo termine], tuttavia, c’è motivo di ritenere che non si possa sempre fare».'*° In una nota a piè pagina inserita al termine di questa frase, Russell rinvia al cap. 7 dei Principles e aggiunge: «La contraddizione [cioè, il paradosso di Russell] porta allo stesso risultato». Quindi continua: «Sembra dunque seguirne che fin fx non sia affatto un 0ggetto separabile e distinguibile. Ma in questo caso, non possiamo fare asserzioni |statements| riguardo a ciò che vale “per tutti i valori di f” [corsivo mio] RESO
Più avanti, Russell riprende le difficoltà nel separare f dal suo argomento che aveva già esposto nei Principles, osservando che non sembra sempre possibile, al di là dei casi più semplici, analizzare una proposizione in un soggetto e in un’asserzione fatta su questo soggetto: Se diciamo “x è un uomo”, c’è un'asserzione [statement] definita fatta a proposito di [abowt] x, che si può fare siasi entità; così “essere un uomo” può essere presa come la funzione. [...] Quest’analisi è inappuntabile finché volta nel complesso; ma quando x è ripetuto, troviamo delle difficoltà. Così “x è un uomo implica x è mortale”, re espresso con “x ha la proprietà che il suo essere un uomo implica il suo essere un mortale”, implica, quando parola suo, che implica un riferimento a e
a proposito di qualx compare una sola sebbene possa esseè formulato così, la
Un altro problema è che questa supposta separabilità della funzione dal suo argomento sembra condurre al paradosso di Russell: Ma in certi casi complicati, ci sono anche basi più precise contro la distaccabilità della funzione [dal suo argomento]. Tutti questi derivano dal permettere a una funzione di diventare in qualche modo il suo argomento. Un caso tipico è “la funzione f non vale di se stessa”, ossia “la proposizione f(/) è falsa”. Se qui consideriamo la fcome variabile, non otteniamo una funzione distaccabile F,
183 184 !85 150 187 !85
Ibid. Russell Russell Ibid. Russell Russell
[1903g], p. 337. [1903g], p. 334. [1903g], p. 334-335. [1903g], p. 337.
730
capitolo 11 che possiamo considerare come sempre asserita di fi infatti, se facessimo così, l’asserzione e la negazione di F (F) sarebbero equiÈ
3
pura
valenti, che è una contraddizione."
9
Di seguito, Russell osserva che questa contraddizione si potrebbe superare pur ammettendo le funzioni come entità, purché esse siano considerate come entità di tipo logico diverso dai propri argomenti: A questo [paradosso] si potrebbe far fronte con il punto di vista che, in qualsiasi complesso f(x), ci siano posti in cui dobbiamo avere una funzione, e altri posti dove dobbiamo avere un argomento diverso da una funzione; questo è equivalente all’assunzione che una funzione non è un’entità nel senso ordinario, e non è tra i possibili valori di una variabile-entità [entity-variable] x, mentre
un'entità, per converso, non è tra i possibili valori di una variabile-funzione [function-variable]. Se adottiamo questo punto di vista, possiamo ammettere che le funzioni siano distaccabili. [...] dobbiamo escludere per cominciare certi complessi, come f(f), in cui compaiono funzioni laddove sono appropriate delle entità. Questi complessi, dovremo decidere, sono semplicemente privi di significato [meaningless]; e riguardo ad essi non dobbiamo,
come possiamo fare in generale, assegnare un significato convenzionale — essi devono semplicemente essere esclusi dalla logica. Ci sarà una gerarchia di funzioni; perché alcune funzioni possono avere solo funzioni come argomenti. Qualunque cosa sia asserito per tutti i valori della variabile si deve prendere come asserito per tutti i valori appropriati della variabile — per altri valori il complesso asserito sarà privo di significato. Sarà anche necessario negare che ogni funzione definisca una classe che è un’entità, e sia appropriata per le variabili-entità.'?°
Subito dopo, però, Russell scorge in questa teoria difficoltà insuperabili: Ma le obiezioni al punto di vista che le funzioni siano qualcosa e tuttavia non siano entità sono insuperabili. Prima di tutto, c’è la manifesta impossibilità di tale punto di vista. Poi, se fè qualche cosa, sembra del tutto arbitrario negare che f(f) abbia un significato; e comunque è certamente assegnabile un significato convenzionale. Così, l’intera teoria che le funzioni possono essere distaccate dagli argomenti appare insostenibile. Dobbiamo quindi tentare una nuova soluzione.'?!
La soluzione non è però fornita nel manoscritto, e poche righe dopo il testo s’ interrompe — anche se ad esso sono aggiunte alcune pagine in cui Russell annota, nelle sue parole, «qualsiasi osservazione mi sia venuta in mente, senza sistematicità né consecutività».'”? Lo scritto termina dunque con un’impasse dovuta alla difficoltà di trovare delle entità legittime che rappresentino le funzioni proposizionali in senso ontologico. In un manoscritto non pubblicato del 1906, “Types”, Russell considera le funzioni proposizionali come “simboli incompleti”. Proprio in apertura del saggio, egli pone dunque il problema di conciliare ciò con la possibilità di quantificare su variabili funzionali: Una funzione dev’essere un simbolo incompleto. [...] Tutta la difficoltà sta nel conciliare ciò con il fatto che una funzione può essere una variabile apparente.!°
In “Mathematical logic...” (1907), Russell ha trovato una soluzione. Egli ammette la quantificazione su funzioni proposizionali per “convenienza tecnica”, sebbene non consideri le funzioni proposizionali come entità extralinguistiche. Tale quantificazione è interpretata come un semplice modo di dire: Sebbene sia possibile rimpiazzare le funzioni con le matrici, e benché questa procedura introduca una certa semplicità nella spiegazione dei tipi, essa è tecnicamente scomoda [technically inconvenient]. Tecnicamente, è conveniente rimpiazzare il prototipo p con @a e rimpiazzare p/a'x con @x; così dove, se si fossero impiegate le matrici, p e a comparirebbero come variabili apparenti, ora abbiamo @ come variabile apparente. Perché @ possa essere legittima come variabile apparente, è necessario che i suoi valori siano confinati a proposizioni di un certo tipo.'°*
Nella teoria di “Mathematical logic...”, gli enunciati in cui compare una variabile di funzione proposizionale sono reinterpretati come contenenti, in realtà, solo variabili quantificate per individui e proposizioni — che sono le uniche entità ammesse nell’ontologia. Nei Principia questa strategia non può essere utilizzata, perché ora le proposizioni in senso non linguistico sono considerate pseudoentità, ma rimane la possibilità che l'apparente quantifica-
189 190 19! 192 1°? !°4
Russell Ibid. Ibid. Russell Russell Russell
[1903g], p. 338. [1903g], p. 339. [1906h], p. 498. [1908], $ IV, p. 77.
La teoria dei tipi dei Principia
73]
zione oggettuale su funzioni proposizionali sia reinterpretata in modo da non rinviare a nessuna ontologia di attributi. Ritengo che Russell abbia infine risolto il problema interpretando la quantificazione dei Principia su proposizioni e funzioni proposizionali non come oggettuale, ma come sostituzionale — si osservi che nulla vieta di concepire la quantificazione su individui come oggettuale e la quantificazione su proposizioni e funzioni proposizionali come sostituzionale.'? Una formula come “(3p) (Fp)”, dove “(Ap)” è un quantificatore sostituzionale, non significa — come nel caso della quantificazione oggettuale — che c’è una proposizione che ha la proprietà F, ma che c’è almeno un enunciato che, sostituito a ‘“p’, nel contesto “Fp” genera un enunciato vero. Analogamente, “AP (px) dove “(Ag)è un quantificatore sostituzionale, non significa — come nel caso della quantificazione oggettuale — che c’è almeno un attributo di x, ma che c’è almeno un predicato (in senso linguistico) che, sostituito a “4° nella formula “@x” genera un enunciato vero. Un po’ più analiticamente, si può descrivere la quantificazione sostituzionale su variabili predicative monadiche del primo ordine come segue." Sia L un linguaggio del primo ordine — cioè privo di variabili predicative — i cui enunciati siano specificati sintatticamente. Assumiamo che vi sia, in L, una classe P, non vuota, detta classe di sostituzione, che raccoglie tutti i predicati di L. Chiamiamo L linguaggio di base. Sia ora vj, v2, ... una lista infinita di variabili non contenute in L. Se A è un enunciato di L, un’espressione A', ottenuta rimpiazzando zero 0
più predicati in A con variabili vi, v», ..., è detta una forma di L (non nel senso che appartenga al linguaggio L, ma nel senso che è ricavata da espressioni appartenenti a L). Estendiamo ora il linguaggio L a un linguaggio L,: tutte le forme A di L saranno formule di L;. Le altre formule di Lj sono specificate induttivamente: se A e B sono formule di L,, sono formule di L, anche ' A A B',"-A" e'(4v)A ' (dove “(4v;)” è da interpretarsi come un simbolo à
5
È
;
:
.
19
3
RIT
&
che designa un quantificatore sostituzionale sulla variabile v;).'"” Una formula senza variabili libere sarà un enunciato di L,. Poiché gli enunciati di L sono formule di L; (infatti, secondo la definizione essi sono forme di L, e tutte le forme di L sono formule di L;), e non hanno variabili libere, essi sono enunciati di Lj. Gli altri enunciati di L, sono specificati induttivamente: ' A A B' è un enunciato di L se e solo se lo sono A e B; '—A ! è un enunciato di
Li se e solo se lo è A; '(4v;))A ' è un enunciato di L; se e solo se A è una formula di Ly contenente, al massimo, la variabile v; libera. Veniamo ora alla semantica. Chiamiamo modello sostituzionale di L,, una funzione M che as-
segna un valore di verità a ciascun enunciato del linguaggio di base L. Questo consente di definire una funzione di valutazione, Vy, che assegna un valore di verità, nel modello sostituzionale M, a ogni enunciato di L;:
(1) se A è un enunciato di L; che è anche un enunciato di L allora Vy (A) = Vero se e solo se M (A) = Vero; (2) se A è un enunciato di Li, Vy('
p! (Napoleone), dove “f(@!Z)” dev'essere letto: “@! Z è un predicato che hanno tutti i grandi generali”. Ora — osserva Russell — (2) non è, esso stesso, un predicato di Napoleone, poiché fa riferimento — tramite la quantificazione su “@! 7” — alla totalità dei predicati. (2) è dunque una proprietà del second’ordine di Napoleone. L'assioma di riducibilità asserisce che esiste un predicato che è formalmente equivalente a (2). In questo caso particolare — nota Russell — l’esistenza di un tale predicato può essere dimostrata: Perché il numero dei grandi generali è finito, e ciascuno di essi certamente possedeva qualche predicato non posseduto da alcun altro essere umano — per esempio, l’istante esatto della sua nascita. La disgiunzione di tali predicati costituirà un predicato comune e peculiare ai grandi generali.*°* Se chiamiamo questo predicato y! 2, l’asserzione che abbiamo fatto su Napoleone era equivalente a y! (Napoleone). [...] Così siamo arrivati a un predicato che è sempre equivalente alla proprietà che abbiamo ascritto a Napoleone, ossia esso appartiene a quegli oggetti che hanno questa proprietà, e non ad altri.?°
Si potrebbe a prima vista pensare che l’assioma di riducibilità — in analogia con l’assioma di scelta — sia dimostrabile, qualora si abbia a che fare solo con classi finite. Per quanto riguarda l’assioma di scelta, se abbiamo una classe che ha per elementi un numero finito di classi, è sempre possibile descrivere una classe @ che abbia esattamente un elemento scelto da ognuna delle classi date, semplicemente elencando gli elementi a, 43, ..., dn, di
&— cioè attraverso un’espressione della forma: aa
NINO = dî
Non si potrebbe nello stesso modo dimostrare lo schema monadico di riducibilità, qualora si tratti di funzioni proposizionali vere di un numero finito di oggetti? Avendo, per es., una funzione di individui @ %, di ordine arbitrario, che sia soddisfatta da un numero finito d’individui a,, 42, ..., a,, non si potrebbe ottenere una funzione predi-
cativa w! %, formalmente equivalente a @ %, semplicemente ponendo: yuli arl
=ad,V
Di =a2rV
... V
n "Ap
La risposta è negativa. la ragione è che nei Principia l’identità è definita come segue:
204 V. [PM], vol. I, *12.1. Cfr Russell [1908], $ VI, p. 87. 305 V. [PM], vol. I, #12.11. Cfr Russell [1908], $ VI, p. 87. 206 V. [PM], vol. I, +12, p. 164. Cfr Russell [1908], $ V, p. 82. vi 308
[PM], vol. I, introduzione, cap. 2, $ VI, p. 56. So
SINO
o
n
o
È
È
CONISS
3
x
a
5
>
3
Quando un insieme (finito) di predicati è dato per effettiva enumerazione, la loro disgiunzione è un predicato, poiché nessun predicato compare come variabile apparente nella disgiunzione. [Nota di Russell.] da [PM], vol. I, introduzione, cap. 2, $ VI, p. 56.
La teoria dei tipi dei Principia x=Y=a4(P)(P!xD
p!y),
793
310
“x e y sono identici se tutte le funzioni proposizionali predicative che sono soddisfatte da x lo sono anche da y”. Ma perché questa definizione funzioni, è necessario che sia vero l'assioma di riducibilità; infatti, se quest’assioma fosse falso potrebbe darsi il caso che x e y soddisfino sì le stesse funzioni proposizionali predicative, ma differiscano nel soddisfare qualche funzione non predicativa, essendo dunque, di fatto, diversi.*!' L’assioma di riducibilità è necessario, nei Principia, per le identiche ragioni per le quali lo era in “Mathematical logic...”: non solo per la definizione russelliana di identità, ma per «legittimare un gran numero di ragionamenti, in cui, prima facie, abbiamo a che fare con nozioni come “tutte le proprietà di a” o “tutte le a-funzioni” e in cui, nondimeno, non sembra possibile sospettare nessun errore sostanziale».3!°
Un esempio del tipo di ragionamenti cui allude qui Russell è il teorema fondamentale dell'analisi, secondo cui ogni classe superiormente limitata di numeri reali ha un minimo limite superiore. La difficoltà che sorge nel contesto della teoria ramificata dei tipi è illustrata bene da Ramsey ([1926b]). Seguiamone dunque la spiegazione. Innanzi tutto, Ramsey riassume il nocciolo della teoria ramificata dei tipi: Supponiamo di avere un insieme di caratteristiche [proprietà] date come tutte le caratteristiche di una certa sorta [sort], diciamo, A, allora possiamo chiedere, di una cosa qualunque, se essa ha la caratteristica della sorta A. Se ce l’ha, questa sarà un’altra sua caratteristica, e sorge la questione se questa caratteristica, la caratteristica di avere una caratteristica della sorta A, possa essere essa stessa della sorta A, considerando che essa presuppone la totalità di tali caratteristiche. La Teoria dei Tipi sosteneva che non può esserlo, e che potremmo sfuggire alla contraddizione solo dicendo che è una caratteristica di ordine superiore, e che non potrebbe essere inclusa in nessuna asserzione [statement] a proposito di tutte le caratteristiche di ordine inferiore."
Dopo aver ricordato che, secondo la teoria dei Principia, «le asserzioni a proposito di classi o aggregati si devono considerare in realtà come a proposito delle caratteristiche che definiscono le classi [...], cosicché qualsiasi asserzione a proposito di tutte le classi sarà in realtà a proposito di tutte le caratteristiche, e sarà soggetta alle stesse difficoltà riguardo all’ordine di queste caratteristiche», '' Ramsey espone la difficoltà che sorge in questa teoria riguardo al teorema del limite superiore. Questo teorema, osserva Ramsey, consegue immediatamente dal principio secondo cui, se i numeri reali sono divisi in due classi da una sezione di Dedekind deve esistere un numero
che divide queste due classi e che è il più piccolo della classe superiore o il più grande di quella inferiore. Tuttavia, il modo in cui si dimostra questo principio? non è più disponibile nella teoria ramificata dei tipi (senza assioma di riducibilità): Supponiamo ora di avere un aggregato £ di numeri reali; esso sarà una classe di caratteristiche [proprietà che definiscono classi] di razionali. é il limite superiore di E, si definisce come una sezione dei razionali che è la somma dei membri di E; ossia é è una sezione i cui membri sono tutti quei razionali che sono membri di un qualsiasi membro di E, cioè, tutti quei razionali che hanno la caratteristica di avere una qualunque delle caratteristiche che danno i membri di £. Così il limite superiore é è una sezione la cui caratteristica definente è di ordine superiore a quelle dei membri di E. Quindi se tutti i numeri reali significa tutte le sezioni di razionali definite da caratteristiche di un certo ordine, il limite superiore sarà, in generale, una sezione di razionali definita da una caratteristica di ordine superiore, e non sarà un numero reale. Ciò significa che l’analisi com’è generalmente intesa è fondata interamente su un genere fallace di argomentazioni, che applicate in altri campi portano a risultati autocontraddittori.*"°
Questa difficoltà è evitata, nei Principia, attraverso l'introduzione dell’assioma di riducibilità il quale, nelle parole di Ramsey, [...] asseriva che per qualsiasi caratteristica di ordine superiore c’era una caratteristica equivalente dell’ordine più basso — equivalente nel senso che tutto ciò che ha una ha anche l’altra, cosicché esse definiscono la stessa classe. Il limite superiore, che abbiamo visto era una classe di razionali definita da una caratteristica di ordine superiore, sarebbe allora definito anche dall’equivalente caratteristica dell’ordine più basso, e sarebbe un numero reale.!”
310 V. [PM], vol. I, *13.01. dave [PM], vol. I, commento a *13.101.
312 [PM], vol. I, introduzione, cap. 2, $ VI, p. 56. 313 Ramsey [1926b], p. 63.
3% Jbid: 315 V. sopra, cap. 3, $ 9.4. 310 Ramsey [1926b], p. 64.
3!7 Ramsey [1926b], pp. 64-65.
7154
capitolo 11
2.3.2. In connessione con l’assioma di riducibilità, possiamo fare maggior chiarezza intorno ad alcuni importanti aspetti della gerarchia dei tipi dei Principia. Prendiamo le mosse dallo schema che Charles S. Chihara ([1973], cap. 1 pp. 21-22) propone per illustrare la gerarchia dei tipi nel caso più semplice, cioè quello delle funzioni proposizionali monadiche. Egli scrive: Gli individui saranno di tipo 7). Le funzioni proposizionali di ordine 1 saranno di tipo 7;. Le funzioni proposizionali di ordine 2 che prendono come argomenti degli individui saranno di tipo 7) 0. Le funzioni proposizionali di ordine 2 che prendono come argomenti funzioni proposizionali di tipo 7, saranno di tipo 7) ;. In questo modo, possiamo costruire la gerarchia dei tipi come segue:
Tio
Ti
Ti20
Ty24
T30
Tzi
T320
T321
Tro
Ti
Ti30
Las
Ti320
Ti321
T To Secondo la spiegazione di Chihara, le funzioni del primo ordine possono contenere solo variabili argomentali individuali. Quindi esiste solo un tipo di funzioni monadiche del primo ordine. Una funzione monadica del second’ordine potrà invece essere di tipi diversi, secondoché ad essa si possa assegnare come argomento: (1) un individuo; (2) una funzione del primo ordine.
Esisteranno dunque due tipi di funzioni monadiche del second’ordine. Venendo alle funzioni monadiche del terzo ordine, secondo Chihara esse possono essere di tipi diversi secondoché possano prendere come argomento: (1) (2) (3) (4)
un individuo; una funzione del primo ordine; una funzione del second’ordine che prende individui per argomenti; una funzione del second’ordine che prende funzioni del primo ordine come argomenti.
Avremo dunque, secondo Chihara, quattro tipi di funzioni monadiche del terzo ordine. Analogamente, vi saranno otto tipi di funzioni monadiche del quarto ordine, sedici del quinto, e così via: in generale vi saranno 27” differenti tipi di funzioni monadiche di ordine n.°"* Non è difficile estendere la spiegazione di Chihara alle funzioni poliadiche. In questo caso, il numero dei tipi cresce enormemente. Prendendo, per esempio, le funzioni del second’ordine diadiche, avremo tipi diversi secondoché ad esse si possano assegnare come argomenti: (1) (2) (3) (4)
due individui; un individuo e una funzione del primo ordine; una funzione del primo ordine e un individuo; due funzioni del primo ordine.
Questi nuovi tipi vanno ad aggiungersi ai due tipi di funzioni monadiche del second’ordine. Si dovranno poi considerare i tipi di funzioni triadiche del second’ordine, e così via. Nello schema di Chihara, le funzioni che hanno tra i loro argomenti delle proposizioni non danno origine a nuovi tipi. Questo è corretto. Infatti — secondo Russell — le funzioni che hanno tra le loro variabili argomentali variabili proposizionali sono riducibili a funzioni aventi tra le loro variabili argomentali delle variabili di funzione proposizionale: Le proposizioni che non contengono funzioni né variabili apparenti si possono chiamare proposizioni elementari. Le proposizioni che non sono elementari, che non contengono funzioni, né variabili apparenti al di fuori degli individui, [31%] si possono chiamare
dia. Su questa conclusione concorda anche Couture ([1988], p. 124).
31° Si osservi, anche qui, “individui” usato per indicare variabili individuali.
La teoria dei tipi dei Principia
75
Nn
proposizioni del primo ordine. [...] Le proposizioni elementari e quelle del primo ordine non presuppongono nessuna totalità eccetto (al più) la totalità degli individui. Esse sono di una o l’altra delle tre forme: Plx().p!x; (A). p!x, dove @!x è una funzione predicativa di un individuo. Ne segue che, se p rappresenta una proposizione elementare variabile o una proposizione del primo ordine variabile, una funzionefp è f(g! x) 0 fi). g!x} 0 (Ax. @! x}. Così una funzione di una proposizione elementare o del primo ordine può sempre essere ridotta a una funzione di una funzione del primo ordine. Ne segue che una proposizione che involge la totalità delle proposizioni del primo ordine può essere ridotta a una che involge la totalità delle funzioni del primo ordine; e questo ovviamente si applica ugualmente agli ordini più alti.??°
La spiegazione di Chihara — che prevede una suddivisione degli ordini in tipi — appare più aderente al testo dei Principia di altri resoconti”! che prevedono innanzi tutto una gerarchia di tipi, ciascuno dei quali si deve poi suddividere in ordini. Essa, tuttavia, non è corretta. Vediamo, innanzi tutto, come Chihara ([1973], cap. 1, p. 45) si serve del suo schema
To
Ti
T20
Ty2,
130
T3,
1320
T321
120
Ti
1430
T431
Ti320
Ti321
1, per illustrare il funzionamento dell’ assioma di riducibilità nel caso più semplice delle funzioni proposizionali monadiche. Egli considera dapprima la colonna di sinistra, consistente di 7}, 730, 730, Tio, ...: le funzioni di tipo 7, sono predicative, quelle dei tipi superiori no. L'assioma di riducibilità asserisce che per ogni funzione di tipo 730, T30, T4o, ..., esiste una funzione di tipo 7; ad essa formalmente equivalente (cioè che è vera per gli stessi valori dati alla variabile libera). Chihara considera poi la seconda colonna, cioè 7) 1, 731, 711, ..., dove 7; rappresenta il
tipo predicativo: l’assioma di riducibilità dice che una funzione qualsiasi di questi tipi è sempre formalmente equivalente a qualche funzione del tipo 7),,. Quando Chihara viene a considerare la terza colonna, cioè la colonna 7320, 742.0, 75.20, -.., le cose si fanno più
problematiche. L'assioma di riducibilità garantisce che qualsiasi funzione di questi tipi è riducibile a una funzione formalmente equivalente del tipo di ordine più basso, cioè 73. Fin qui tutto bene. Tuttavia Chihara non considera predicativo il tipo 730, perché — giustamente, come si vedrà — ritiene che, nei Principia, una funzione predicativa debba sempre avere argomenti predicativi, mentre il tipo 73 è quello di una funzione del terzo ordine che prende come argomenti delle funzioni del second’ordine d’individui, cioè delle funzioni non predicative di tipo To. Egli dunque prosegue affermando che l’assioma di riducibilità consente di ridurre il tipo 730 — € quindi tutti i tipi più in alto nella stessa colonna — al tipo 7,1. Il ragionamento di Chihara è il seguente. Il tipo 7, non è predicativo, ma l’assioma di riducibilità garantisce che ogni funzione che ha questo tipo è formalmente equivalente a una funzione di tipo 7). Da ciò Chihara desume che il tipo 73 può essere ridotto al tipo 731, il quale, come abbiamo già visto, si può a sua volta ridurre al tipo 7). Se questo è corretto, una funzione qualsiasi dei tipi 73.0, T20, 1520, -.., può essere ridotta a una funzione formalmente equivalente del tipo 7) ;. La conclusione di Chihara è che l’assioma di riducibilità consente di ridurre la gerarchia dei tipi schematizzata sopra alla gerarchia seguente: (RT ILSA 1321
14324»
T5432.15
‘o
Questi, secondo Chihara, sono i soli tipi predicativi di funzioni monadiche. La difficoltà fondamentale di questa ricostruzione è che il tipo 7330 dovrebbe essere già un tipo predicativo,
stando alla definizione dei Principia, che rappresenta un tipo predicativo come i/ tipo di una funzione di ordine immediatamente superiore all’ordine dei suoi argomenti di ordine più elevato. Ma vi sono ragioni cogenti per non rinunciare alla tesi — sostenuta dallo stesso Chihara — secondo cui, nei Principia, una funzione predicativa può avere solo argomenti predicativi. Questa tesi, infatti, non solo era già un tratto caratteristico della teoria dei tipi sostenuta da Russell in “Mathematical losicot = ma, come vedremo più avanti ($ 3.1.5), è indispensabile al funzionamento della definizione russelliana delle classi di classi. 320 [PM], vol. I, introduzione, cap. 2, $ V, pp. 54-55. 22! Come, per esempio, quello di Copi ([1971]). 322 In “Mathematical logic...”, infatti, una funzione predicativa monadica del terzo ordine è esplicitamente descritta come una funzione del
756
capitolo11
Cerchiamo di risolvere il puzzle tornando ai Principia. Sia nell’introduzione (cap. 2, $ V, pp. 53-54), sia in #12 (p. 165), Russell insiste sul fatto che non è necessario introdurre una speciale notazione per le funzioni non predicative il cui tipo è assegnato — cioè che hanno variabili argomentali di un dato ordine e sono, esse stesse, di un ordine determinato: per il modo in cui la gerarchia delle funzioni è generata, le funzioni non predicative sono sempre ottenute da quelle predicative per mezzo di una generalizzazione. Per esempio, le funzioni del second’ordine di un individuo — il tipo 7) di Chihara — sono di forma:
(PIF! (1 È, 0) 0 APf(P! 7,0 (PM
(PZ,
7,3), ecc.
dove f è una funzione predicativa del second’ordine. In generale, osserva Russell: [...] una funzione non predicativa dell’n-esimo ordine si ottiene da una funzione predicativa dell’n-esimo ordine trasformando in variabili apparenti tutti gli argomenti dell’n — 1-esimo ordine. (Anche altri argomenti possono essere trasformati in variabili appaSAyA Trento)
In realtà — aggiunge Russell — solo le prime due forme, cioè “(@)(f!(@!Z,x)? o “A@)(f!(@!î, x)”, sono necessarie per esprimere una qualsiasi funzione del second’ordine di x, e anzi, per esprimere una funzione di x di qualsiasi ordine: Perché la funzione (vw) . f!(@! 2, y! 2, x), dovefè dato, è una funzione di @! 2 e x, ed è predicativa. Così è della forma F!(@! 2, x), e quindi (9, v).f!(0! 2, y! î, x) è della forma (@). F!(@! 2, x). Così parlando in generale, attraverso una successione di passi troviamo che, se @! % è una funzione predicativa di ordine sufficientemente alto, qualsiasi assegnata funzione non predicativa di x sarà di una delle due forme:
(9).F!(p!ù,x),Ag).Fi(p!ù, x) dove F è una funzione predicativa di @! è e x.°°*
Non vi è dunque alcun bisogno di variabili per funzioni non predicative. I Principia sono espliciti, in proposito: Pertanto non abbiamo bisogno di introdurre come variabile nessuna funzione eccetto le funzioni predicative [vol. I, introduzione, cap. 2, $ V, p. 54].
Le variabili che compaiono nel presente lavoro, da questo punto in avanti, saranno tutte individui o matrici di qualche ordine [...] [vol. I, *12, p. 164].
È dunque possibile, senza perdita di generalità, non usare variabili apparenti eccetto quelle che sono predicative [vol. I, *12, p. 165].
Nei Principia, non esistono variabili per funzioni che non siano predicative. Sebbene Russell (come già accadeva nella teoria pubblicata nel 1907) non distingua i due casi, è evidente le lettere funzionali non seguite da un punto esclamativo non sono variabili: sono lettere schematiche che tengono il posto di una qualsiasi formula funzionale il cui ordine è assegnato.’ Prendiamo, per esempio, l’assioma di riducibilità per le funzioni monadiche:
AP)PM(P!y= vv). Qui la lettera “#° — sebbene non sia graficamente distinta da una variabile — non è affatto una variabile: secondo la teoria dei Principia essa non può essere vincolata da un quantificatore. Tutto ciò che si può fare è sostituire alla lettera “w” una particolare espressione funzionale: in breve, “w?” è una lettera schematica, non una variabile nel senso in cui, nell'espressione precedente, lo è “@”?. L’assioma di riducibilità per le funzioni monadiche è nei Principia, così com'era nella teoria di “Mathematical logic...”, uno schema d’assiomi (e lo stesso vale, natural-
mente, dell’assioma di riducibilità per le funzioni diadiche).
terzo ordine che prende per argomenti delle funzioni predicative del second’ordine. 223 [PM], vol. I, introduzione, cap. 2, $ V, pp. 53-54. 4 [PMI], vol. I, introduzione, cap. 2, $ V, p. 54.
325 Su questo ha insistito Landini (v., per es., [1996a], pp. 296-300).
La teoria dei tipi dei Principia
757
Poiché nei Principia (come già in “Mathematical logic...) non vi sono altre variabili che quelle per funzioni predicative, tutte le funzioni di funzioni devono essere funzioni di funzioni predicative.??° Incidentalmente, ciò permette di comprendere meglio un punto concernente la definizione di “classe” che avevamo considerato, nel capitolo 9, in connessione con un’obiezione di Boér ([1973]).!? Avevamo visto che Russell definisce una “funzione estensionale derivata” di ogni funzione avente come argomenti funzioni predicative. Ma quale dovrebbe essere la funzione estensionale derivata di una funzione che non abbia argomenti predicativi? La risposta è che, nei Principia, come in “Mathematical logic...”, non esistono funzioni siffatte. I tipi di Chihara: T320, T420
T424
T130,
Ti31
T1320
sica
non esistono, nel senso che nel linguaggio dei Principia non esistono termini per funzioni di funzioni non predicative. Quella che per Chihara è una funzione di tipo 73. avrebbe una delle due forme: “(@). F!(@!Z, x)”, oppure “(A@) . F!(@! î, x)”, dove non compare nessuna variabile per funzioni del second’ordine di individui, ma solo
variabili predicative. Si noti che “(@). F!(@!î,x)” e “A@). F!(@!î, x) sono funzioni predicative della fun-
zione diadica del second’ordine F. Da ciò segue che una funzione impredicativa come quella espressa, per esempio, da “(3@)(@!Z)” non può costituire il valore (il sostituto) di nessuna variabile funzionale dei Principia. In altre parole, il procedimento usato nei Principia di porre un accento circonflesso su una variabile di un enunciato aperto non può essere, come molti hanno pensato, un modo di formare termini (nomi) del linguaggio formale dei Principia.”** Se le funzioni proposizionali, in senso ontologico, non fossero considerate (pseudo) entità riducibili (cioè, in ultima analisi, non-entità), l’ontologia dei Principia non sarebbe compromessa con altri universali che le funzioni proposizionali predicative, la cui esistenza è garantita dagli schemi d’assiomi di riducibilità, che sono gli unici principi di comprensione dei Principia. Questi schemi d’assiomi assicurano l’esistenza di una funzione proposizionale predicativa per ogni enunciato aperto di una o due variabili. Ma le funzioni proposizionali predicative dei Principia non designano attributi: sono simboli, che ricevono un’interpretazione solo all’interno degli enunciati in cui compaiono. All’interno di questi enunciati, esse possono esprimere delle verità sul mondo. Per esempio, ‘“ % è rosso o X è blu” non denota un universale; nondimeno, se un oggetto A ha l’attributo di essere rosso, oppure ha l’attributo di essere blu, l’enunciato “A è rosso o A è blu” sarà vero. In questo senso, si può dire che ‘“ % è rosso o X è blu” esprime una proprietà di A; ma ciò non implica che vi sia l'attributo disgiuntivo di essere rosso o blu. Possiamo dire che, nell’ontologia intesa dei Principia, lo schema d’assiomi “(4@)(y)(g!y= wy)”, dove “y” è una variabile individuale, afferma che, in corrispondenza di qualunque espressione che sia vera di y, esistono sempre degli attributi tali che, se nominati (in qualche estensione del linguaggio), consentono di costruire un'espressione predicativa equivalente.” Ciò suggerisce che il linguaggio dei Principia sia inteso come infinitamente estensibile, in modo che a ogni universale possa essere assegnato un simbolo. Se non fosse così, gli schemi d’assiomi di riducibilità potrebbero risultare falsi non per una caratteristica del mondo, ma per una contingente mancanza di simboli nel linguaggio scelto.
3. LE CLASSI 3.1. LA RIDUZIONE DELLE CLASSI A
FUNZIONI PROPOSIZIONALI
3.1.1. Nei Principia, come nella teoria russelliana del 1907, i simboli di classe e di relazione in estensione sono simboli incompleti: [...] una proposizione su una classe è sempre ridotta a un’asserzione circa [about] una funzione che definisce la classe, ossia circa una funzione che è soddisfatta dai membri della classe e da nessun altro argomento. Così una classe è un oggetto derivato da una ; funzione e presupponente la funzione [...]. 330
326 327 328 329 330
Questo punto è stato sostenuto da Landini (per, es., [1996a], in particolare, p. 300 e pp. 302-303). V_ sopra, cap. 9, $ 6.4. Il merito di avere per primo rilevato questo va a Landini, che lo ha ribadito nei suoi scritti a partire dal 1996. Torneremo ancora sull’assioma di riducibilità nel $ 2.3 del cap. 12. [PM], vol. I, introduzione, cap. 2, $ VIII, pp. 62-63. Si noti che una classe è qui caratterizzata come un oggetto: ma nei Principia non si
capitolo 11
758
Le definizioni contestuali dei simboli di classe e di relazione in estensione dei Principia sono le stesse che RusRO. 5 È 331 o_& sell proponeva in “Mathematical logic...”?,” e cioè:
(DI) f(2(v2) = AP (M(P!x= va) Afp! 2)” €
(D2) f(@ YA
= EPM!
)= va, )) Afp, 3)
Nell’introduzione dei Principia,"?* Russell mostra che la sua definizione di “classe” è perfettamente adeguata, elencando cinque condizioni che le classi devono soddisfare, per servire agli scopi per i quali esse sono comune°
.
3
mente usate in matematica:?” (I)
Ogni funzione proposizionale deve determinare una classe, che si può considerare come la collezione di tutti
(ID)
gli argomenti che soddisfano la funzione in questione. Due funzioni proposizionali formalmente equivalenti —
cioè tali che qualsiasi argomento che soddisfa
l’una, soddisfi anche l’altra — devono determinare la stessa classe. In altri termini, una classe dev'essere in-
teramente determinata dai suoi membri. (III) Inversamente, se due funzioni determinano la medesima classe, esse devono essere formalmente equivalenti. (IV) Nello stesso senso in cui vi sono classi, o in qualche senso strettamente analogo, devono esservi classi di classi (senza classi di classi, osserva Russell, l’ aritmetica diviene impossibile). (V) Dev’essere privo di significato (non semplicemente falso) affermare che una classe sia (o non sia) un elemento di se stessa. Infatti, dalla (I) e dalla (IV) deriverebbe che vi sia la classe di tutte le classi che soddisfano la funzione 2 & a; chiamando questa classe “w”, abbiamo che (@(ae w= a € 0); ma da qui, istanziando @ con w, si ottiene la contraddizione che w e w=w € w, cioè il paradosso di Russell.
Questi requisiti — afferma Russell — sono soddisfatti dalla definizione (D1). Vediamo come.?°
3.1.2. La condizione (I) ammonta — spiega Russell?” — ad asserire che, per ogni funzione proposizionale w £ esistono enunciati veri della forma “f(2(w2z))”. Questo è garantito dall’assioma di riducibilità. Infatti, per qualsiasi funzione proposizionale w ?, l’assioma garantisce che esiste una funzione predicativa @! 2 ad essa formalmente equivalente. Ora, data qualsiasi funzione f che sia soddisfatta da @! £ ;°°* in virtù della definizione (D1), anche 2 (yz) soddisferà f. Dunque, data una funzione qualsiasi w 2, ci saranno enunciati veri della forma “f(î (w2))”. Da queste considerazioni risulta chiaro che, nella teoria dei Principia, il principio di comprensione per le classi — cioè il principio secondo cui per ogni condizione specificabile esiste una classe ad essa corrispondente — è sostituito dall’assioma di riducibilità (principio di comprensione per le funzioni proposizionali), unito alla definizione (D1).
suppone che esistano classi. Dunque l’uso del termine “oggetto”, nei Principia, non ha implicazioni ontologiche. bg sopra, cap. 9, $ 6.
332 V. [PMI], vol. I, #20.01. 393 V. [PMI], vol. I, #21.01. SAVE [PM], vol. I, introduzione, cap. 3, pp. 76-77.
335 Le stesse cinque condizioni sono elencate in Russell [1919a], cap. 17, pp. 184-185. 336 Nei paragrafi 3.1.2, 3.1.3, 3.1.4 e 3.1.6 seguenti, faccio riferimento soprattutto alle spiegazioni contenute in [PM], vol. I, introduzione, cap. 3, pp. 77-79. 331 Per quanto segue, in questo capoverso, v. [PM], vol. I, introduzione, cap. 3, pp. 77-78. x 338 Per esempio, si può porre f= (x)(X!x v -7!x), dove “Y” è una variabile.
La teoria dei tipi dei Principia PRE
-
339
;
759
:
Une
,
3.1.3. Le condizioni (II) e (III) — come spiega Russell” — si possono prendere insieme: congiuntamente esse affermano che le classi î(@2) e î(w2) sono identiche se e solo se le loro funzioni definenti sono formalmente equivalenti, cioè:
2(92)= î2(v2)=()(0x= va); una formula in cui si può riconoscere l’equivalente dell’assioma (V) dei Grundgesetze di Frege. Il simbolo “Z(@z)=
2(wz)” è interpretato, nei Principia, secondo la medesima convenzione d’ambito stabilita per le descri-
zioni definite — cioè la convenzione secondo cui il simbolo incompleto che compare tipograficamente per primo debba avere l’ambito più ampio.” Allora, applicando la definizione (D1), la formula
2(@z)= î(Y2) diviene, dapprima:
AN(M(K1x= px) Ax! î = 2(v2)), e poi, eliminando
A
‘7 (w2)” dal contesto “Y! î = 2(wz)” ancora in base a (D1), si ha:
ANn(@MA1x= pa AGI (M(0!x= ya) n (218 = 018), che equivale a: AnE0)(MX1x=
px)
AM(01x= va) A(X!12=0!2)),
che è equivalente a:
AIND(M(11x= px) AD(X1x= va). Quest'ultima espressione, da un lato implica:
(Pr
VA),
dall’altro è implicata da “(@)(@x= wx)” unito all’assioma di riducibilità, nella forma “A4@)Y)(0!y= wvy)”. Dunque, assumendo l’assioma di riducibilità, le due espressioni sono equivalenti. Abbiamo dunque la dimostrazione che:
(TI) 2(92)= 2(Y2)=(M(pPx= y9).
341
Questo teorema permette di dimostrare che:
(T2) (EM(z(92)= 2(412), TS
Sao
z
:
5
2
cioè che «tutte le classi si possono ottenere da funzioni predicative».'“ 343 TRL seguente. 5 Da (TI1) si ottiene:
342
=
È
a
È
()(x=v!x) 3 Z(pz)= 2(v!2)
332 Per quanto segue, v. [PM], vol. I, introduzione, cap. 3, p. 78.
3 V. sopra, cap. 7, $3.3; svi [PM], vol. I, introduzione, cap. 3, p. 78. Il teorema è formalmente dimostrato in [PM], vol. I, #20.13, *20.14 e *20.15.
342 [PM], vol. I, *20.151. 34 Il teorema è dimostrato in [PM], vol. I, *20.151.
5
Letto
La dimostrazione fornita nei Principia è la
capitolo 11
760
e dunque, per generalizzazione (v. [PM], vol. I, #10.11):
(M((Px=yv!) > Z(Pz)= 2(4!2) da cui — applicando il teorema *10.28 dei Principia, secondo cui
@(pr3 va) > (E) pr3 Ev) va) — si ottiene:
AIM(M(px= yv!x) > (AM(i(0z)= 7(vz)), il cui antecedente è l’assioma di riducibilità, per cui (T2) segue per modus ponens. Il teorema (T2) dimostra che non vi è mai bisogno di ricorrere a funzioni non predicative per determinare una classe: in generale, una classe potrà essere determinata da diverse funzioni, aventi ordini diversi; ma, tra queste funzioni, ce ne sarà sempre almeno
una che sarà predicativa. Ne consegue che, considerando solo le classi determinate da funzioni predicative, non si trascurerà nessuna classe.
3.1.4. La condizione (IV), cioè quella sulle classi di classi, richiede innanzi tutto una spiegazione del significato del simbolo “x e î(w2)”, che si può leggere: “x è un elemento della classe determinata da w 2 ey è una funzione della forma “f(2(w2))”; quindi, applicando la definizione (D1) si ottiene:
(T3) xe î(v2)=(AP(M(p!y= wp) Axe plî). Per interpretare il simbolo “x e @! 2”
ADI
che compare in (T3), nei Principia è posta la seguente definizione:
(AT che permette di ottenere, da (T3):
(T4) xe î(y2)=(AP)(M(p!y= W) A P!3). Il lato destro di (T4) implica “wx”, poiché implica “@! x”, e “@!y” è equivalente a “wy” per tutti i valori di “y”. D'altra parte, “wx”, unito all’assioma di riducibilità, implica “x e
funzione predicativa @!Z formalmente equivalente
Z(w2z)”, perché, secondo l’assioma, esiste una
a w ? e inoltre x deve soddisfare @!
poiché, per ipotesi,
soddisfa w 7. Se dunque si assume l’assioma di riducibilità, da (T4) si ottiene il teorema:
(5) e
za) =
cioè: “x appartiene alla classe î (w2) se e solo se soddisfa la funzione w che definisce la classe”. Ora Russell è in grado di interpretare le classi di classi.’** Una classe di classi è interpretata come consistente dei valori di 7(@z) che soddisfano f((@2z)). Usando “@° in luogo di “(2)”, Russell scrive “@(f@” per la classe dei valori di @ che soddisfano fa. Egli applica quindi a una formula “F(& (f@)”, dove “F —’ rappresenta un contesto per il simbolo ‘“ & (f@)”, una definizione del tutto analoga alla (DI): 34 Per la spiegazione seguente, v. [PM], vol. I, introduzione, cap. 3, pp. 78-79.
*© V. [PMI], vol. I, *20.02. 24 V. [PM], vol. I, #20.3.
247 (T5), unito al teorema (T1) del paragrafo precedente, dà immediatamente luogo al teorema *20.31 dei Principia:
î(P2)=î(v)=M(xe î(PA)=xe
î(Y2)),
il quale afferma che due classi sono identiche se e solo se hanno gli stessi elementi. 348 Per quanto segue, v. [PM], vol. I, introduzione, cap. 3, p. 79.
La teoria dei tipi dei Principia
761
(D1) F(@ f@) = (Ag) (Pg 18=/9) A F(g!14))} dove / sta in luogo di un’espressione qualsiasi della forma “ î (yv1 2)”. Prendendo poi “ye & (f@)” come caso particolare di “F(& (f@)? e applicando ad essa la (D1/’), Russell ottiene:
(T3) ye @(fa)=Ag)(9(e!8=/B) A ye 816). Da (T3°*), per mezzo della definizione:
(D3)
ye glà =ag!1y"
che è del tutto analoga a (D3), ricava:
(T4)) ye d(fO=(Ag)((I(8!18=fD) 181). Applicando poi l’assioma di riducibilità alle funzioni di funzioni, cioè assumendo:
(Ag)(Mfyv!Z2)=g!(412)),
Russell deduce dapprima: Ag) (Mi (v12)= 8!(î (12)!
cioè,
(3g) (9) fB= 8!) e, di conseguenza, da (T4’), deduce:
(ocio in modo del tutto analogo a quello in cui aveva dedotto (T5) da (T4). Così Russell dimostra che: «ogni funzione che possa assumere classi come argomenti, cioè ogni funzione di funzioni, determina una classe di classi, i cui ©
°
È
=
5
a
352
membri sono quelle classi che soddisfano la funzione determinante».?
3.1.5. Apriamo una parentesi. Osservando la (T4’), possiamo comprendere ciò cui si era accennato nel $ 2.3.2, cioè che se nei Principia fossero ammesse variabili per funzioni non predicative, e fossero dunque ammesse funzioni predicative di funzioni non predicative, si andrebbe incontro a difficoltà insormontabili in connessione con la teoria delle classi di classi.’’* Supponiamo, infatti, che % in (T4)), sia una classe di individui appartenente a una classe di classi &@(f@), e che una funzione g di cui il lato destro della (T4’) asserisce l’esistenza sia una funzione predicativa del terzo ordine che prende come argomenti funzioni del second’ordine di individui; supponiamo, cioè, che tale funzione abbia il tipo di Chihara 730. Poiché yè una classe di individui possiamo porre:
y= î(V2), dove w è una funzione di individui. Si ha dunque:
2 V. [PM], vol. I, *20.08. 350-V. [PM], vol. I, #20.081. 3 La dimostrazione completa è in [PM], vol. I, #20.112.
352 [PM], vol. I, introduzione, cap. 3, p. 79. 353 L’argomentazione sviluppata nel seguito si deve a Landini ([1996a], p. 303, [1996b], pp. 599-600, e [1998a], $ 10.4, p. 266).
capitolo 11
762
gUy=gt(2(14/2)): Ma, applicando a g!(Z(w2z)) la definizione (D1), otteniamo:
g!(7(v2))= (Ap)(M(p!x= va) 1 g!(9!î)); dove @ dev’essere una funzione predicativa d’individui, e dunque del tipo 7; di Chihara. Ma allora g dev'essere una funzione predicativa di funzioni predicative d’individui, cioè deve avere tipo di Chihara 73.10 È dunque impossibile che g fosse di tipo 73... Ciò è una riprova che nei Principia non è ammesso l’uso di variabili non predi-
cative. 3.1.6. Veniamo infine alla condizione (V), cioè al requisito che “7 (wz) e 2(wz)? e “î(wz) é 2(wz)” debbano essere privi di significato. % Se si applica la definizione (D1) all'espressione ‘“?(wz) e Z(wz)”, si giunge, attraverso la definizione (D3), a:
(Ap)(M(p!x= va) A PP! Z)). Questa — osserva Russell — è tuttavia un’espressione priva di senso, poiché in essa compare il simbolo @!(@!Z)”, che è privo di significato secondo la teoria dei tipi. In modo del tutto analogo vanno le cose con ‘2(wz) & 2(wz)”. Quindi, anche la condizione (V) è verificata. (9
3.2. CONVENZIONI D’AMBITO E QUANTIFICAZIONE 3.2.1. La teoria delle classi dei Principia è identica a quella delineata in “Mathematical logic...” ma, come ci si può aspettare, la trattazione dei Principia è più accurata e completa di quella contenuta nel saggio del 1907. Certi particolari sono chiariti solo nei Principia. Un esempio è costituito dalle convenzioni per stabilire l’ambito di un simbolo di classe. La necessità di stabilire l’ambito dei simboli di classe è del tutto analoga a quella di stabilire l’ambito di una descrizione definita. Infatti — sulla base della (D1) — un enunciato in cui compare un simbolo di classe si può parafrasare in modi diversi, a seconda che l’intero enunciato, oppure solo una sua parte, sia considerato come l’“Y° della (D1) — cioè come l’espressione da cui il simbolo di classe dev'essere eliminato in base alla definizione contestuale. Formalmente, nei Principia si stabilisce che l’ambito di un simbolo di classe ‘“ 2(@2z)” sia indicato — in modo analogo all’ambito di una descrizione definita — facendo precedere il simbolo ‘“[ Z (@z)]” all'espressione tra parentesi che costituisce l’ambito di “Z(@z)”. In pratica, però, il ricorso agli indicatori d’ambito è sempre evitato, utilizzando la convenzione — identica all’analoga convenzione stabilita per le descrizioni definite — che l'ambito di un simbolo di classe, se non specificamente indicato, sia sempre costituito dal più piccolo sottoenunciato (chiuso o anche aperto) cui il simbolo di classe appartiene.?? Un secondo esempio è la maggior cura posta nell’introduzione di singole lettere al posto dei simboli di classe. C'è qui infatti un problema, che nei Principia è esposto come segue: ..] “f(@”, dove è una classe variabile, è in realtà “{ î(@2z)}”, dove @ è una funzione variabile, cioè, è
Ci): px= vix.fiy!î}”,
dove @ è una funzione variabile. Ma qui sorge una difficoltà [...]. Perché le funzioni determinanti @ 2, w î, ecc. saranno di tipi differenti, sebbene l’assioma di riducibilità ci assicuri che alcune di esse sono funzioni predicative. Allora, nell’interpretare
@ come
una variabile in termini della variazione di qualsiasi funzione determinante, saremo indotti in errore a meno che non ci si limiti alle funzioni determinanti di specie predicativa.*°
La difficoltà indicata da Russell è che in
3° Per quanto segue, v. [PM], vol. I, introduzione, cap. 3, p. 79. 355 V. [PM], vol. I, introduzione, cap. 3, p. 80.
°°° Ibid.
La teoria dei tipi dei Principia
763
(DI) f(î(v2) = AP)(M(p!x= ya) Afp! È) ‘“Ww° non è una variabile, ma una lettera schematica, e quindi non è vincolabile da un quantificatore. Ciò impedi-
sce di interpretare una quantificazione su classi come una quantificazione su funzioni arbitrarie che determinano queste classi. Russell risolve il problema ponendo:
fa=a AP)(M(0!x= v!x) A f(p!1 2); una funzione di y, f& sta per: dove “fa è un’abbreviazione per “f{ î (1 2)}”. Poiché fa è, in realtà, AP.(M(0!x=
w!x) Af(p!£))*
e (0) f(0) sta per: (MAP)
(!x=
y! x) A f(! 2a) sa
mentre (41) f(0) sta per:
AVvAP)(@(0!1x= vv) Af(p! i)” dove si quantifica solo su funzioni predicative. Il tutto funziona grazie all’assioma di riducibilità. Infatti, quest’assioma stabilisce che per qualsiasi funzione ce n'è sempre una predicativa che è ad essa formalmente equivalente e quindi — poiché funzioni formalmente equivalenti determinano la medesima classe — il considerare solo le classi determinate da funzioni predicative non comporta l’omissione di nessuna classe (v. sopra, $ 3.1.3, teorema (T2)). 3.2.2. Nei Principia, Russell correla in modo esplicito la teoria delle classi con la sua teoria delle descrizioni definite: I simboli per le classi, come quelli per le descrizioni, sono, nel nostro sistema, simboli incompleti: sono definiti i loro usi, ma non si assume affatto che essi stessi significhino qualcosa. Vale a dire, gli usi di tali simboli sono definiti in modo che, quando il definiens è sostituito al definiendum, non rimanga più alcun simbolo che si potrebbe supporre rappresentare una classe. Così le classi, nella misura in cui le introduciamo, sono meramente delle comodità simboliche o linguistiche, non degli oggetti definiti come sono i loro membri se essi sono individui.*°'
Naturalmente, essere in grado di parafrasare gli enunciati in cui compaiono simboli per le classi in modo che nel definiens non compaia alcun simbolo per le classi non equivale all’asserzione che non vi siano classi — così come, per esempio, essere in grado di parafrasare un enunciato in cui compare la descrizione “l’attuale presidente degli Stati Uniti” in modo che nel definiens la descrizione non compaia più, non equivale ad asserire che non vi sia un attuale presidente degli Stati Uniti. Russell ne è perfettamente consapevole. Nei Principia si legge: «Non è necessario per i nostri propositi [...] asserire dogmaticamente che non vi sono cose come le classi». Nella successiva Introduction to Mathematical Philosophy Russell spiega: [...] diventa molto difficile vedere che cosa possano essere [le classi], se devono essere più che finzioni simboliche. E se riusciamo a trovare un modo qualsiasi di trattare con esse come finzioni simboliche, aumenteremo la sicurezza logica della nostra posizione, poiché eviteremo la necessità di assumere che ci sono classi senza essere costretti a fare l’assunzione opposta che non vi sono clas-
si. Noi semplicemente ci asteniamo da entrambe le assunzioni. Questo è un esempio del rasoio di Occam, cioè, “Le entità non si devono moltiplicare senza necessità”. Ma quando rifiutiamo di asserire che ci sono classi, non si deve supporre che asseriamo dog-
37 V. ibid. 358 V. [PM], vol. I, introduzione, cap. 3, p. 81.
39 V. ibid. e vol. I, *20.07. 360 V_ [PM], vol. I, #20.071. 3°! [PM], vol. I, introduzione, cap. 3, pp. 71-72. 3° [PM], vol. I, introduzione, cap. 3, p. 72.
capitolo 11
764
IORO.0O, FINERT, : o: x È maticamente che non ve ne sia nessuna. Siamo semplicemente agnostici riguardo ad esse: come Laplace, possiamo dire, “je n'ai 363 Ho +39) SI MTTE O pas besoinsi de cette hypothèse” [Non ho bisogno diS quest’ipotesi”].
La teoria dei Principia è dunque una “teoria senza classi” non nel senso che rifiuti l’esistenza di entità come le classi e le relazioni in estensione, ma nel senso che considera queste supposte entità come superflue allo sviluppo della matematica. Nello stesso scritto della fine del 1905 “On some difficulties in the theory of transfinite numbers and order types” in cui proponeva per la prima volta una “teoria senza classi”, Russell puntualizzava che tale teoria è agnostica, riguardo all'esistenza di classi e relazioni in estensione: In questa teoria le classi e le relazioni sono completamente bandite. [...] Non è necessario alla teoria SE IRLO che nessuna funzioQUtO
:
FESSO
ca
N
5
CRT
5
5
0
ne determini classi e relazioni; tutto ciò che è essenziale alla teoria è astenersi dall’assumere il contrario.
In altri scritti, tuttavia, Russell rivela quell’atteggiamento affatto negativo, nei confronti dell’esistenza di classi e relazioni in estensione, che di certo aveva costituito il suo movente nell’elaborazione di teorie che non richie-
dessero il riferimento a simili entità. Per esempio, nel saggio del 1906 “On the substitutional theory of classes and relations” — poi non pubblicato, all’epoca —, Russell afferma: «[...] non ci sono cose come le classi, e le asserzioni apparentemente vertenti su una classe saranno significanti solo quando possono essere analizzati in asserzioni vertenti su tutti o qualcuno dei membri della classe».?° Più tardi, nell’articolo del 1910 “Some explanations in reply to Mr. Bradley”, Russell sembra in effetti sostenere che il paradosso di Russell implica che non esistano classi: Ho tuttavia scoperto, da quel tempo [l'epoca dei Principles], che è possibile dare un’interpretazione a tutte le proposizioni che verbalmente impiegano classi, senza assumere che ci siano realmente cose come le classi. [...]. Che sia privo di significato (come sostiene Mr. Bradley) considerare una classe come membro o non membro di se stessa, deve assumersi per evitare una contraddizione [...] matematica; ma non so vedere come ciò potrebbe essere privo di significato se ci fossero cose come le classi.99
In uno spirito simile, in My Philosophical Development (1959), Russell fornisce la seguente “dimostrazione” che le classi non possono essere “cose”: Per metterla in un linguaggio logico: una classe di n termini ha 2” sottoclassi. Questa proposizione è ancora vera quando n è infinito. Ciò che ha provato Cantor è che, anche in questo caso, 2” è più grande di n. Applicando questo; come ho fatto, a tutte le classi dell’universo, si giunge alla conclusione che ci sono più classi di cose di quante siano le cose. Ne segue che le classi non sono “cose”. [...] La conclusione a cui fui condotto fu che le classi sono meramente una convenienza nel discorso.?9”
Come ha osservato Chihara ([1973]), in riferimento a quest’ultimo brano, quando Russell trae la conclusione che le classi non sono “cose”, conclude troppo: Questo si può vedere come segue: Se seguiamo il ragionamento di Russell, possiamo inferire dal teorema di Cantor che, se ogni classe fosse una cosa, vi sarebbero più cose di quante sono le cose. Poiché dall’ipotesi che ogni classe è una cosa segue un’assurdità, possiamo concludere che non tutte le classi sono “cose”. Ma la conclusione implica solo che alcune classi non sono “cose”
.398
La stessa obiezione vale, naturalmente per il passo prima riportato di “Some explanations in reply to Mr. Bradley”. Per esempio, si potrebbe sostenere che le classi sono cose, ma che non esiste una classe di tutte le cose, né una classe di tutte le classi, né una classe di tutte le classi che non appartengono a se stesse. Oppure si potrebbe sostenere che le classi sono cose, ma cose che si suddividono in tipi diversi, in modo che il tipo di una classe debba essere sempre superiore al tipo dei suoi membri. Vi sono in effetti molti sistemi che assumono un’ontologia di classi, senza con ciò incorrere in paradossi.5°° Ma questi argomenti di Russell contro l’esistenza di classi, sebbene non conclusivi — e probabilmente non ritenuti tali neppure dal suo autore, a giudicare dall’agnosticismo professato in altri scritti più ufficiali —,
363 304 365 366 307 368
Russell Russell Russell Russell Russell Chihara
[1919a], cap. 12, p. 184. [19062], $ II, p. 154. [1906c], p. 166. [1910d], p. 357. [1959], cap. 7, pp. 80-81. [1973], cap. 1, p. 59.
3©° In proposito, v. sotto, cap. 12.
ebbero indubbiamente
un’importanza euristica fondamentale,
nell’adozione di
La teoria dei tipi dei Principia
765
una teoria logico-matematica che non richieda il riferimento a classi. E la struttura di questi argomenti fornisce, credo, una buona conferma della nostra tesi secondo cui le funzioni proposizionali dei Principia non sono entità extralinguistiche. Infatti, si osservi che entrambi gli argomenti contro l’esistenza di classi — sia quello derivato dal paradosso di Russell, sia quello derivato dal teorema di Cantor — si applicherebbero ugualmente alle funzioni proposizionali in senso ontologico.
4. LA SOLUZIONE DEI PARADOSSI NEI PRINCIPIA Il paragrafo VIII del secondo capitolo dell’introduzione ai Principia — intitolato “Le contraddizioni” — è interamente dedicato alla soluzione dei paradossi nel contesto della teoria ramificata dei tipi. La prima parte del paragrafo consiste nella ripresa — quasi parola per parola — della parte iniziale di “Mathematical logic...”.??° Si fornisce innanzi tutto una breve descrizione dei paradossi, nell’ordine: (1) Il paradosso di Epimenide. (2) Il paradosso di Russell riferito alle classi. (3) Il paradosso di Russell riferito alle relazioni in estensione. (4) Il paradosso di Burali-Forti.
(5) Il paradosso di Berry. (6) Il paradosso di K6nig.
(7) Il paradosso di Richard. Russell sostiene che, in tutte queste contraddizioni «c’è una caratteristica comune, che si può descrivere come au=; 5 RIA toreferenza o riflessività»:” In ciascuna contraddizione si dice qualcosa circa tutti i casi di un certo genere, e da quanto si dice sembra generarsi un nuovo caso il quale nel contempo è e non è dello stesso genere dei casi considerati come zutti in ciò che si diceva. Ma questa è la caratteristica delle totalità illegittime, come le abbiamo definite formulando il principio del circolo vizioso. Quindi tutte le nostre contraddizioni sono illustrazioni di fallacie del circolo vizioso.”
Come già nell’articolo del 1907, Russell non traccia alcuna differenza tra paradossi “logici” (o ‘“insiemistici”) e “semantici”, ma sostiene che la medesima fallacia sia all'origine di tutti i paradossi. Nella seconda parte del paragrafo — che è nuova —, Russell mostra come la sua gerarchia dei tipi sia sufficiente a evitare le antinomie note. 4.1. Il paradosso di Epimenide è il primo ad essere trattato.??? La soluzione è quella già indicata in “Mathematical logic...”.”* Per il principio del circolo vizioso, non può esistere una totalità di tutte le proposizioni. Se Epimenide afferma: “Esiste una proposizione p di ordine n che io sto affermando e che è falsa”, questa proposizione contiene una quantificazione sulle proposizioni di ordine n: non può dunque, essa stessa, essere di ordine n, ma dovrà essere di ordine n + 1. Così l'affermazione di Epimenide non ricade nel proprio ambito, e la contraddizione scompare. Ma che cosa accade — si chiede Russell — se si considera l’asserzione “Io sto mentendo” come un modo sintetico di fare contemporaneamente tutte le seguenti asserzioni: “Io sto asserendo una proposizione falsa del primo ordine”, “To sto asserendo una proposizione falsa del second’ordine”, e così via? Ci troviamo allora in una situazione curiosa: Poiché non si asserisce nessuna proposizione primo ordine” è falsa. Quest’asserzione è cond’ordine” è vera. Questa è un’asserzione l’asserzione “Io sto facendo un’asserzione
del primo ordine, l’asserzione [statement] “Io sto asserendo una proposizione falsa del del second’ordine, quindi l’asserzione “Io sto facendo un’asserzione falsa del sedel terzo ordine, ed è la sola asserzione del terzo ordine che si sta facendo. Quindi falsa del terzo ordine” è falsa. Così vediamo che l’asserzione “Io sto facendo
370 V. [PM], vol. I, introduzione, cap. 2, $ VIII, pp. 60-61. 37! [PM], vol. I, introduzione, cap. 2, $ VII, p. 61. 38 [PM], vol. I, introduzione, cap. 2, $ VIII, p. 62.
393 V. [PM], vol. I, introduzione, cap. 2, $ VIII, p. 62. 374 V. sopra, cap. 9, $ 3.
capitolo 11
766
un’asserzione falsa di ordine 2n + 1” è falsa, mentre l’asserzione “Io sto facendo un’asserzione falsa di ordine 2n°° è vera. Ma in . 375 DE gs questo stato di cose non c’è contraddizione.
Con un’immagine, potremmo dire che quello che era un processo circolare diventa — con la teoria degli ordini — un processo a spirale ascendente: i cicli di vero e falso si riproducono, ma con una continua elevazione di ordia : c : n 3. CE î pi_sG 376 ni che impedisce il chiudersi di un circolo, bloccando la contraddizione.
4.2. Nei Principia è poi spiegato come si risolve il paradosso di Russell, sia nella sua formulazione riguardante le classi, sia nella formulazione riguardo alle relazioni in estensione.?”” La spiegazione è schematica, perché, a quel punto dell’introduzione dei Principia, non è stata ancora delineata la teoria delle classi. Noi però abbiamo già visto con precisione, nel precedente $ 3.1.6, come nei Principia sia risolto il paradosso della classe di tutte le classi che non appartengono a se stesse: espressioni quali “7 (wz) e Z(wz)? e “Z(w2z) € Z(w2z)” risultano prive di senso perché, se si applica ad esse la definizione (D1), si giunge, attraverso la definizione (D3), a espressioni contenenti simboli della forma “@!(@!?)”, che sono privi di senso (malformati), secondo la teoria dei tipi dei Principia. Il paradosso di Russell riguardo alle relazioni in estensione è risolto nello stesso modo. La contraddizione sorge considerando una relazione in estensione che sussiste tra due relazioni in estensione R e S ogni volta che R non ha la relazione R con S. Ma espressioni come “R ha la relazione R con S”, o “R non ha la relazione R con $”, sono
prive di senso, nella teoria dei Principia. Infatti, supponendo che la relazione R sia *} @(x, y), e la relazione S sia XY W(x, y), “R ha la relazione R con S”, diviene:
XD P(x, Y{(£$ P(x, Y)} I} VA, Y): applicando a questa formula la definizione
(D2) f( YA, Y)) sa AP(MO(P! x) = va, )) AF(P!(£, 3) e utilizzando la definizione dei Principia, analoga alla (D3):
(D3) x(P!(x,P))y =a P!(x, 9),
378
si ottiene infine una formula in cui compare un simbolo della forma “X!{(X!(*,3),
7(*,3)}”, che è malfor-
mato, secondo la teoria dei tipi dei Principia, perché una variabile funzionale compare nel posto di argomento di se stessa.
4.3. La soluzione del paradosso di Burali-Forti era già stata descritta in modo esauriente in “Mathematical lo3 dA d È SELES È 380 è < 2 à x È 6 gic...”;”° l’analisi dei Principia è la medesima: un numero ordinale è una classe di serie, quindi una classe di De) [PM], vol. I, introduzione, cap. 2, $ VIII, p. 62.
270 Un'analisi simile del paradosso sarà ripresa da Russell in An Inquiry into Meaning and Truth, dove, tuttavia, egli sostiene una gerarchia di linguaggi ispirata ai lavori di Tarski e Carnap (v. sopra, $ 1.4): «Il più semplice di questi [paradossi] è “Io sto mentendo”. Questo è suscettibile di un numero infinito di significazioni [significations: è il termine che in questo libro Russell adopera per indicare il senso degli enunciati, in contrapposizione a meaning, usato per il senso delle parole (entrambi sono concepiti in modo psicologico-comportamentale)], ma nessuna di esse è davvero ciò che avremmo pensato di intendere. Se intendiamo “Io proferisco [uter] una proposizione falsa nel linguaggio primario”, stiamo mentendo, poiché questa è una proposizione nel linguaggio secondario; l’argomento che, se stiamo mentendo, stiamo dicendo il vero, viene meno, poiché la nostra asserzione [statement] falsa è del second’ordine e noi abbiamo detto di aver proferito un’asserzione falsa del primo ordine. Similmente se intendiamo “Io proferisco una proposizione falsa di ordine n”. Se provo a dire “Io proferisco una proposizione falsa del primo ordine, e similmente una del secondo, del terzo, quarto... ad infinitum”, asserirò simultaneamente (se fosse possibile) un numero infinito di proposizioni, di cui la 1°,
3°, 5°... sarebbero false, la 2°, 4°, 6°... vere» (Russell [1940], cap. 13, A, p. 174). 371 V. [PM], vol. I, introduzione, cap. 2, $ VII, pp. 62-63. Naturalmente, il paradosso di Russell riferito alle relazioni in intensione è risolto
immediatamente dalla considerazione che una funzione, nel contesto della teoria dei tipi, non può essere un argomento di se stessa.
278 V. [PM], vol. I, #21.02.
SAC sopra, cap. 9, $ 7.1.4.
380 V. [PM], vol. I, introduzione, cap. 2, $ VII, p. 63.
La teoria dei tipi dei Principia
767
relazioni. Pertanto una serie di numeri ordinali è una relazione tra classi di relazioni, ed è di tipo diverso da qualsiasi numero che sia membro di quella serie. Questo ragionamento si può ripetere per i tipi successivi. Dunque, la soluzione consiste nell’ammettere che, per ogni tipo di numeri ordinali, vi sia un numero ordinale massimo. Il numero ordinale di tutti i numeri ordinali di quel tipo non è però un numero ordinale dello stesso tipo, e quindi non sorge nessuna contraddizione dal fatto che esso sia più grande di tutti i numeri del primo tipo. 4.4. La soluzione dei paradossi di Berry, K6nig, e Richard è esposta più chiaramente nei Principia*! di quanto non fosse in “Mathematical logic...”.?*° Il paradosso di Berry — cioè il paradosso circa “il primo intero non nominabile in meno di ventitré sillabe” — contiene, secondo Russell, una fallacia del circolo vizioso, poiché la parola “nominabile” si riferisce alla totalità dei nomi, e tuttavia si consente che essa compaia in ciò che si dice essere uno dei nomi. “Nominabile” non può dunque riferirsi alla totalità dei nomi. In effetti — afferma Russell — la teoria dei tipi rende impossibile una tale totalità: Possiamo, in realtà, distinguere nomi di diversi ordini come segue: (a) I nomi elementari saranno tali da essere veri “nomi propri”, ossia appellativi convenzionali che non involgono alcuna descrizione. (6) I nomi di primo ordine saranno tali da involgere una de-
scrizione per mezzo di una funzione di primo ordine; vale a dire, se @! % è una funzione di primo ordine, “il termine che soddisfa @! %” sarà un nome di primo ordine, anche se non sempre ci sarà un oggetto nominato da questo nome. (c) I nomi di second’ordine saranno tali da involgere una descrizione per mezzo di una funzione di second’ordine; tra questi nomi saranno quelli che involgono un riferimento alla totalità di nomi di primo ordine. E possiamo procedere così per tutta una gerarchia. Ma a nessuno stadio possiamo dare un significato alla parola “nominabile” senza specificare l’ordine dei nomi da impiegare; e qualsiasi nome in cui compaia l’espressione “nominabile con nomi di ordine n’ è necessariamente di un ordine più alto dell’n-esimo. E così il paradosso scompaTe 383
Le soluzioni dei paradossi di K6nig e Richard proposte da Russell sono del tutto analoghe alla precedente: La nozione di “definibile” che compare in entrambi, è pressoché la stessa di quella di “nominabile”, che compare nel nostro quinto paradosso: “definibile” è ciò che “nominabile” diviene quando si escludono i nomi elementari, ossia “definibile” significa “nomi-
nabile con un nome che non è elementare”. Ma qui vi è la stessa ambiguità riguardo al tipo che c’era prima, e la stessa necessità di aggiungere parole che specifichino il tipo cui la definizione deve appartenere. E comunque il tipo possa essere specificato, [nel paradosso di Kénig] “il primo ordinale non definibile con definizioni di questo tipo” è una definizione di tipo più alto; e nel paradosso
di Richard, quando ci limitiamo, come dobbiamo, a decimali che hanno una definizione di un tipo dato, il numero N, che causa il paradosso, ha una definizione che appartiene a un tipo più alto, e così non rientra nell’ambito delle nostre precedenti definizioni.?**
4.5. Russell conclude osservando che «[u|n numero indefinito di altre contraddizioni, di natura simile alle sette
precedenti, può essere prodotto facilmente», ni come
e che in tutti la contraddizione si produce per l'ambiguità di termi-
“vero”, “falso”, “funzione”, “proprietà”, “classe”, “relazione”, “numero cardinale”, “numero ordinale”, ee
386
;
}
;
.
;
“nome”, “definizione”.°°° In ogni caso, i paradossi sorgono — secondo Russell — dal trascurare che ciascuno di questi termini non rappresenta una sola nozione, ma molte, di diversi tipi logici. La base di tutto è, ovviamente, il principio del circolo vizioso. Russell ritiene tuttavia che sia conveniente continuare a usare simboli ambigui rispetto al tipo logico, servendosi dell’espediente dell’ambiguità sistematica: Tali parole e simboli [ambigue rispetto al tipo] abbracciano praticamente tutte le idee di cui si occupano la matematica e la logica matematica: l’ambiguità sistematica [systematic ambiguity] è il risultato di un’analogia sistematica. Vale a dire, in quasi tutti i ragionamenti che costituiscono la matematica e la logica matematica, usiamo idee che possono ricevere una qualsiasi di un numero infinito di differenti determinazioni di tipo [typical determinations], ciascuna delle quali lascia il ragionamento valido. Così attraverso l’impiego di parole e simboli tipicamente ambigui [{ypica/ly ambiguous], siamo in grado di fare un’unica catena di ragiona-
mento applicabile a ciascuno di un numero infinito di differenti casi, il che non sarebbe possibile se dovessimo rinunciare all’uso di parole e simboli tipicamente ambigui.?*”
381 Vv. [PM], vol. I, introduzione, cap. 2, $ VIII, pp. 63-64. S*RAVA sopra, cap. 9, $ 3. Il paradosso di Grelling non è menzionato né in “Mathematical logic...” né nei Principia. 383 [PM], vol. I, introduzione, cap. 2, $ VIII, p. 64.
384 Ibid. 385 Ibid. 380 V. Ibid.
387 [PM], vol. I, introduzione, cap. 2, $ VII, p. 65.
768
capitolo 11
Se una formula A dei Principia si dimostra valida, allora è valida anche la formula A* che deriva dall’elevazione di un’unità di tutti gli indici di tipo presenti in A. Così si dimostra valida un'infinità di formule che hanno la stessa forma tranne che per gli indici che segnalano i tipi delle variabili. L’espediente dell’ambiguità sistematica utilizzato nei Principia consiste nell’evitare di specificare l’ordine e il tipo delle variabili e delle costanti che compaiono nelle formule. Questo, tuttavia, non comporta affatto un ritorno alle difficoltà del linguaggio comune. Infatti, un’espressione in cui i tipi non sono specificati non è affatto un’espressione che non tiene conto delle differenze di tipo, ma uno schema che sintetizza un numero infinito di espressioni contenenti variabili i cui tipi non vìolano le restrizioni della teoria ramificata dei tipi — una cosa che sarebbe impossibile, per esempio, con uno schema come “!(@! È)”, perché non esiste nessuna assegnazione di variabili alla lettera schematica “@! 2” che possa dare una formula che non vìoli la teoria dei tipi. In questo capitolo, per non distaccarci troppo dall’esposizione di Russell e Whitehead, abbiamo trattato le lettere tipicamente ambigue dei Principia come variabili appartenenti al linguaggio oggetto; ma esse sono, a rigore, delle lettere schematiche (metalinguistiche) che stanno al posto di variabili del linguaggio oggetto. L’uso dell’espediente dell’ambiguità sistematica chiarisce, a mio avviso, il motivo per cui, sebbene le funzioni proposizionali dei Principia siano solo simboli, nel secondo volume dell’opera si introduce anche il concetto di “forma simbolica” di una funzione proposizionale. Riportiamo ancora, per comodità, il brano rilevante: E conveniente chiamare la forma simbolica di una funzione proposizionale semplicemente “forma simbolica”. Così, se una forma simbolica contiene simboli di tipo ambiguo essa rappresenta [represents] diverse funzioni proposizionali secondo come sono diversamente stabiliti i tipi dei suoi simboli ambigui.3**
Nel $ 1.1, questo passo ci aveva indotto a sospettare che le funzioni proposizionali dei Principia fossero entità intensionali. Non è così. Gli autori dei Principia parlano di ‘forma simbolica” di una funzione proposizionale perché cercano di spiegare la differenza tra schemi di funzioni proposizionali — che, a rigore, non appartengono al linguaggio oggetto dei Principia — e funzioni proposizionali — che invece sono simboli di tale linguaggio oggetto. Russell e Whitehead esprimono ciò dicendo che alcune “forme simboliche” (gli schemi) contengono ‘simboli di tipo ambiguo” (cioè, lettere schematiche che tengono il posto di variabili dei Principia), e pertanto “rappresentano” (schematizzano) diverse funzioni proposizionali (una per ogni assegnazione di variabili alle sue lettere schematiche). Ciò non si applica, naturalmente,
alle “forme simboliche” che, non contenendo
“simboli di tipo
ambiguo” (lettere schematiche), appartengono al linguaggio oggetto dei Principia e dunque “rappresentano” una sola funzione proposizionale.
8 [PM], vol. II, “Prefatory statement of symbolic conventions”, p. xii.
CAPITOLO ALTERNATIVE,
12
CRITICHE E PROPOSTE DI EMENDAMENTO AL SISTEMA DEI PRINCIPIA
1. LA TEORIA ASSIOMATICA
DEGLI INSIEMI
A proposito della teoria dei tipi sostenuta nei Principia, in My Philosophical Development (1959) Russell osserva: «Devo ammettere che questa dottrina non ha ottenuto un largo consenso».
In effetti, alla metà del Nove-
cento la teoria dei tipi dei Principia era generalmente abbandonata. Ancora molto diffusa verso la metà degli anni Venti del Novecento, la teoria ramificata dei tipi fu poi generalmente rimpiazzata dalla teoria semplice dei tipi (v. sotto, $ 2.7), sostenuta inizialmente da Ramsey. Quest'ultima teoria raggiunse il suo apogeo tra la fine degli anni Venti e l’inizio degli anni Trenta, ma successivamente,
nel corso degli anni Trenta e Quaranta, anche la teoria
semplice dei tipi cedette gradualmente il passo, negli studi fondazionali, alla teoria assiomatica degli insiemi. La prima teoria assiomatica degli insiemi risaliva a molti anni prima: essa fu proposta da Ernst Zermelo in un articolo dal titolo “Untersuchungen iber die Grundlagen der Mengenlehre” (“Ricerche sui fondamenti della teoria degli insiemi”), terminato nel luglio del 1907 e pubblicato all’inizio del 1908 — proprio lo stesso anno in cui vedeva la luce la teoria ramificata dei tipi di Russell. Inizialmente, l’assiomatizzazione di Zermelo non ricevette un largo consenso, ma dalla fine degli anni Dieci del
Novecento la sua teoria si diffuse, dapprima tra i matematici che non si occupavano direttamente della questione dei fondamenti della loro scienza. Già nel 1922 Thoralf Skolem poteva osservare: Finora, per quanto ne so, solo un sistema di assiomi del genere [che permetta, cioè, la dimostrabilità di ciò che è matematicamente utile, evitando le contraddizioni] ha riscosso un’accettazione pressoché generale, cioè, quello costruito da Zermelo [1908]. Anche Russell e Whitehead hanno costruito un sistema di logica che fornisce una fondazione per la teoria degli insiemi; se non sbaglio, tuttavia, i matematici hanno avuto per esso uno scarso interesse.”
Si può congetturare che uno dei motivi della preferenza dei matematici praticanti per la teoria di Zermelo — certo non il più profondo, ma probabilmente uno dei più influenti — fosse che la teoria dei tipi era più scomoda da utilizzare di quella di Zermelo, nella cui sintassi formale non si fa uso di variabili con indici di tipo: cosa che non solo evita di dover continuamente prestare attenzione a non violare le restrizioni di tipo, ma lascia anche disponibili apici e pedici per altri usi matematici.* Durante gli anni Venti, il sistema di Zermelo fu perfezionato da altri autori e dallo stesso Zermelo, dando luogo alla cosiddetta (con una denominazione risalente a von Neumann [1928b] e a Zermelo [1930a]) teoria degli insiemi di Zermelo-Fraenkel, che gradualmente divenne la teoria assiomatica degli insiemi più celebre e utilizzata, fino ad essere spesso considerata, dalla seconda metà del Novecento, come /a teo-
ria assiomatica degli insiemi. Un’altra teoria assiomatica degli insiemi molto nota — quella di von Neumann-Bernays-Gòdel — costituisce una modificazione del sistema di Zermelo. Un tratto che accomuna la teoria di Zermelo con quella di von Neumann-Bernays-Gédel, è la presenza in esse di assiomi di comprensione che non permettono la formazione di insiemi (cioè di molteplicità che si possono considerare come unità) “troppo grandi”. Ciò accosta queste teorie assiomatiche a due proposte informali precedenti: da un lato, quella cantoriana di distinguere tra molteplicità consistenti (cioè molteplicità che si possono raccogliere in insiemi) e molteplicità inconsistenti (aventi un tipo
' Russell [1959], cap. 7, p. 83. Russell aggiunge però: «ma non ho visto nessun argomento contro di essa che mi sia parso cogente».
? Skolem [1923], p. 291. 3 In una teoria dei tipi, si può certamente evitare di usare indici di tipo ricorrendo all’espediente dell’ambiguità sistematica già usato nei Principia (v. sopra, cap. 11, $ 4.5): si tratta di utilizzare, al posto delle formule recanti indici di tipo, schemi di formule che sussumano tutte le formule che sono ottenibili da quegli schemi sostituendo alle lettere schematiche, prive di indici di tipo, variabili con indici di tipo appropriati. Questo, tuttavia, richiede una particolare attenzione a non violare le restrizioni di tipo. Per esempio, sebbene gli schemi “x € y” e “ye x” siano entrambi legittimi, perché si possono considerare come abbreviazioni di formule ben formate della teoria dei tipi, la loro congiunzione “x € y A y € x” non è uno schema legittimo della teoria dei tipi con ambiguità sistematica.
capitolo 12
770
d’infinità assoluta, non raccoglibile in un insieme);* dall’altro, quella russelliana della “teoria della limitazione di grandezza”. In questo paragrafo, descriveremo la teoria assiomatica degli insiemi nella versione originale di Zermelo, per poi passare a esaminarne la genesi storica, i principali sviluppi e modifiche, il possibile fondamento filosofico e le differenze più importanti rispetto alla teoria dei Principia. Infine, cercheremo di comprendere le ragioni per cui Russell non considerò la teoria di Zermelo come un’alternativa soddisfacente alla propria teoria dei tipi.
1.1. LA TEORIA ASSIOMATICA DI ZERMELO 1.1.1. GLI ASSIOMI DEL 1908 L’articolo di Zermelo “Untersuchungen iiber die Grundlagen der Mengenlehre” inizia con il porre lo stesso tipo di problemi posti da Russell nel coevo “Mathematical logic...”. Zermelo osserva che la teoria degli insiemi «sembra minacciata, nella sua stessa esistenza, da certe contraddizioni o “antinomie’” che si possono dedurre dai suoi
principi dati, in apparenza necessari, e non hanno ancora trovato una soluzione del tutto soddisfacente».° In particolare — continua Zermelo — a causa dell’antinomia di Russell, non è più ammissibile sostenere che ogni proprietà definisca, come sua estensione, un insieme; quindi la “definizione” di “insieme” di Cantor richiede certa-
mente delle restrizioni. Ma finora — prosegue Zermelo — non è stato possibile rimpiazzare la definizione di Cantor con un’altra che sia altrettanto semplice, ma non dia luogo agli stessi problemi. Data questa situazione — cioè che principi logici considerati intuitivamente evidenti conducono a contraddizioni, e che non si riesce a sostituirli con altri principi che abbiano lo stesso carattere d’evidenza, e non portino a contraddizioni — Zermelo propone di «seguire la strada opposta e, partendo dalla teoria degli insiemi storicamente in essere, cercare quali principi sono necessari per la fondazione di questa disciplina matematica».” Questi principi — aggiunge Zermelo — da un lato devono essere abbastanza restrittivi da escludere tutte le contraddizioni, dall’altro devono essere abbastanza permissivi da conservare tutti i risultati validi della teoria degli insiemi. Nell’articolo che stiamo esaminando, lo scopo di Zermelo è mostrare che l’intera teoria degli insiemi creata da Cantor e Dedekind può essere ridotta a poche definizioni e a sette assiomi mutuamente indipendenti. Dopo avere enunciato gli assiomi, Zermelo spiega in che modo questi consentano di evitare i paradossi logici noti e derivada essi alcuni importanti teoremi — come il teorema di equivalenza (o di Schròder-Bernstein) e il teorema di Cantor. La teoria degli insiemi — dice Zermelo — riguarda un certo dominio D d’individui, tra cui vi sono gli insiemi. Gli assiomi di tale teoria sono enunciati da Zermelo in modo informale; per maggiore chiarezza, ne offriremo una trascrizione simbolica, usando due stili di variabili: lettere maiuscole per indicare insiemi e lettere minuscole per indicare qualsiasi genere di entità, insiemi inclusi. Essi sono i seguenti: ASSIOMA I (Axiom der Bestimmtheit: assioma di estensionalità). Se ogni elemento di un insieme M è anche un elemento di un insieme N, e viceversa, allora M = N. In simboli:
(M)MN(Akxe M=xe
MIM=N.
ASSIOMA II (Axiom der Elementarmengen: assioma degli insiemi elementari). Si scompone in tre parti: (a) Esiste un insieme — che Zermelo qualifica come “improprio” (uneigentliche) — che non ha nessun elemento: l'insieme vuoto (Nullmenge). In simboli:
AE sopra, cap. 4, $ 2.1.3. Va sopra, cap. 8, $ 3.
° Zermelo [1908], p. 261 (in Zermelo [2010], p. 188, trad. ingl. a fronte, e in van Heijenoort (ed.) [1967], p. 200). Come ha sostenuto G. H. Moore, ([1982], prologo; p. 2; cap. 3, p. 143, e $ 3.2, pp. 157-160; cap. 4, $ 4.9, p. 260; $ 4.10, p. 282), la motivazione primaria che spinse Zermelo ad assiomatizzare la teoria degli insiemi non fu la preoccupazione per i paradossi, ma il desiderio di difendere la sua prima dimostrazione del teorema del buon ordinamento (in Zermelo [1904]; v. sopra, cap. 4, $ 4.2.3.1). Ma si deve osservare che le due cose si rivela-
rono subito strettamente relate: l'esigenza improrogabile di fondare la teoria degli insiemi su basi chiare emerse infatti con evidenza nel dibattito seguito alla prima dimostrazione zermeliana del teorema del buon ordinamento: molte obiezioni alla dimostrazione — in particolare quelle di Schoenflies, di Bernstein, di Hobson, di Hardy, e di Poincaré (v. ancora sopra, cap. 4, $ 4.2.3.1) — mettevano infatti in luce uno stato di confusione, nelle basi della teoria degli insiemi, che minacciava non solo i fondamenti, ma anche la possibilità di nuove acquisizio-
ni matematiche. Questo spiega l’ incipit Zermelo [1908]. ” Zermelo [1908], p. 261 (in Zermelo [2010], p. 190, trad. ingl. a fronte, e in van Heijenoort (ed.) [1967], p. 200).
Alternative, critiche e proposte di emendamento al sistema dei Principia
prA
(IM)()-(x e M). Per l’assioma di estensionalità, quest’insieme è unico: possiamo dunque dargli un nome, chiamandolo “A”, “insieme vuoto”. (Ciò si ottiene ponendo la definizione:
(M(A=M=(-(xe (b)
Se aè fe
M).)
un qualsiasi oggetto del dominio, esiste un insieme {a} che contiene come elemento solo a. In simbo-
MEMxe
Ma)
M=y=x).
Per l’assioma di estensionalità, dato x, quest'insieme è unico: possiamo dunque chiamarlo “{x}”, “insieme unità di x”. (c)
Seaebsono
due oggetti del dominio, esiste sempre un insieme {a, b} che contiene a e db come elementi, ma
nessun altro oggetto. In simboli:
MMazy> AMAze
Mez=xvz=)).
Per l’assioma di estensionalità, dati x e y, quest’insieme è unico: possiamo dunque chiamarlo “{x, y}”, “insieme coppia di x e y”.
ASSIOMA HI (Axiom der Aussonderung: assioma di separazione). Per ogni funzione proposizionale (nel saggio del 1908 Zermelo usa il termine “Klassenaussage”: “asserzione di classe”; altrove, per es. in Zermelo [1930a], usa ‘“Satzfunktion”: “funzione proposizionale”), @(x), definita per tutti gli elementi di un insieme M (sul significato di “definita”, in questo contesto, ci soffermeremo più avanti), esiste un insieme che contiene precisamente quegli e-
lementi x di M di cui è vero che @(x). In simboli: (MAM(xe N=xe MA p(x)).
ASSIOMA IV (Axiom der Potenzmenge: assioma dell’insieme potenza). Dato un insieme 7, esiste sempre un insieme — l’insieme potenza di T— che contiene come elementi precisamente tutti i sottoinsiemi di 7. In simboli:
(DAM(N(Ne M=NC 1) (Si richiami che in questo libro mi attengo al simbolismo dei Principia Mathematica (vol. I, #22.01), secondo cui “aC ' significa che @ è un sottoinsieme non necessariamente proprio di / (v. sopra, cap. 1, nota 118)). Per l’assioma di estensionalità, quest'insieme è unico: possiamo dunque chiamarlo “P(7)”, “insieme potenza di 7° (Zermelo si serve del simbolo “M7”). ASSIOMA V (Axiom der Vereinigung: assioma dell’unione). Dato un insieme 7, esiste sempre un insieme — l’unione di T— che contiene come elementi precisamente tutti gli elementi degli elementi di 7. In simboli: (DAM(xxe M=(AN)(xe NANE T). Per l’assioma di estensionalità, dato 7, quest’insieme è unico: possiamo dunque chiamarlo “U 7”, “unione di 7” (Zermelo si serve del simbolo “©7”). ASSIOMA VI (Axiom der Auswahl: assioma di scelta). Se 7 è un insieme i cui elementi sono insiemi non vuoti e mutuamente disgiunti, la sua unione 7 include almeno un insieme S che ha uno e un solo elemento in comune con ciascun elemento di 7. La trascrizione simbolica è in questo caso lunga e meno perspicua dell’enunciazione
verbale: (DI[{MW)(Me
T2 (Ax) (xe M) A(M)(N((Me
(4S)(M&xe S25 (AM e
MAME
TAN e T)VA(Ax)x e Maxe
T) A(M)M e TO (AMG
Maye
N)>9Mxe
M=xe
N)]>3
S=y=»))}.
ASSIOMA VII (Axiom des Unendlichen: assioma dell’infinito). Esiste almeno un insieme che contiene come elemento l’insieme vuoto, ed è tale che, per ogni a che contiene come elemento, contiene anche l'insieme {a} come elemento. In simboli: (IM(Ae MA()(x e M>3 {x} e M)).
L’assioma I afferma che un insieme è determinato esclusivamente dai suoi elementi, e che quindi due insiemi sono identici se hanno gli stessi elementi. Gli assiomi II(b), II(c), V, VII forniscono regole per ottenere ricorsivamente insiemi a partire da insiemi dati. L'assioma II(a) garantisce l’esistenza dell’insieme vuoto, che è l’unico insieme del dominio D a non essere costruito a partire da altri elementi già dati. Dall’insieme vuoto A, con l'ausilio
772
capitolo 12
degli assiomi, si possono formare altri insiemi, per es.: l’insieme unità {A}, l'insieme unità dell’insieme unità {{A}}, il suo insieme unità, {{{A}}}, ecc. (assioma II(b)); l'insieme coppia di A e {A}, cioè {A, {A}} (assioma II(c)); l’insieme unione di {{A, {A}}, {{{A}}}}, cioè {A, {A}, {{A}}} (assioma V). La necessità dell’assioma
VII può non risultare immediatamente evidente. Si può avere l’impressione di avere già a disposizione un insieme infinito, utilizzando gli altri assiomi. Infatti, applicando più volte l’assioma II(b), otteniamo gli insiemi:
A, TA}, {A1}, {{{A}}}, {{{{A}}}}, ecc. Applicando poi l’assioma II(c) agli insiemi A e {A}, otteniamo l’insieme:
TA, {At}. Da quest’insieme e dall’insieme {{{A}}}, applicando l’assioma II(c), otteniamo l'insieme coppia {{A, {A}}. {{{A}}}}: applicando l’assioma V a quest’ultimo insieme otteniamo l’insieme:
TA, {A}, K1A}}}Da quest’insieme e dall’insieme {{{{A}}}}, applicando l’assioma II(c), otteniamo l’insieme coppia {{A, {A}, {{A}}}, {{{{A}}}}}: applicando l’assioma V a quest’ultimo insieme otteniamo:
TA, TA}, t1A}}, ({{A}t}k Attraverso l’iterazione illimitata di questo processo, sembra dunque che gli assiomi II e V ci consentano, da soli, di ottenere l’insieme infinito la cui esistenza è postulata dall’assioma VII. Ciò che questo procedimento dimostra, tuttavia, è solo che, per ogni numero naturale, esiste un insieme che ha quel numero naturale e che, quindi, il numero degli insiemi di un modello del sistema di Zermelo non può essere finito. Se, come fa Zermelo,® si identifi-
cano i numeri naturali 0, 1, 2, 3, ... rispettivamente con A, {A}, {{A}}, {{{A}}}, ... — cioè, si identifica il numero naturale 0 con l’insieme vuoto A, e il successore di un numero naturale n con l’insieme {n} — gli assiomi II e V consentono di dimostrare che nel sistema di Zermelo vale il terzo assioma di Peano. Tuttavia non abbiamo la dimostrazione che esista un insieme infinito: come vedremo tra poco, nel sistema di Zermelo non può esistere un insieme di tutti gli insiemi, pertanto il fatto che gli insiemi debbano essere infiniti non garantisce che esista un insieme infinito. L’esistenza di un insieme infinito numerabile — e, in particolare, di un insieme che raccolga tutti e solo i numeri naturali’ — è tuttavia necessaria, non solo per la matematica cantoriana, ma per la fondazione
dell’analisi. Di qui la necessità dell’assioma VII. L’assioma II — detto anche assioma di separazione, o di isolamento — è la controparte, nel sistema assiomatico di Zermelo, del principio di comprensione illimitato, cioè di quel principio della teoria ingenua degli insiemi che afferma che per ogni proprietà esiste l’insieme di tutti gli oggetti che hanno tale proprietà. L'assioma II è un assioma di comprensione opportunamente ristretto in modo da non dare origine ai paradossi di Russell, di Cantor e di Burali-Forti: esso non dice che, se è data una proprietà, possiamo formare l’insieme di tutte le cose che hanno tale proprietà, ma solo che possiamo formare l’insieme di tutte le cose che hanno tale proprietà e appartengono già a un altro insieme. L'assioma è detto “assioma di separazione” o “di isolamento” proprio perché permette di “separare”, o di “isolare”, all’interno di un insieme già dato M, un sottoinsieme N di oggetti accomunati da una certa proprietà @. Una restrizione posta da Zermelo sull’assioma III è che la proprietà @ dev'essere definita per tutti gli elementi di M:'° con ciò, spiega Zermelo, s’intende che “@(x)” dev’essere un’asserzione definita per ciascun elemento x di M, laddove, egli dice, un’asserzione è “definita” «se le relazioni fondamentali del dominio
[Grundbeziehungen des Bereiches], sulla base degli assiomi e delle leggi universalmente valide della logica [der è V. Zermelo [1908], $ 1, p. 267 (in Zermelo [2010], p. 200, trad. ingl. a fronte, e in van Heijenoort (ed.) [1967], p. 205). ? Con l’ausilio degli altri assiomi del suo sistema, Zermelo dimostra che, dato un insieme Z che soddisfa l’assioma VII —
cioè che ha per
elementi tutti inumeri naturali, A, {A}, {{A}}, {{{A}}}. ... —, esiste un insieme Zy che è il più piccolo ad avere per elementi tutti i numeri naturali: l'insieme 7 di tutti i sottoinsiemi di Z che soddisfano l’assioma VII è un sottoinsieme dell’insieme potenza di Z (la cui esistenza è garantita dagli assiomi IV e III); l’intersezione degli elementi di 7 (la cui esistenza è deducibile dall’assioma II: v. sotto, nota 15) è Zy (v. Zermelo [1908], $ 1, punto 14y;;, p. 267 (in Zermelo [2010], p. 200, trad. ingl. a fronte, e in van Heijenoort (ed.) [1967], pp. 204-205). 10 V. Zermelo [1908], $ 1, punto 6, p. 267 (in Zermelo [2010], p. 200, trad. ingl. a fronte, e in van Heijenoort (ed.) [1967], p. 202).
Alternative, critiche e proposte di emendamento al sistema dei Principia
773
Axiome und der allgemeingiiltigen logischen Gesetze], decidono senza arbitrio sulla sua validità o invalidità». !! In altre parole, secondo la caratterizzazione di Zermelo una proprietà è “definita” quando è determinato se essa si applica o no a ciascun elemento di M sulla sola base della relazione e, degli assiomi di Zermelo diversi da quello
di separazione, e delle leggi logiche. Una caratterizzazione vaga, poiché su quali siano le «leggi universalmente valide della logica» sottostanti al suo sistema assiomatico Zermelo non fornisce precisazioni. Zermelo pone questa restrizione sulle proprietà che compaiono nell’assioma II non per bloccare il paradosso di Russell, ma per bloccare alcuni paradossi che oggi diremmo “semantici”, come quelli di Richard e di K6nig; scrive Zermelo: [...] il criterio definente [das bestimmende Kriterium] deve sempre essere “definito” [defini] nel senso della nostra spiegazione
[Erklérung] n. 4, cioè per ogni singolo elemento x di M deve essere deciso dalle “relazioni fondamentali del dominio” [Grundbeziehungen des Bereiches], e con ciò tutti i criteri come “definibile per mezzo di un numero finito di parole”, e quindi l’“antinomia di Richard” o il “paradosso della designazione finita” [...] [ometto qui un enunciato parentetico in cui Zermelo rinvia tra l’altro a Kénig [1905]] dal nostro punto di vista vengono a cadere.'”
L’idea di Zermelo è che se abbiamo, per esempio, l’insieme dei numeri naturali, siamo autorizzati a usare, per es., il predicato “... è un numero dispari” per formare, attraverso l’assioma III, l'insieme di tutti i numeri dispari; ma non dobbiamo essere autorizzati a utilizzare, per es., il predicato ‘... è un numero definibile in italiano con meno di trenta sillabe” per formare, attraverso l'assioma II, l'insieme di tutti i numeri naturali definibili in italia-
no con meno di trenta sillabe, perché questo darebbe origine al paradosso di Berry.'* Poiché, tuttavia, la caratterizzazione di Zermelo del significato di proprietà “definita” è vaga, non si può dire che il sistema di Zermelo, così com'è, blocchi i paradossi di Richard, K6nig e Berry.
Riguardo ai paradossi logici, si osservi che, perché l’assioma II li blocchi, occorre che nel sistema di Zermelo non esista un insieme che comprende tutte le entità. In altri termini, è necessario che le entità del dominio D non costituiscano esse stesse un insieme. Infatti, “separare” — per mezzo dell’assioma III — l’insieme delle cose che hanno una certa proprietà all’interno dell’insieme universale equivarrebbe semplicemente a formare l’insieme di tutte le cose che hanno quella proprietà: cioè equivarrebbe a usare il principio di comprensione illimitato. Per esempio, mediante l’assioma III, si potrebbe formare l’insieme di tutti gli insiemi appartenenti all’insieme universale che non sono elementi di se stessi; ma ciò equivale semplicemente a formare l’insieme di tutti gli insiemi che non appartengono a se stessi e quindi conduce al paradosso di Russell. Oppure, si potrebbe formare l’insieme di tutti i numeri ordinali che appartengono all’insieme universale, incorrendo così nel paradosso di Burali-Forti. È lo stesso Zermelo a dimostrare che, se il suo sistema assiomatico è coerente, non può esistere in esso un insieme universale, cioè il dominio D non è un insieme.'* Ciò che dimostra Zermelo è che, dato un insieme 7, deve
sempre esistere almeno un suo sottoinsieme M che non è elemento di 7. In altri termini, non può esistere nessun insieme che abbia per elementi futfi i suoi sottoinsiemi. L'argomento di Zermelo è il seguente. Sia M un sottoinsieme di 7 che contiene tutti e solo gli elementi x di 7 tali che x é x. L'insieme M esiste per l’assioma II. Si danno ora due possibilità: o M e M, oppure no. Il primo caso è impossibile perché, se si verificasse, M conterrebbe un elemento x = M che appartiene a se stesso, e ciò è contro la definizione di M. Quindi dev'essere M £ M; ma ciò prova che M non può essere un elemento di 7. Infatti, se M fosse un elemento di 7, poiché M & M, M soddisferebbe la condizione definitoria dello stesso insieme M e quindi avremmo M e M, la qual cosa, abbiamo visto pri-
ma, non può essere. Da questo segue immediatamente che non può esistere un insieme che raccolga tutti gli insiemi. Con ciò il paradosso di Russell è evitato. Il paradosso è evitato grazie alla sostituzione del principio di comprensione illimitato della teoria ingenua degli insiemi con l’assioma II di Zermelo. Verifichiamolo provando a ripercorrere il ragionamento che, nella teoria ingenua degli insiemi, conduce al paradosso di Russell. Tramite il principio di comprensione illimitato, possiamo formare l’insieme M di tutti e solo gli insiemi che non appartengono a se stessi. La prima parte dell’argomentazione corre parallela alla prima parte della dimostrazione di Zermelo: non è possibile che M e M
!! Zermelo [1908], $ 1, punto 4, p. 263 (in Zermelo [2010], p. 192, trad. ingl. a fronte, e in van Heijenoort (ed.) [1967], p. 201). '? Zermelo [1908], $ 1, punto 6, p. 264 (in Zermelo [2010], p. 194, trad. ingl. a fronte, e in van Heijenoort (ed.) [1967], p. 202). 13 Cioè alla contraddizione che il più piccolo numero non definibile in italiano con meno di trenta sillabe sarebbe definibile in italiano — proprio attraverso la descrizione posta in corsivo — con meno di 30 sillabe: dovrebbe dunque essere, e insieme non essere, definibile con meno di 30 sillabe. Sul paradosso di Berry, v. sopra, cap. 4, $ 3.3. 14 V. Zermelo [1908], $ 1, punto 10, pp. 264-265 (in Zermelo [2010], p. 196, trad. ingl. a fronte, e in van Heijenoort (ed.) [1967], p. 203). Naturalmente, se il sistema di Zermelo fosse incoerente, si potrebbe dimostrare in esso qualsiasi cosa, e dunque anche l’esistenza (oltre che
l’inesistenza) di un insieme universale.
7714
capitolo 12
perché, se fosse così, M conterrebbe un elemento che appartiene a se stesso, contro la definizione di M. Concludiamo dunque che M @é M. Ma ora interviene il paradosso: se M € M, M soddisfa la definizione di M, e quindi
M e M, il che è impossibile. Ciò che consente al sistema di Zermelo di sfuggire all’antinomia di Russell è che la condizione definitoria di M impone che i suoi elementi debbano essere elementi di un altro insieme 7. Cosicché, quando nel sistema di Zermelo ci si trova al punto cruciale in cui si conclude che M € M, poiché se ammettesse
che M soddisfa la condizione definitoria che soddisfano gli elementi di M stesso si incorrerebbe in una contraddizione, si deve concludere che M non soddisfa questa condizione definitoria, e poiché esso soddisfa una clausola di questa definizione (è un insieme che non appartiene a se stesso) non può soddisfare l’altra clausola (cioè non può appartenere a 7).
L’assioma IV (dell’insieme potenza) è particolarmente connesso all’assioma III. Osserviamo, innanzi tutto, che l’assioma IV non può, da solo, provvedere quelli che intuitivamente paiono essere i sottoinsiemi di un insieme 7 — cioè aggregati arbitrari di elementi di 7. L'assioma dice che tutti gli insiemi N i cui elementi sono anche elementi di 7 si possono raccogliere in un insieme. Tuttavia, l’esistenza dei singoli sottoinsiemi di 7 non è data dall’assioma stesso, ma dev'essere stabilita dagli altri assiomi. Supponiamo, per es., di avere l’insieme {{A}, I{A}}}. Non possiamo forse asserire, servendoci dell’assioma IV, l’esistenza dell’insieme dei suoi sottoinsiemi, cioè di {A, {{A}}, {{{A}}}, {TA}, {{A}}}}? Sì, ma solo perché gli altri assiomi del sistema di Zermelo consentono di dimostrare l’esistenza dei singoli insiemi, A, {{A}}, {{{A}}} e {{A}, {{A}}}. che risultano essere sottoinsiemi dell’insieme di partenza. È importante afferrare bene questo punto: non ci stiamo più muovendo in una
teoria intuitiva degli insiemi; in una teoria assiomatica non possiamo affermare con certezza l’esistenza di un insieme se non la possiamo dimostrare basandoci esclusivamente sugli assiomi della teoria. Nel caso del nostro esempio precedente, si può dimostrare l’esistenza dei sottoinsiemi A, {{A}}. {{{A}}} e {{A}, {{A}}} servendosi solo degli assiomi II. Tuttavia, quando si tratta di stabilire l’esistenza di sottoinsiemi in-
finiti di un insieme 7, è cruciale l'assioma II — che, per questo, è anche noto con il nome di assioma dei sottoinsiemi. L’assioma III consente di formare tutti i sottoinsiemi di un insieme arbitrario 7 che sono definibili tramite proprietà ben definite sugli elementi di 7. Non possiamo asserire l’esistenza dei sottoinsiemi infiniti di un insieme T la cui esistenza non è dimostrabile attraverso l’assioma VII, l’assioma III, o — come adesso vedremo — l’assioma VI (di scelta). L’assioma di scelta dice che se 7 è un insieme i cui elementi sono insiemi non vuoti e mutuamente disgiunti, esiste almeno un insieme $S che ha uno e un solo elemento in comune con ciascun elemento di 7. A prima vista, quest’assioma sembra implicato dagli altri assiomi. Sia UT l’insieme unione di 7: la sua esistenza deriva
dall’assioma V. Prendiamo ora l’insieme potenza di U 7, P(U
7): la sua esistenza deriva dall’assioma IV. Intuiti-
vamente, l’insieme S che cerchiamo è un elemento di P(U 7). Tuttavia, come appena osservato, l’assioma IV ci dice che possiamo raccogliere in un insieme tutti gli insiemi che sono sottoinsiemi di UU 7, ma non ci dice se S sia effettivamente un insieme: se lo è, è di certo un sottoinsieme di UU 7, perché i suoi elementi sono anche elementi di
U 7, ma se non è un insieme, non può essere neppure un sottoinsieme di nessun insieme. Abbiamo l’assioma III. Il problema, nell’usarlo per ottenere S come sottoinsieme di \J 7 è che dobbiamo identificare una proprietà che caratterizzi $: non basterà asserire che S deve avere uno e un solo elemento in comune con ciascun elemento di 7, perché vi sono diversi insiemi che hanno questa caratteristica. Possiamo servirci dell’assioma HI per dimostrare l’esistenza dell’insieme cui appartengono tutti gli x appartenenti a P(U 7), tali che, per ogni te 7, l’intersezione! tra # e x ha un solo elemento. Con ciò, tuttavia, abbiamo dimostrato l’esistenza dell’insieme di tutte le selezioni da 7, cioè dell’insieme di tutti gli insiemi che “scelgono” uno e un solo elemento da un insieme di insiemi arbitrario 7, ma non abbiamo dimostrato l’assioma di scelta, perché non abbiamo dimo-
strato che tale insieme non possa essere vuoto. Se, infatti, non esistesse nessun x tale che x € P(U
7), e per ogni
!5 Nel sistema di Zermelo, l’esistenza dell’intersezione tra due insiemi si può dedurre per mezzo dell’assioma II (v. Zermelo [1908], $ 1, punto 8, p. 264 (in Zermelo [2010], p. 194, trad. ingl. a fronte, e in van Heijenoort (ed.) [1967], p. 202)). Infatti, dati due insiemi M e N, l’assioma III consente di isolare, all’interno dell’insieme M, l’insieme degli x che sono membri di N. L'esistenza dell’intersezione di tutti
gli insiemi appartenenti a un insieme di insiemi 7 — detta anche intersezione di 7 — si può dedurre ancora usando l’assioma II (v. Zermelo [1908], $ 1, punto 9, p. 264 (in Zermelo [2010], p. 194, trad. ingl. a fronte, e in van Heijenoort (ed.) [1967], pp. 202-203)). Infatti, dato
un qualsiasi oggetto x, l'assioma III consente di ottenere il sottoinsieme 7, di 7 costituito di tutti gli elementi di 7 che hanno per elemento x; se T,= T, allora x fa parte dell’intersezione di 7. Quindi, se A è un elemento arbitrario di 7, si può applicare ancora ad esso l’assioma III per formare l’insieme tutti gli elementi a di A per cui 7, = 7, che sarà l’intersezione di 7, () T (Zermelo indica N 7 con il simbolo “D7?).
Alternative, critiche e proposte di emendamento al sistema dei Principia
775
te T, l'intersezione tra £ e x abbia un solo elemento — in altre parole, se l’assioma di scelta fosse falso per l’insieme 7 in questione — con la precedente applicazione dell’assioma III avremmo isolato da P(U 7) l'insieme vuoto.
In effetti oggi sappiamo, grazie al lavoro di Kurt G6del ([1938], [1939] e [1940]) e Paul J. Cohen ([1963], e [1966], capp. 3 e 4), che l’assioma di scelta è indipendente dagli altri assiomi di Zermelo, cioè che esso non è né dimostrabile, né refutabile, sulla base di tali assiomi. Nel cap. 4, $ 4.4, avevamo notato che, nella teoria dei Principia, l’assioma di scelta si trova ad asserire l’esistenza, per ogni classe di classi non vuote e mutuamente esclusive 7, di una selezione da 7 definibile attraver-
so un predicato che scelga uno e un solo elemento da ciascuna classe di classi prive di elementi in comune. Nella teoria di Zermelo, invece, l’assioma di scelta non asserisce che tale selezione sia definibile, infatti, in essa non si
suppone che per ogni insieme di insiemi non vuoti e mutuamente esclusivi 7 debba esistere una proprietà @ che isoli, all’interno dell’insieme UU 7, una selezione S: il punto dell’assioma VI di Zermelo è appunto postulare l’esistenza dell’insieme $S, anche in assenza di qualsiasi proprietà che consenta di descrivere l'insieme S. Prima di volgerci allo sviluppo che il sistema di Zermelo ebbe nei decenni successivi alla sua prima formulazione, facciamo un passo indietro e cerchiamo di capire come Zermelo pervenne all’idea di costruire un sistema in cui non esistesse nessun insieme universale.
1.1.2. ZERMELO E IL PARADOSSO DI RUSSELL Zermelo scoprì il paradosso dell’insieme di tutti gli insiemi che non sono elementi di se stessi, indipendentemente da Russell, prima che Frege lo pubblicasse.'° In una nota a piè di pagina di Zermelo [1907] si legge: «Ho però scoperto io stesso quest’antinomia [il paradosso di Russell] indipendentemente da Russell e l'ho comunicata già prima del 1903 tra gli altri al Prof. Hilbert».'!” In una lettera a Gottlob Frege datata 7 novembre 1903, David Hilbert conferma questa circostanza: «Egregio collega. La ringrazio molto per il secondo volume dei suoi “Grundgesetze”, che mi interessa molto. Il suo esempio alla fine del libro (p. 253) [cioè, il paradosso di Russell] qui ci è noto [...]»;'* in una nota a piè di pagina Hilbert aggiunge: «Credo che lo abbia scoperto 3-4 anni fa il Dr. Zermelo [...]».! Non si sa di preciso quando Zermelo scoprì il paradosso di Russell — stando alla lettera di Hilbert, nel 1899 o nel 1900 — ma senz'altro prima dell’ aprile del 1902, perché la sua derivazione del paradosso ci è pervenuta attraverso un appunto di Edmund Husserl datato 16 aprile 1902, ritrovato da Bernhard Rang nel corso della preparazione del ventiduesimo
volume
delle opere complete di Husserl (v. Husserl
[1979]). La storia di
quest’appunto è la seguente.” Nel 1891 Husserl aveva scritto una recensione”! al primo volume delle Vorlesungen !© V. Rang e Thomas [1981]. !” Zermelo [1907], $ 2, c, pp. 118-119, seconda nota di p. 118 (in Zermelo [2010], p. 140, seconda nota, trad. ingl. a fronte, e in van Heijenoort (ed.) [1967], p. 191, seconda nota). Dopo aver studiato matematica, fisica e filosofia nelle università di Berlino, Halle e Friburgo, ed essersi addottorato a Berlino nel 1894, nel 1899 Zermelo divenne Privatdozent (docente non stipendiato) a Gottingen, con una tesi di abili-
tazione sull’idrodinamica. A Géttingen insegnava, dal 1895, David Hilbert. Fu sotto il suo impulso che Zermelo cominciò a interessarsi di teoria degli insiemi, e fu indubbiamente sotto l’influenza del metodo assiomatico di Hilbert — il quale, già nel 1899 aveva presentato una rigorosa assiomatizzazione della geometria (v. Hilbert [1899]) — che, nel 1905, Zermelo decise di assiomatizzare la teoria degli insiemi. Zermelo divenne professore all’ Università di Gòttingen nel 1905, un incarico che mantenne fino al 1910, quando accettò una cattedra a
Zurigo, da cui si dimise nel 1916 per motivi di salute, riprendendo l’insegnamento, questa volta a Friburgo, solo nel 1926. Nel 1935, Zermelo si dimise dall’incarico, anticipando la sua ormai certa espulsione da parte dei nazisti. Riebbe la cattedra solo dopo la guerra, nel 1946. Morì a Friburgo nel 1953.
!8 In Frege [1976], pp. 79-80. !° In Frege [1976], p. 80. Dopo le parole «Il suo esempio [...] qui ci è noto», la lettera di Hilbert a Frege prosegue: «già 4-5 anni fa ho scoperto altre contraddizioni ancora più persuasive; esse mi hanno portato alla convinzione che la logica tradizionale è inadeguata, e che la teoria della formazione dei concetti ha invece bisogno di una rigorizzazione e di un perfezionamento, dove io considero come la più fondamentale lacuna nel tradizionale edificio della logica l’assunzione — che tutti i logici e matematici hanno finora accettato — che un concetto già sussista se di ogni oggetto si può specificare se cada sotto di esso oppure no. Questo, mi sembra, non è sufficiente. La cosa decisiva è invece il riconoscimento [Erkennmis] della non contraddittorietà degli assiomi che definiscono il concetto» (in Frege [1976], p. 80). Volker Peckaus ([2004], p. 507) riferisce che nel 1936 Heinrich Scholz — che all’epoca stava lavorando sulle carte di Frege acquisite per
il suo dipartimento all’ Università di Miinster — trovò questa lettera di Hilbert, e il 5 aprile scrisse a Zermelo per avere maggiori informazioni. Zermelo rispose il 10 aprile 1936 ricordando che i paradossi della teoria degli insiemi erano spesso discussi nella cerchia di Hilbert a Gottingen intorno al 1900, e che egli stesso all’epoca aveva fornito una precisa formulazione del paradosso che avrebbe poi preso il nome da Russell. 20 Le informazioni storiche che seguono sono ricavate da Rang e Thomas [1981].
capitolo 12
776
liber die Algebra der Logik di Ernst Schroder. In questo volume, Schròder fornisce una pretesa dimostrazione che supporre l’esistenza di un insieme universale — l’insieme che ha come elemento ogni cosa — conduce a una contraddizione.”° Nella sua recensione,” Husserl sostiene — correttamente — che la dimostrazione non è valida perché in essa si confonde tra appartenenza e inclusione in un insieme — cioè si confonde l’essere un elemento di un insieme e l’essere un sottoinsieme di un insieme.” Il 16 aprile 1902, dopo aver letto la sua recensione, Zermelo comunicò a Husserl — che all’epoca insegnava all’Università di Gòttingen, come Hilbert e Zermelo — una dimostrazione che, sebbene la prova di Schròder fosse fallace, la sua conclusione che assumere l’esistenza di un insieme universale conduce a una contraddizione è corretta. Husserl riportò di suo pugno la comunicazione di Zermelo e l’accluse a una copia della propria recensione a Schròder. La traduzione inglese di questa nota si può ora trovare in Rang e Thomas [1981], pp. 16-17. Nella trascrizione di Husserl, Zermelo dice di voler dimostrare che «Una classe M, che contiene ciascuna delle sue sottoclassi, m, m', ... come elementi è una classe inconsistente, cioè, una tale classe, se trattata in tutto e per
tutto come classe, conduce a contraddizioni». Naturalmente, l’insieme di tutti gli insiemi soddisfa la definizione di M, poiché, dovendo avere come elementi tutti gli insiemi, sicuramente avrà come elementi anche tutti i suoi sottoinsiemi; quindi, la dimostrazione
dell’inconsistenza di M costituisce una dimostrazione
dell’inconsistenza
dell’insieme di tutti gli insiemi. La dimostrazione di Zermelo, così come risulta dalla trascrizione di Husserl, procede considerando l’insieme My di tutti i sottoinsiemi di M che non appartengono a se stessi. Poiché, per ipotesi, M ha come elementi tutti i suoi sottoinsiemi, ciascun elemento di My sarà anche un elemento di M, e lo stesso insieme My (essendo costituito di elementi di M) sarà un sottoinsieme di M, e dunque un elemento di M. Ma Zerme-
lo dimostra che ciò sfocia nella contraddizione Mo E
Mo = Mo È Mo.
Supponiamo, infatti, dapprima che M) e Mo. Se My appartiene a Mo, allora My deve soddisfare la condizione che soddisfano tutti gli elementi di My. Quindi dev’essere un elemento di M che non appartiene a se stesso. Pertanto Mo È Mo.
Supponiamo allora che My é Mo. Se My non appartiene
a Mo, allora a My non deve soddisfare la condizione
soddisfatta dagli elementi di My: cioè non dev'essere un elemento di M che non appartiene a se stesso. Quindi, o My non appartiene a M, oppure appartiene a se stesso. Ma, per ipotesi, a My appartiene a M: quindi deve appartenere a se stesso. Pertanto M, e Mo.
Riassumendo:
nell’ipotesi che
M sia un insieme che contiene tutti i suoi sottoinsiemi, M deve contenere
l’insieme My di tutti i suoi sottoinsiemi non appartenenti a se stessi. Ma allora Mo e Mo = Mo é Mv: una contrad-
dizione. Dunque, nessun insieme M può contenere tutti 1 suoi sottoinsiemi. Ne consegue che non può esistere un insieme universale. Se però si nega che esista un insieme universale e si ammette che un insieme si possa ottenere solo isolando, all’interno di un insieme dato, un sottoinsieme di elementi che hanno una certa proprietà, il paradosso di Russell svanisce. Naturalmente, per avere degli insiemi all’interno dei quali isolare sottoinsiemi di elementi che hanno una certa proprietà, occorre avere altri assiomi che garantiscano l’esistenza di alcuni insiemi di partenza. Questa sembra essere l’idea all’origine della costruzione del sistema di Zermelo.”° 2! Ora in Husserl [1979], pp. 3-43.
22 La dimostrazione si trova in Schréder [1890-95], vol. I, $ 9, p- 245 (il brano è tradotto in inglese in Rang e Thomas [1981], pp. 18-19).
Schroder risolve il problema proponendo una vera e propria teoria semplice dei tipi ante litteram (v., in proposito, Church [1939], e Rang e Thomas [1981], p. 19): si parte da un dominio costituito di individui, designato dal simbolo “1”; il dominio è una molteplicità arbitraria, soggetta però alla limitazione di non avere tra i suoi membri classi di individui appartenenti alla molteplicità stessa (v. Schròder [1890-95],
vol. I, $ 9, p. 248). Dato questo primo dominio, si ottiene un secondo dominio di individui, i cui membri sono le sottoclassi di 1. Sì può procedere all’infinito, osserva Schroder ([1890-95], vol. I, $ 9, p. 248), continuando a formare nuovi domini di individui, i cui membri sono le sottoclassi del dominio precedente. Secondo questa teoria, non esiste un’unica classe universale, un unico dominio comprendente tutti gli
individui, ma una diversa classe universale (e una diversa classe vuota) per ciascun livello nella gerarchia. 23 V. Husserl [1979], p. 36. Il passo rilevante della recensione di Husserl è riportato in traduzione inglese in Rang e Thomas [1981], p. 19. °4 La confusione di Schròder tra appartenenza e inclusione è criticata anche da Frege (v. Frege [1892b], p. 194). 29 Rang e Thomas [1981], pp. 16-17. 26 Come testimoniano alcuni scritti presenti nel suo Nach/af all’Università di Friburgo (Freiburg im Breisgau), Zermelo cominciò a sviluppare il suo sistema assiomatico nel 1905; nell’estate del 1906, il sistema di Zermelo era già molto simile a quello che sarà poi pubblicato (v. G. H. Moore [1982], $ 3.2, pp. 155-157).
Alternative, critiche e proposte di emendamento al sistema dei Principia
TTI
}.1:3- ALCUNI SVILUPPI SUCCESSIVI Negli anni Venti del Novecento, il sistema originario di Zermelo fu semplificato e perfezionato — soprattutto per merito di Abraham Fraenkel, Thoralf Skolem e John von Neumann — dando luogo a quella che oggi è nota
come teoria degli insiemi di Zermelo-Fraenkel, designata abitualmente con le sigle “ZFC” 0 “ZF” — secondo che, rispettivamente, tra gli assiomi vi sia o non vi sia l’assioma di scelta.
Una semplificazione abbastanza ovvia riguarda l’assioma II(c) (della coppia): II(c)
MMax#y29
(AM(2)(e
M=z=xvz=)).
Se eliminiamo da esso la condizione che x # y (con la quale abbiamo tradotto la condizione verbale posta da Zermelo che x e y siano due oggetti del dominio), ottenendo:
(1) MMAM@A@Ae
M=z=xvz=y),
ci accorgiamo subito che l’assioma II(b) (dell’insieme unità) di Zermelo è superfluo. Infatti, se si prende in (1) x = y, mediante (1) otteniamo per ogni insieme x l’insieme {x} che ha per unico elemento x. Lo stesso Zermelo, in seguito, eliminerà dal suo sistema l’assioma dell'insieme unità (v. Zermelo [1930a], $ 1).
Un altro perfezionamento ha riguardato l’assioma II (di separazione). Abbiamo visto che la condizione secondo cui una proprietà che isoli, all’interno di un insieme, un altro insieme, dev’essere “definita” non è caratterizzata
in modo soddisfacente nell’articolo di Zermelo del 1908. Nel 1922, indipendentemente l’uno dall’ altro, Fraenkel e Skolem fornirono precisazioni di quest'idea.” In particolare, Skolem propose di considerare una proprietà come definita se e solo se essa è esprimibile per mezzo di una formula ottenibile da formule della forma “x = y” e “x € y” per mezzo delle cinque operazioni di congiunzione, disgiunzione, negazione, quantificazione universale e quantificazione esistenziale: in altre parole, se e solo se essa è esprimibile con una formula ben formata di un linguaggio formale del primo ordine i cui soli predicati primitivi siano il predicato di identità “=” e quello di appartenenza “e ”?.?* Oggi, seguendo Skolem, la teoria di Zermelo è usualmente formulata come una teoria del primo ordine,” ossia incorporante solo la logica del primo ordine con identità, nel cui linguaggio è presente il solo predicato extralogico primitivo “e”, e le cui variabili sono intese variare su insiemi. Si osservi, tuttavia, che Zermelo si oppose sempre con decisione alla formulazione della sua teoria al primo ordine.” Se la teoria di Zermelo si formula al primo ordine, naturalmente, l’interpretazione di Skolem di “proprietà definita” è obbligata. Poiché in una teoria del primo ordine non si può quantificare su proprietà, l’assioma II di Zermelo è riformulato con il seguente schema d’assiomi, inglobante un numero infinito di assiomi:
ZII)
Mayaze
y=ze x 1 F(2),
2? V. Fraenkel [1922b], p. 286, e Skolem [1923], punto 2, pp. 292-293. Secondo la proposta di Fraenkel, una funzione proposizionale è “definita” se si può ottenere attraverso un numero finito di iterazioni delle operazioni di insieme potenza, unione, e coppia. Nel 1929, Skolem dimostrò che il metodo di Fraenkel conduce a funzioni proposizionali equivalenti a funzioni esprimibili nel menzionato linguaggio del primo ordine (v. Skolem [1929], pp. 7-9). Il metodo di Fraenkel, tuttavia, è più restrittivo di quello di Skolem, perché non tutte le funzioni
proposizionali definite secondo Skolem corrispondono a funzioni proposizionali definite secondo Fraenkel. Von Neumann ([1928b], cap. 1, punti 1-3, pp. 375-377) dimostrerà che in effetti il metodo di Fraenkel è troppo restrittivo per una formulazione soddisfacente dell’assioma di rimpiazzamento, di cui parleremo più avanti. 28 V. Skolem [1923], punto 2, pp. 292-293. Nel suo articolo, Skolem non menziona Hermann Weyl, ma una caratterizzazione molto simile a quella di Skolem del concetto di proprietà “definita” era già stata data da Weyl negli anni 10 (v. Weyl [1910] e Weyl [1918], cap. 1,$2,e
$ 8, pp. 81-82). Cavi sopra, cap. 2, nota 131.
30 Ancora alla fine degli anni Venti, egli insisteva che una funzione proposizionale (Satzfunktion) può essere «del tutto arbitraria [ganz beliebig]» (Zermelo [1930a], $ 1, p. 30, seconda nota (in Zermelo [2010], p. 402, trad. ingl. a fronte; in Cellucci (ed.) [1978], p. 180; in
Ewald (ed.) [1996], vol. II, p. 1220)), intendendo con ciò che può essere una qualsiasi formula ben formata di un linguaggio del second’ordine (oltre che del primo), cioè includente variabili predicative quantificate (v. Zermelo [1929], pp. 341-344 (in Zermelo [2010], pp. 360, 362, 364 e 365, trad. ingl. a fronte). Zermelo fu sempre un tenace oppositore della limitazione della logica al primo ordine, sostenuta, durante gli anni Venti, soprattutto da Skolem; in proposito, v. Zermelo [1932].
capitolo 12
778
dove “F(z)” sta al posto di una formula ben formata del linguaggio L della teoria contenente la variabile “2° libera, e non contenente la variabile “y” libera. (Si noti che, in generale, la formula rappresentata da “(2)” potrà contenere variabili libere diverse da “2” e da “x” poniamo “w,”, ..., “w,°: in questo caso, lo schema Z(1I1) conterrà delle variabili libere, e si deve considerare come equivalente alla sua chiusura universale, ossia a Z(III) preceduto dai quantificatori universali “(w;)”... ‘“(w,)” che vincolano ciascuna di queste variabili libere.) In questa versione della teoria di Zermelo, i paradossi cosiddetti “semantici” risultano bloccati semplicemente dal fatto che il linguaggio
oggetto non è abbastanza ricco da permettere di esprimere i necessari predicati semantici. Osservando Z(III), si vede facilmente che lo schema implica i’esistenza di almeno un oggetto privo di elementi. Infatti, un’istanza di Z(III) è la seguente: (M(A)A(Ae
y=ze
xAZ#z),
che implica subito (per la falsità di “7 # 2°):
2)
Eatze y).
Ma questo non rende superfluo l’assioma II(a) (dell'insieme vuoto) di Zermelo? Non in un sistema — come quello originariamente proposto da Zermelo — che ammette l’esistenza di Urelemente, cioè oggetti che non hanno elementi, ma che sono diversi dall’insieme vuoto. In un sistema del genere, dimostrare l’esistenza di un’entità
priva di elementi, tramite Z(III), non dimostra che esista un insieme che non ha elementi; una cosa che è invece garantita dall’assioma II(a) di Zermelo. Quindi, se vogliamo una teoria degli insiemi che ammetta la possibilità dell’esistenza di Urelemente, l’assioma II(a) è necessario. Oggi, tuttavia, si lavora perlopiù all’interno di teorie pure degli insiemi, cioè di teorie degli insiemi in cui non esistono entità prive di elementi distinte dall’insieme vuoto. Per garantire ciò, si formula l’assioma (1) di Zermelo (estensionalità) come segue:
ZI) MA) &
dove l’identità
x=ze )D5x=y), (69)
S
è definita come:
(D) x=y=r@)Fe z=ye 2). Z(1) asserisce, tra l’altro, che tutti gli oggetti privi di elementi sono lo stesso oggetto, e dunque implica l’inesistenza di Urelemente distinti dall’insieme vuoto. Se si volesse, invece, avere una teoria degli insiemi che
ammetta Urelemente, l’assioma di estensionalità dovrebbe essere formulato in modo da valere solo per gli insiemi, come quello originale di Zermelo, oppure in modo da valere solo per le entità del dominio che non sono prive di elementi. Nell’attuale teoria degli insiemi senza Urelemente, si trova sovente l’identità definita come segue: (D)'
x=y=a(2)(e
x=ze€ y).
Di conseguenza, l’assioma di estensionalità è riformulato in modo da garantire la sostituibilità (non garantita da (D)') di “x” con “y” nei contesti “x € 2”, qualora x = y: 3! “Urelement” (letteralmente: “elemento originario”) è un termine usato, in un senso affine a questo, per la per la prima volta in Zermelo [1930a]. Zermelo, in realtà, chiama Urelemente tutte le entità prive di elementi, insieme vuoto compreso. Alcuni autori si attengono ancora a quest’uso ma, con il tempo, è prevalso l’uso di “Urelement” per indicare solo quelle entità prive di elementi che non sono insiemi, cioè che sono diverse dall’insieme vuoto. ?2 L’idea di una teoria pura degli insiemi fu adottata per la prima volta in una pubblicazione in Fraenkel [1922a] ($ II, p. 234) e fu poi accolta in von Neumann [1925]. Ma forse l’idea venne per primo a Paul Finsler: in Finsler [1926] questi esclude dalla teoria degli insiemi «qualsiasi cosa non sia assolutamente necessaria, cioè, qualsiasi cosa eccetto gli insiemi stessi» ($ 4, p. 108), e in una nota precisa: «Nel 1920 ho comunicato a P. Bernays l’idea di adottare il sistema di questi insiemi puri [cioè, insiemi i cui elementi siano ancora insiemi che siano a loro volta puri] come base per l’indagine» (ibid.). Una dozzina di anni dopo Paul Bernays, pubblicando per la prima volta la sua teoria degli insiemi — una modificazione di quella di von Neumann [1925] —, scrive: «L’idea di evitare elementi che non siano insiemi fu a
quanto sembra suggerita per primo da P. Finsler» (Bernays [1937], $ 1, nota 7, p. 67).
Alternative, critiche e proposte di emendamento al sistema dei Principia
ZI'
MMA)kx=y>(xe
z=ye
779
2)).
Si osservi che è giustificato chiamare sia Z(1) sia Z(1)' assioma di estensionalità, perché essi dicono la stessa cosa, CIOÈ: (MY (2)(Wwe
x=we
y)> (xe z=ye
2);
ciò che cambia è solo la preferenza sulla definizione di identità, (D°) o (D°)'. Nella teoria pura degli insiemi gli assiomi di Zermelo II(c), IV e V si possono riformulare, nell’ordine, come
segue:
Z(I1) (Coppia)
(MAa)(mMwe z=w=xvw=));
Z(IV) (Potenza)
(M(Ay)(2)(2 e y=zCx);
Z(V) (Unione)
(MAP (2)(z e y= (AW)(ze wAWE
x).
Si osservi che, in una teoria che ammettesse l’esistenza di Urelemente, l'assioma Z(IV) non andrebbe bene,
perché asserirebbe che l’insieme potenza di un qualsiasi insieme x include tutti gli Urelemente. In una teoria pura degli insiemi, lo stesso assioma porta invece a inferire semplicemente che l’insieme vuoto appartiene all'insieme È SE ZIGRA 3 potenza di qualsiasi insieme. La teoria di Zermelo con le semplificazioni e i perfezionamenti indicati, di solito formulata come teoria del primo ordine, è abitualmente simboleggiata con la sigla “Z?, o “ZC” se contiene anche l’assioma di scelta. Tutti gli assiomi di Z sono assiomi di ZF, ma in ZF l’assioma dell’infinito è in genere formulato in una forma lievemente modificata. Per capirne il motivo, osserviamo che, nella teoria assiomatica degli insiemi (cioè non solo in ZF, ma anche in NBG), i numeri cardinali e ordinali sono identificati con particolari insiemi secondo un meto-
do attribuito a von Neumann. Questo metodo modifica quello originale di Zermelo, che identificava il numero naturale 0 con l’insieme vuoto A, e il successore di un numero naturale n con l'insieme {n}. Von Neumann identifica anch’egli 0 con A, ma fa coincidere ciascun numero ordinale con l'insieme di tutti i suoi predecessori. Von 3 Quine ha proposto un modo di ammettere l’esistenza di individui anche in teorie degli insiemi caratterizzate dall’assioma di estensionalità Z(1) (v. Quine [1937a], p. 82, nota, Quine [1940] e [1951a], $ 25, pp. 134-135, e Quine [1969a], $ 4, pp. 31-32). Egli definisce gli indi-
vidui (controparti insiemistiche degli Urelemente) come un genere di insiemi, cioè quegli insiemi tali che x = {x} (questa, naturalmente, è una definizione, e dunque non implica che oggetti siffatti esistano). Quine giunge a questa definizione interpretando convenzionalmente il simbolo “x € y° come “x = y” quando y è un individuo. Se dunque y è un individuo, “x € y” è vero se e solo se x è l’individuo y; ma anche “xe {y}"” è vero se solo se x è l’individuo y; dunque si ha chexe y=x€ {y}; da cui, per l'assioma di estensionalità Z(1), deriva y= {y} (questo
naturalmente
comporta
y=
{y}=
{{y}}=
{{{y}}}.
ecc.). L’identificazione
di un
oggetto
con
un
insieme
contenente
solo
quest’oggetto è innocua perché non è ammessa per gli insiemi in generale, ma solo per quegli insiemi che sono la controparte insiemistica degli Urelemente (gli individui di Quine sono talora detti Urelemente, ma non sono Urelemente nel senso ristretto che abbiamo usato nel testo di oggetti diversi dall’insieme vuoto che non hanno elementi, perché, essendo identici al proprio insieme unità, hanno come elementi se stessi — ed è proprio questo che li distingue dall’insieme vuoto). La possibilità di concepire un individuo come la classe cui appartiene solo quell’individuo era già stata esaminata (ma infine respinta, perché non estensibile a tutti gli oggetti) da Frege nei Grundgesetze (v. Frege [1893-1903], vol. I, $ 10, p. 18, nota 1).
34 V. Zermelo [1908], $ 1, punto 14vy, p. 267 (in Zermelo [2010], p. 200, trad. ingl. a fronte, e in van Heijenoort (ed.) [1967], p. 205).
3 V. von Neumann [1923], p. 347 (ediz. orig., p. 199). È noto che la relazione uno-uno tra i numeri ordinali e quelli che oggi sono considerati numeri ordinali di von Neumann era già stata scoperta da Dimitry Mirimanoff nel 1917. In Mirimanoff [1917a], punto 5, pp. 45-47, l’autore si serve di quelli che chiama insiemi S, cioè insiemi del tutto analoghi ai numeri ordinali di von Neumann — la differenza essendo che l’elemento privo di elementi di un insieme S può essere qualunque individuo privo di elementi, e non solo l'insieme vuoto —, al fine di provare che per ogni numero ordinale c’è (almeno) un insieme (un insieme $) che non appartiene a se stesso (v. sopra, cap. 4, nota 114). In Mirimanoff [1917b], l’autore dedica alcune pagine all'esame degli insiemi S (punti 4 e 5, pp. 213-217) mostrando che «a ogni insieme S corrisponde un numero ordinale determinato; in effetti ogni insieme S può essere ben ordinato, è sufficiente per questo tradurre le relazioni “x è un elemento di y”, dove x e y sono due elementi qualunque dell’insieme, con le relazioni d’ordine “x precede y”» (punto 5, p. 217), e concludendo: «L’analogia che ho sottolineato permette di ricondurre la teoria degli insiemi ben ordinati a quella degli insiemi S. Non so se questo metodo indiretto presenti dei vantaggi reali. In ogni caso la teoria classica di Cantor appare così sotto un aspetto nuovo» (ibid.). È meno noto che Mirimanoff fu a sua volta preceduto da Russell e da Philip Jourdain. Già alla fine del 1905, infatti, Russell ([1906a], $ I, p. 143) si serve di classi molto simili agli insiemi S di Mirimanoff per dimostrare — con lo stesso metodo seguito da Mirimanoff — che l’insieme di tutti gli insiemi che non sono elementi di se stessi avrebbe un numero cardinale non inferiore a quello dell’insieme di tutti i
capitolo 12
780
Neumann identifica poi i numeri cardinali con gli ordinali iniziali, cioè con i più piccoli tra i numeri ordinali aventi la medesima cardinalità.?* Un ordinale iniziale è dunque un numero ordinale che non ha la stessa cardinalità di nessun numero ordinale minore — 0, altrimenti detto, un numero ordinale che non ha lo stesso numero cardinale di nessun suo elemento. In questo modo, i numeri cardinali finiti vengono a coincidere con i numeri apparte-
nenti alla prima classe di numeri (in senso cantoriano), cioè con i numeri ordinali finiti, e ciascun numero cardinale transfinito viene a coincidere con i/ primo numero ordinale in ciascuna classe di numeri successiva alla prima — cioè, in ciascuna classe contenente tutti i numeri ordinali aventi come numero cardinale uno stesso alef.?” Il metodo di von Neumann è più generale di quello di Zermelo, perché, mentre il metodo di Zermelo non si estende ai numeri transfiniti, quello di von Neumann funziona anche per i numeri transfiniti: un numero ordinale successore n (cioè un numero ordinale n che è il successore immediato di un altro ordinale) sarà n U {n} (unione di n con {n}), mentre un numero ordinale limite (cioè un numero ordinale 4 che è diverso da 0 e non è il successore
immediato di nessun numero ordinale) sarà l’unione di tutti i numeri ordinali precedenti. Per esempio, @ sarà semplicemente l’insieme dei numeri naturali, ordinati dalla relazione di appartenenza, mentre @ + 1 sarà @ LU {©}. Il metodo di von Neumann, inoltre, è tecnicamente più conveniente: esso rende immediata la relazione tra numeri
ordinali e cardinali, perché i numeri cardinali coincidono con gli ordinali iniziali, e ogni numero ordinale si trova ad avere il corrispondente numero cardinale di elementi; inoltre, una relazione che pone in un buon ordinamento,
in ordine di grandezza, i numeri ordinali (e i numeri cardinali) di von Neumann è la relazione più semplice che può esserci tra due insiemi: la relazione di appartenenza.” Nel sistema originale di Zermelo, l’assioma dell’infinito asseriva che esiste un insieme che contiene l’insieme
vuoto, e per ogni elemento x che contiene, contiene anche {x} — questo, data la concezione zermeliana dei numeri naturali, garantiva l’esistenza di un insieme contenente tutti i numeri naturali. Con l’adozione, nella teoria degli insiemi, dei numeri di von Neumann, si è di solito modificato l’assioma dell’infinito in modo che esso continui a
garantire l’esistenza di un insieme contenente tutti i numeri naturali (sebbene ciò non sia necessario, in presenza dell’assioma di rimpiazzamento, di cui parleremo tra poco). Per questo, in ZF (o NBG), si assume usualmente un assioma dell’infinito che asserisce l’esistenza di un insieme che contiene l’insieme vuoto e che, per ogni elemento
x che contiene, contiene anche l’unione di x con {x}; in simboli:
ZF(VI)
(AmM)AexA1M)E
x 23 yU {y} € x).
oppure, sciogliendo le abbreviazioni:
numeri ordinali (v. sopra, cap. 4, alla fine del $ 2.2). Nel 1906, nella sua corrispondenza con Russell, Jourdain aveva proposto di identificare il numero ordinale 0 con la classe vuota e ciascun altro ordinale con la serie dei numeri ordinali che lo precedono (v. sopra, cap. 8, $ 3). Come vedremo più avanti, in Zermelo [1930a] i numeri ordinali sono rappresentati mediante insiemi ordinati, chiamati “successioni di base” (Grundfolgen), che altro non sono se non gli insiemi S di Mirimanoff, considerati come ben ordinati dalla relazione e. Paul Bernays ([1941], $ 5, p.6 e p. 10) riferisce che Zermelo ebbe l’idea di definire i numeri ordinali alla maniera di von Neumann, in modo indipendente, intorno al 1915. La notizia è confermata da von Neumann, che in [1928b] (Einleitung, punto 1, p. 374, nota 2) riferisce di essere venuto
a conoscenza in seguito, attraverso una comunicazione personale, che Zermelo era giunto a una trattazione dei numeri ordinali simile alla sua nel 1916. 3© V. von Neumann [1928a], cap. 7, $ 2, p. 731, e [1928b], cap. 2, D, punto 3, p. 385. Anche in questa definizione, von Neumann fu antici-
pato da Philip Jourdain e da Russell. Nel 1906, Jourdain aveva infatti proposto a Russell di identificare il numero ordinale 0 con la classe vuota, ciascun altro ordinale con la serie dei numeri ordinali che lo precedono, e un numero cardinale con la classe di tutti predecessori di
un numero ordinale. Il suggerimento di Jourdain, che porterebbe alla conclusione errata di avere un diverso numero cardinale per ogni numero ordinale, fu emendato da Russell il quale, in una lettera a Jourdain del 14 giugno 1906 (v. in Grattan-Guinness [1977], p. 89), osservò
che, volendo definire i numeri ordinali alla maniera di Jourdain, un numero cardinale si potrebbe identificare con il primo numero ordinale tra quelli aventi lo stesso numero di predecessori (v. sopra, cap. 8, $ 3) — che è esattamente il modo in cui definisce i numeri cardinali von Neumann.
37 Potrebbe sorgere una perplessità dal fatto che, secondo von Neumann,
® = Xy, e tuttavia sappiamo che Xg + X0= No, mentre
0 + © # ©.
La soluzione del puzzle risiede nel fatto che “#” non indica la stessa operazione nei due casi. Nel primo caso, “x + x” indica l’ordinale più
piccolo che si può ottenere unendo due classi di x elementi; nel secondo, invece, indica il numero ordinale della serie che si ottiene ponendo una serie avente numero ordinale x dopo una serie avente numero ordinale x. 38 Più esplicitamente, data la classe ON dei numeri ordinali di von Neumann, la relazione e ristretta a ON — nella simbologia dei Principia
(v. [PM], vol. I, *36.01), e } ON (cioè la relazione%$ (x € y A x e ON n ye ON) — è una relazione ben ordinata, che si può identificare con la relazione < tra numeri ordinali. Un’altra relazione che pone i numeri ordinali di von Neumann in un buon ordinamento è la relazione di inclusione propria ristretta a ON.
Alternative, critiche e proposte di emendamento al sistema dei Principia
(I) ((Ay)(y e x A (2)(ZzE MAME
x 2 (A2)(ze
x
A(W(we z=(we
781
yvw=y)))).
ZF contiene due assiomi più di Z: l'assioma di rimpiazzamento e V assioma di fondazione (detto anche assioma di regolarità). L’assioma di rimpiazzamento
(Ersetzungsaxiom) —
in realtà, uno schema d’assiomi, se ZF è
formulata come teoria del primo ordine — afferma che, dato un insieme, si può formarne un altro rimpiazzandone gli elementi con altri elementi (non necessariamente distinti). Più precisamente, possiamo enunciare l'assioma così: dato un qualsiasi insieme x e una qualsiasi relazione uno-molti, esiste l'insieme di tutti gli elementi che hanno tale relazione con elementi di x; in simboli:
ZF(VID.
(1) (12) (13) (F(22, x1) A_F(23, x) D Y:=X3) 3 AAA e y= Amwe x A FG, ww)
dove “x°?, “Y”, “7” e “W” sono variabili distinte e “F(z, w)” sta al posto di una formula ben formata di ZF contenente le variabili libere “27” e “w? ma non contenente la variabile “y” libera. (Si noti che la formula rappresentata da “F(z, w)” potrà in generale contenere variabili libere diverse da “x”, “7” e “W”, poniamo “w,”, ..., “wy,”: in tal caso, ZF(VII) conterrà delle variabili libere, e si deve considerare come equivalente alla sua chiusura universale, 0ssia a ZF(VII) preceduto dai quantificatori universali “(w1)”... “(w,)” che vincolano ciascuna di queste variabili libere.) L’antecedente di ZF(VII) impone la condizione che la formula “F(---, —)” rappresenti una relazione unomolti. GOTI
602
66299
6699
66.99
6629
*° Alcuni autori includono in Z l'assioma di fondazione.
40 Di solito si attribuisce la paternità di quest’assioma a Fraenkel, o a Skolem, che lo formularono, indipendentemente, nel 1922 (v. Fraenkel [1922a],
$ I, p. 231, e Skolem
[1923], punto 4, p. 297). Il nome
“assioma di rimpiazzamento”
(Ersetzungsaxiom)
è di Fraenkel
([1922a], $ I, p. 231). Fraenkel, tuttavia, considerava l’assioma utile in indagini speciali che richiedono di dimostrare l’esistenza di certi
numeri cardinali transfiniti, ma troppo potente da assumersi in una teoria generale degli insiemi (v. Fraenkel [1922a], $ I p. 231, e $ II p. 233). Il primo a includere l’assioma di rimpiazzamento tra gli assiomi della teoria generale degli insiemi fu von Neumann ([1923], [1925]).
In von Neumann [1923], p. 347 e p. 348, nota (ediz. orig., p. 199 e p. 208), l’assioma è chiamato «assioma di Fraenkel», e anche in von Neumann [1925], parte I, $ 2, p. 398, si legge che «l’assioma di rimpiazzamento [è] dovuto a Fraenkel». Prima di Fraenkel, però, l’assioma di rimpiazzamento era stato introdotto da Mirimanoff, in un sistema diverso da quello di Zermelo, in cui si distingue tra insiemi ordinari, che sono ben fondati (un insieme xy è ben fondato se non esiste una successione infinita di appartenenze della forma ... € xn41 € Xn € ... E X3 E X9 E Xj € x9;), € insiemi straordinari, che non lo sono; l’assioma di rimpiazzamento di Mirimanoff afferma che se un insieme di insiemi ordinari è cardinalmente simile a un insieme ordinario, allora è esso stesso un insieme ordinario (v. Mirimanoff [1917a], punto 7, p.
49, postulato 3). Alla fine degli anni Venti del Novecento, Zermelo aggiungerà alla lista dei suoi assiomi quello di rimpiazzamento (v. Zermelo [1930a], $ 1, pp. 30-31, assioma E (in Zermelo [2010], p. 402, trad. ingl. a fronte; in Cellucci (ed.) [1978], p. 180 (dove è chiama-
to “R”); in Ewald (ed.) [1996], vol. II, p. 1220). “n
questa formulazione (v., per es., Skolem [1923], punto 4, p. 297; Mendelson
[1964], $ 4.1, p. 239; Hatcher [1968], $ 30, p. 261, e
[1982], $ 5.2, p. 157; Fraenkel e Bar-Hillel [1973], cap. 2, $ 3.7, p. 52), l'assioma ammette che l’insieme risultante dal rimpiazzamento possa essere costituito dai rimpiazzi di una parte degli elementi di un insieme (l’antecedente di ZF(VII), infatti, impone che per ogni elemento x; ci sia a/ più un elemento x, tale che f(x, x), ma non che ce ne sia almeno uno). In altre formulazioni si richiede invece che
l’insieme risultante dal rimpiazzamento sia costituito dai rimpiazzi di tutti gli elementi di un insieme dato (v., per es.: Mirimanoff [1917a], punto 7, p. 49, postulato 3; Fraenkel [1922a], $ I, p. 231; von Neumann [1923], p. 347, nota 2 (ediz. orig., p. 208); Zermelo [1930a], $ 1, pp. 30-31, assioma E (in Zermelo [2010], p. 402, trad. ingl. a fronte; in Cellucci (ed.) [1978], p. 180; in Ewald (ed.) [1996], vol. II, p. 1220); Skolem [1941], $ 2, p. 36, assioma (9) (in Skolem [1970], p. 466); Fraenkel [1958], 5, pp. 22-23), condizione che si può imporre,
per es., aggiungendo all’antecedente di ZF(VII) la clausola che x coincida con il dominio inverso della relazione definita dalla formula rappresentata da “F(---, —)” (come in Bernays [19441], $ 4, p. 2, assioma V.b (dove si richiede anche che la relazione sia uno-uno), e in Carnap [1954], $ 43, p. 280), oppure prendendo “(x1) (4x2) (x3) (F(43, x1) = x = x3)” come antecedente di ZF(VII) al posto di “(x1) (x2) (13) (Fa, xi) A_F(x3, x1) D x: = X3)” (come in Skolem [1941], $ 2, p. 36 (in Skolem [1970], p. 466)). Queste ultime formulazioni dell’assioma — a differenza della nostra formulazione (v. sotto, note 42 e 43) —, non implicano l’esistenza di un insieme vuoto, e implicano l’assioma di se-
parazione solo in presenza dell’assioma dell’insieme vuoto (0, detto altrimenti, implicano solo una forma più debole dell’assioma di separazione, la quale garantisce l’esistenza di un insieme y, formato dagli elementi di un insieme dato x i quali abbiano una certa proprietà assegnata, solo se quest’insieme y non risulta vuoto).
capitolo 12
782
Se si adotta l'assioma di rimpiazzamento, l'assioma di separazione diviene superfluo, perché segue dal primo,‘
e diviene superfluo anche l'assioma della coppia, perché segue dagli assiomi di rimpiazzamento e dell’insieme potenza.‘ Quasi sempre, tuttavia, si mantengono in ZF anche gli assiomi di separazione e della coppia, insieme a quello di rimpiazzamento — anche se il sistema assiomatico diviene così ridondante —, allo scopo di distinguere tra teoremi che richiedono, per essere dimostrati, tutta la potenza dell’assioma di rimpiazzamento e teoremi che invece si possono dimostrare ricorrendo ai molto più deboli assiomi di separazione e della coppia. L'assioma di rimpiazzamento non fu, in effetti, introdotto per eliminare altri assiomi, ma perché — come scoprirono Fraenkel e Skolem, indipendentemente l’uno dall’altro, intorno al 1922 — è indispensabile per dimostrare l’esistenza di molti insiemi transfiniti: per esempio, dell’insieme {@, 4, @, ...} dove @ è l’insieme dei numeri naturali, e 441 è l’insieme potenza di @,. Se si assume l’ipotesi generalizzata del continuo, l’unione dell’insieme {%, &, @, ...} ha numero cardinale &,; ciò significa che, assumendo l’ipotesi generalizzata del continuo, la teoria di Zermelo non è in grado di dimostrare l’esistenza di insiemi che hanno un numero cardinale maggiore o uguale ad No Se —
com'è abituale —
si adotta la teoria dei numeri ordinali di von
Neumann, l'assioma di rimpiazzamento risulta
necessario già per garantire l’esistenza del numero ordinale 2@ (interpretato come “due volte omega”, cioè, © + ©). L'assioma dell’infinito di ZF garantisce l’esistenza dell'insieme dei numeri naturali (ordinali finiti) {0, 1, 2, 3, ...}, che è il numero ordinale @. Usando ora gli assiomi Il e V di Z, possiamo dimostrare che esistono i numeri +1,
0+ 2, ®@+
3, ..., e, in generale, per ogni © + n, il numero ® + (n+ 1). Infatti, secondo il metodo di von
a®@+ 1 U {© + 1}, e, in generale, 0+ (n+1)=@+nU Neumann, @®+ 1 è uguale a © U {©}, ©@+ 2 è uguale {®+ n}. Se ora vogliamo procedere a dimostrare l’esistenza del numero ordinale 2© dobbiamo servirci dell’assioma di rimpiazzamento. Allo scopo, rimpiazziamo, nell’insieme dei numeri naturali, ciascun numero ordinale finito n con il numero
® + n, ottenendo così l’insieme {@, @ + 1, ®@ + 2, © + 3, ...}; formiamo
infine
l’unione di tutti questi insiemi, che sarà il numero ordinale (di von Neumann) © + © = 2@. Possiamo poi procedere, sempre con l’aiuto dell’assioma di rimpiazzamento applicato all’insieme dei numeri naturali, rimpiazzando ciascun numero n con il numero di von Neumann
2@ + n, a dimostrare l’esistenza di 3@. Con lo stesso metodo,
Fava per es.: Zermelo [1930a], $ 1, p. 31 (in Zermelo [2010], p. 404, trad. ingl. a fronte; in Cellucci (ed.) [1978], p. 180; in Ewald (ed.) [1996], vol. II, p. 1220); Suppes [1960], cap. 7, $ 7.5, p. 237; Stoll [1963], cap. 7, $ 6, p. 303; Fraenkel, Bar-Hillel e Lévy [1973], cap. 2, $
3.7, p. 52. La dimostrazione che l’assioma di separazione segue da quello di rimpiazzamento è semplice. Prendiamo, in ZF(VII, Fx, x1) come H(x, x1) = (x2= x, A G(x)), dove G è una proprietà qualsiasi. La relazione rappresentata da “H(x, x)” è dunque una relazione unomolti (di fatto, uno-uno) tra ciascun x, che ha la proprietà G e se stesso (si può cioè vedere la relazione rappresentata da “H(x,, x)” come una funzione che per ogni x; che ha la proprietà G dà come valore (un x, che è uguale a) x stesso); quindi, l’antecedente di ZF(VII) è vero e, se “G(z)” è scelta in modo da non contenere la variabile “y” libera, si ha il conseguente: (x) (Ey) (2) (: € y= (Aw)(w e x A_H(z, w))), cioè:
Man) (ze y= (Ame
xAz=wA GW),
che equivale a:
MAr
ey= (e x A G(2)),
che è l’enunciato dello schema d’assiomi di separazione. (Se l’assioma di rimpiazzamento è formulato come in Skolem [1941], $ 2, p. 36 (v. sopra, nota 41), allora, supponendo che la classe degli y che hanno la proprietà G menzionata nel precedente enunciato dell’assioma di separazione non sia vuota, si può prendere F(x,, x) come una funzione H(x, x) tale che: se x; ha la proprietà G, dà come valore (un x, che è uguale a) x, stesso, e se x, ron ha la proprietà G, dà come valore (un x, che è uguale a) un arbitrario elemento a della classe y il quale abbia la proprietà G (per l’ipotesi, deve essercene almeno uno). Così definita, la relazione rappresentata da “H(x, x})” è una relazione unomolti (di fatto, uno-uno) tale che per ogni x; esiste un x, tale che H(x,, x1); quindi soddisfa l’antecedente dell’assioma di rimpiazzamento nella formulazione di Skolem [1941], e dimostra, con il conseguente dello stesso assioma, l’esistenza dell’insieme di tutti gli elementi di y
che hanno la proprietà G — alla condizione sopraddetta, cioè a condizione che quest’insieme non sia vuoto: se invece l’insieme in parola è vuoto, se ne deve dimostrare l’esistenza con l’assioma dell’insieme vuoto. (VO per es.: Zermelo [1930a], $ 1, p. 31 (in Zermelo [2010], p. 404, trad. ingl. a fronte; in Cellucci (ed.) [1978], p. 180; in Ewald (ed.) [1996], vol. II, p. 1220); Suppes [1960], cap. 7, $ 7.5, p. 237; Stoll [1963], cap. 7, $ 6, pp. 303-304; Fraenkel, Bar-Hillel e Lévy [1973],
cap. 2, $ 3.7, p. 52. Che l’assioma della coppia si deduce dagli assiomi di rimpiazzamento e dell’insieme potenza si può verificare come segue. Usando due volte l'assioma dell’insieme potenza applicato all’insieme vuoto, A, otteniamo l’insieme {A, {A}} (perché l’insieme potenza di A è {A} e l’insieme potenza di {A} è {A, {A}}). Dati ora gli insiemi qualsiasi a e 5, possiamo formarne l’insieme coppia {a, b} applicando l’assioma di rimpiazzamento a {A, {A}}, in modo da rimpiazzarne gli elementi A e {A}, rispettivamente, con a e È (allo Scopo, si può usare la relazione uno-molti tra y e x espressa da: (x= A A y= a) v (x= {A} A y= b)”). L'esistenza dell’insieme vuoto consegue da ZF(VII), perché la relazione vuota è una relazione uno-molti (v. sopra, cap. 2, alla fine del $ 3.4.1), e quindi soddisfa l’antecedente di
ZF(VII) (lo stesso risultato si ottiene considerando che la dimostrazione precedente dell’esistenza di una coppia si può ottenere anche prendendo un Urelement qualsiasi al posto dell’insieme vuoto — e che l’esistenza di almeno un'entità priva di elementi consegue dall’assioma di separazione, il quale, a sua volta, come abbiamo visto consegue da ZF(VII)).
44 V. Fraenkel [1922a], $ I, pp. 230-231, e Skolem [1923], punto 4, pp. 296-297. V. anche la lettera di Fraenkel a Zermelo datata 6 maggio 1921, il cui passo saliente è riportato in G. H. Moore [1982], $ 4.9, p. 263, nota 10.
Alternative, critiche e proposte di emendamento al sistema dei Principia
783
otteniamo 4@, 5®, ecc. Avendo la serie ®©, 20, 3@, ... possiamo ancora applicare l'assioma di rimpiazzamento all’insieme dei numeri naturali per ottenere l’insieme {@, 20, 3@, ...}, la cui unione ci darà il numero @ x ©. In
generale, l’uso dell’assioma di rimpiazzamento si può schematizzare così: si definisce una funzione che associa ciascun elemento n dell’insieme © dei numeri naturali un insieme f(n) la cui esistenza è dimostrabile; poi si usa l’assioma di rimpiazzamento per formare l’insieme di tutti gli f(n); infine si usa l'assioma dell’unione per dimostrare l’esistenza di un nuovo numero ordinale. Dopo aver introdotto l’assioma di rimpiazzamento, possiamo comprendere facilmente il motivo per cui in ZF (e in NBG) non si usa il metodo russelliano di costruzione dei numeri —
che, come sappiamo (v. sopra, cap. 2), i-
dentifica i cardinali con insiemi ciascuno dei quali raccoglie tutti gli insiemi che sono tra loro cardinalmente simili, e gli ordinali con gli insiemi ciascuno dei quali raccoglie tutte le relazioni seriali ben ordinate che sono tra loro ordinalmente simili. Il motivo risiede proprio nell’assioma di rimpiazzamento. Infatti, in presenza di insiemi i cui elementi possano essere posti in correlazione uno-uno con tutti gli oggetti, l'assioma di rimpiazzamento reintrodurrebbe nella teoria di Zermelo il paradosso di Russell, perché consentirebbe di dimostrare l’esistenza di un insieme universale, e dunque — per separazione da esso — dell’insieme di tutti gli insiemi che non appartengono a se stessi. Pertanto, se ZF è consistente, i suoi assiomi non possono ammettere l’esistenza di insiemi “troppo grandi”. Tra questi vi sono i numeri di Russell: per esempio, si prenda il numero 1; esso è, per Russell, l'insieme di tutti gli insiemi di un elemento; ma qualsiasi oggetto può essere correlato biunivocamente con l’insieme che contiene esattamente quell’oggetto; dunque, già il numero 1 di Russell è “troppo grande” per esistere in ZF. Ciò spiega perché nella teoria assiomatica degli insiemi i numeri non sono definiti alla maniera di Russell (e Frege). Il numero 1 di ZF (e di NBG) è, in effetti, molto più maneggevole, perché contiene solo un elemento: l'insieme vuoto. Si osservi, però, che l'abbandono del metodo russelliano ha un prezzo. Questo metodo consente infatti di con-
cepire elegantemente i numeri ordinali come particolari tipi d’ordine, e i tipi d’ordine come particolari numerirelazione: in ogni caso, si tratta di insiemi includenti tutte le relazioni ordinalmente simili a una relazione data. Ma con il metodo di von Neumann questa generalizzazione si perde, e diventa necessario definire separatamente ogni tipo d’ordine identificandolo con qualcosa che, secondo il metodo russelliano, sarebbe stato un esempio di tale tipo d’ordine. Veniamo ora all’assioma di fondazione (Axiom der Fundierung; Fundierungsaxiom).* Nella sua formulazione usuale (risalente a von Neumann [1929]), esso afferma che ogni insieme non vuoto y ha almeno un elemento x il quale non ha alcun elemento in comune con y: ZF(VII)
(ay)
e x) 2 (42)(ze
x A-(AW)(we
zAWE
»)).
Il nome “assioma di fondazione” è di Zermelo ([1930a]) e si deve al fatto che quest’assioma, insieme con altri
assiomi di ZF, implica che non possa esistere un insieme x non ben fondato, ossia da cui parta una successione infinita discendente di appartenenze della forma: GRADI
RAI
RE
AIA
vale a dire, un insieme xy tale che l'insieme x, +, sia elemento dell’insieme x, per ogni numero naturale n.*° Assu-
mendo l’assioma di scelta (come in ZFC), si ha che, viceversa, dalla negazione dell’esistenza di insiemi non ben fondati deriva l'assioma di fondazione,” cosicché — se è vero l’assioma di scelta — ZF(VIII), o negando l’esistenza di insiemi non ben fondati è equivalente."
formulare l’assioma con
45 Per una storia leggibile dell’assioma di fondazione si vedano Arpaia [2005a] e Arpaia [2005b]. 4© Si supponga infatti, per assurdo, che l’assioma di fondazione sia vero, ma che esista un insieme x) che non è ben fondato, cioè tale che, per ogni numero naturale n, ci sia un insieme xn+1€ Xp. Si formi l’insieme y di tutti questi insiemi (per farlo, si può usare l'assioma di rim-
piazzamento, descrivendo y come l’insieme ottenuto dall’insieme dei numeri naturali rimpiazzandone ciascun elemento n con l’elemento f()=x,). In quest’ipotesi, per ogni elemento x, di y c'è sempre un elemento in comune tra y e x, (l'elemento x, + 1), in contraddizione con l’ipotesi che l’assioma di fondazione sia vero (e dunque valga anche per y).
47 Supponiamo infatti, per assurdo, che non esistano insiemi non ben fondati, ma che l’assioma di fondazione sia falso, cioè che esista un insieme y tale che ogni elemento di y abbia un elemento in comune con y. Formiamo l'insieme z che contiene y e, per ogni elemento di y, l’intersezione tra quest’elemento e y. Per l’assioma di scelta, esiste un insieme che contiene uno e un solo elemento per ciascun membro di
z. Sia f(x) elemento scelto da un qualsiasi membro x di z. Si definisca (per induzione) una funzione g, sui numeri naturali, siffatta:
g(0)=/0)
g(n+1)=f( My).
7184
12 capitolo
Si sarà notato che, a differenza di tutti gli altri assiomi di ZF e ZFC, l’ assioma di fondazione restringe, anziché
ampliare, l’universo degli insiemi. Ciò implica che esso non possa essere richiesto per aumentare la potenza ma-
tematica della teoria. Osservando che l’assioma implica, in ZF, che nessun insieme possa essere elemento di se
stesso, e che ciò rende l’insieme di Russell (l’insieme di tutti gli insiemi che non appartengono a se stessi) coincidente con l’insieme universale — la cui esistenza dev'essere esclusa in ZF (così come in Z) —, si potrebbe supporre che esso sia stato introdotto per evitare qualche paradosso. Questo è ciò che talora si legge, nella letteratura meno accurata, ma si tratta di un resoconto errato. L'assioma di fondazione non elimina alcun paradosso: è infatti ovvio che se ZF senza l’assioma di fondazione fosse inconsistente, l’aggiunta di un assioma non potrebbe renderla consistente, perché una contraddizione continuerebbe a essere ricavabile dagli altri assiomi. D'altra parte sappiamo che i paradossi di Cantor, Burali-Forti e Russell sono già completamente neutralizzati, in Z, dall’assioma di separazione. Ma se i suoi proponenti non ritenevano che servisse per evitare antinomie, perché mai aggiunsero quest’assioma a quelli zermeliani del 1908? Il problema, in realtà, non erano i paradossi, ma piuttosto la compati-
bilità degli assiomi originali di Zermelo con diversi possibili “universi” di insiemi: alcuni in cui sono presenti solo insiemi ben fondati (questo perché non c’è nessun assioma, nel sistema originale di Zermelo, che permetta di costruire insiemi non ben fondati), altri comprendenti anche insiemi non ben fondati (questo perché non c’è nessun assioma, nel sistema originale di Zermelo, che neghi l’esistenza di quest’ultimo tipo di insiemi). A questa conclusione giunsero, indipendentemente, Fraenkel e Skolem, rispettivamente, nel 1921 e nel 1922.° Poiché si riteneva
che gli insiemi non ben fondati fossero: (i) superflui per gli scopi della matematica ordinaria, (ii) intuitivamente poco plausibili, la maggior parte degli autori decise di liberarsene, negandone l’esistenza con un nuovo assioma.
Avremo dunque che g (0) è un elemento di y e, per ogni n, g (n + 1) è un elemento di g (n); quindi y non è un insieme ben fondato, in contraddizione con l’ipotesi che non vi siano insiemi del genere.
48 La dimostrazione che l’equivalenza delle due formulazioni richiede l’assioma di scelta è stata fornita per la prima volta in Mendelson [1958]. 4° Supponiamo infatti, per assurdo, che l’assioma di fondazione sia vero, ma che esista un insieme x tale che x e x, cioè che abbia x tra i suoi elementi. Se x è l’unico elemento di x ciò è impossibile, perché x avrebbe in comune con il suo unico elemento x l’elemento x stesso, in contraddizione con l’ipotesi che l’assioma di fondazione sia vero. Se x non è l’unico elemento di x, allora l'assioma della coppia di ZF garantisce l’esistenza dell’insieme {x} avente x come unico elemento. Ma ciò non può essere, perché {x} e x avrebbero in comune l’elemento x, in contraddizione con l’ipotesi che l’assioma di fondazione sia vero (e dunque valga anche per {x}). Questo implica, incidentalmente, che la concezione degli individui di Quine che abbiamo esposto nella nota 33 sia incompatibile con i sistemi in cui si assume l’assioma di fondazione. 5° V. Fraenkel [1922a] (l’articolo è del luglio 1921), $ II, pp. 233-234, e Skolem [1923], punto 6, p. 298.
° Non tutti la pensarono così, però: Dimitry Mirimanoff (v. Mirimanoff [1917a]) ammette l’esistenza di insiemi non ben fondati, che
chiama insiemi straordinari, in contrapposizione ai ben fondati insiemi ordinari — sebbene egli limiti il suo studio agli insiemi ordinari. Più tardi, Paul Finsler (v. Finsler [1926]) svilupperà la prima teoria degli insiemi non ben fondati, la quale contiene inoltre un assioma di completezza (Axiom der Vollstiindigkeit: v. Finsler [1926], $ 5, p. 110) — analogo all’assioma di completezza (Axiom der VollIstindigkeit) già proposto da Hilbert, per i numeri reali in Hilbert [1900a] ($ 4, p. 183; in Hilbert [1985], p. 142), e per le entità della geometria, nelle
prime edizioni francese (1900, $ 3, p. 25: «Axiome d’intégrité (Vollstindigkeit)») e inglese (1902, $ 8, p. 25: «Axiom of Completeness (Vollstindigkeit)») di Hilbert [1899] — il quale, postulando che esistano zuzti gli insiemi la cui esistenza non sia in contraddizione con gli altri assiomi della teoria (in realtà, si tratta dunque di un meta-assioma), assicura (tra l’altro) l’esistenza di tutti gli insiemi non ben fondati che non rendono incoerente la teoria. La teoria di Finsler è una teoria pura degli insiemi informale, basata su due assiomi, oltre al menzionato assioma di completezza (v, Finsler [1926], $ 5, p. 110). Il primo asserisce che, per insiemi arbitrari M e N, deve essere sempre determinato se M appartiene a N o no; il secondo asserisce che insiemi isomorfi sono identici, laddove, secondo la definizione di Finsler, un insieme M è isomorfo a un insieme N se e
solo se esiste una relazione uno-uno tra gli elementi del più piccolo insieme transitivo (un insieme è transitivo quando tutti gli elementi di tutti i suoi elementi sono anche suoi elementi; cosa che si può esprimere anche dicendo che un insieme è transitivo quando ogni suo elemento è anche un suo sottoinsieme) che contiene M (quindi, il più piccolo insieme che ha per elementi M, tutti gli elementi di M, tutti gli elementi degli elementi di M... e così via) TC(M) (“TC(M)” sta per “la chiusura transitiva dell’insieme M”), e gli elementi del più piccolo insieme transitivo che contiene N, TC(N), tale che: (1) preservi la relazione € (la relazione e è preservata da una relazione uno-uno tra gli elementi di TC(M) e quelli di TC(N) se e solo se la relazione e vale tra due elementi di TC(M) quando e solo quando vale tra gli elementi corrispondenti (secondo la relazione uno-uno data) di TC(N)); (2) faccia corrispondere tutti gli elementi di M con tutti quelli di N (v. Finsler [1926], $ 7, pp. 112-113). Questo concetto di isomorfismo si trova anche in Mirimanoff, il quale definisce (ricorsivamente) due insiemi
isomorfi se e solo se esiste una relazione uno-uno tra gli elementi dell’uno e quelli dell’altro tale che ad ogni elemento dell’uno che non sia
un insieme faccia corrispondere uno e un solo elemento dell’altro che non è un insieme, e a ogni elemento dell’uno che sia un insieme faccia corrispondere uno e un solo insieme dell’altro isomorfo al primo (v. Mirimanoff [1917b], punto 2, pp. 211-212). Il primo assioma di Finsler è volto a escludere — nelle intenzioni del suo autore — gli insiemi paradossali, che appartengono e non appartengono a uno stesso insieme. Il secondo assioma implica che oggetti con gli stessi elementi siano identici — cosicché, per es., gli insiemi {{A}, {A, {A}}} e {{e}, {e, {e}}}, dove e è un oggetto qualsiasi privo di elementi, siano il medesimo insieme (ciò che configura una teoria pura degli insie-
mi) —, ma è un assioma di estensionalità più forte di quello di ZF perché implica, per esempio, che vi sia un solo insieme (non ben fondato) che ha se stesso come elemento. L’idea di Finsler è quella di avere una teoria che ammetta rutti gli insiemi la cui esistenza non sia con-
Alternative, critiche e proposte di emendamento al sistema dei Principia s
.
.
x
.
vita
se
.
A
785 S2
>
.
Nel 1922 Fraenkel suggerì un assioma che chiamò di restrizione (Beschrénktheitsaxiom),” affermante che i soli insiemi esistenti sono quelli generabili a partire dall’insieme vuoto tramite l'applicazione degli assiomi di Zermelo e dall’assioma di rimpiazzamento — con lo scopo di eliminare tutti gli insiemi ritenuti matematicamente “superflui”.°* Una forma di assioma di fondazione fu formulata da von Neumann nel 1925, e fu poi modificata dallo
.
stesso von Neumann, in una forma equivalente all’attuale ZF(VII), nel 1929 — ma in nessuno dei due casi von Neumann incluse l’assioma nel sistema assiomatico di base.” Zermelo fu il primo, nel 1930, ad aggiungere
l’assioma di fondazione (insieme con quello di rimpiazzamento) al suo sistema originale (dal quale era stato eliminato l’assioma dell’infinito, così da ottenere, infine, ZFC meno l’assioma dell’infinito).”° L’assioma di restrizione di Fraenkel aveva l’obiettivo di rendere, come si dice tecnicamente, categorica la teo-
ria di Zermelo — se formulata, come in origine, al second’ordine. Una teoria degli insiemi categorica caratterizzerebbe univocamente (a meno di isomorfismi) l'universo degli insiemi esistenti: sarebbe quindi una descrizione completa dell’universo degli insiemi. Supponiamo di aver formulato la teoria di Zermelo con un assioma di estensionalità che escluda l’esistenza di Urelemente distinti dall’insieme vuoto. Abbiamo dunque la teoria assiomatica che abbiamo chiamato “ZC”. Naturalmente, se ZC è formulata in un linguaggio del primo ordine, essa non può essere categorica, perché il teorema di Lòwenheim-Skolem dimostra che ogni teoria del primo ordine avente un modello (cioè un’interpretazione in un certo universo di individui che la rende vera)” infinito non numerabile
traddittoria, identificando tutti gli insiemi che non sia utile tenere distinti; ma è dubbio che il suo sistema si possa considerare soddisfacente (v. Holmes [1996], $$ 5.1-5.4). Tuttavia, negli anni Ottanta dello scorso secolo, Peter Aczel (v. Aczel [1988]) ha sviluppato una teoria as-
siomatica in cui si aggiunge al sistema ZFC, privato dell’assioma di fondazione, un assioma — noto come assioma di antifondazione (AFA) — che implica l’esistenza di insiemi non ben fondati e, come il secondo assioma di Finsler, implica l’identità degli insiemi isomorfi. Da allora, le teorie degli insiemi che affermano l’esistenza di insiemi non ben fondati hanno ricevuto un’attenzione sempre maggiore. Il termine iperinsiemi (hypersets) — coniato da Aczel — si usa per designare collettivamente gli insiemi ben fondati e quelli non ben fondati.
°? V. Fraenkel [1922a], $ II, pp. 233-234. 93 L'assioma proposto da Fraenkel, in forma dubitativa, nel 1922 era in realtà inaccettabile come assioma della teoria degli insiemi: si trattava piuttosto un meta-assioma della teoria, perché non poneva condizioni sugli insiemi, ma sui modelli accettabili della teoria degli insiemi. Di esso furono però offerte due formulazioni come assioma appartenente alla teoria degli insiemi, di forza crescente, — chiamate “Primo assioma di restrizione” e “Secondo assioma di restrizione” — da Azriel Lévy in Fraenkel, Bar-Hillel e Lévy [1973], cap. 2, $ 6.4, pp.
114-116. Il Primo assioma di restrizione non comprende solo il principio secondo cui tutti gli insiemi sono ben fondati (assioma di fondazione), ma anche quello secondo cui non esistono insiemi di potenza inaccessibile. Per un’altra formulazione teoretica rigorosa dell’assioma di restrizione, v. Carnap [1954], ediz. americana, $ 43b.
% In von Neumann [1925] l’autore respinge il Beschranktheitsaxiom di Fraenkel — obiettando che esso farebbe appello a una teoria intuitiva degli insiemi, o a una metateoria degli insiemi nella quale sia legittimo chiedersi se una teoria degli insiemi soddisfi determinati requisiti (v. von Neumann [1925], parte II, $ 1, pp. 404-405) — e offre in sua (parziale) vece una forma di assioma di fondazione (non incluso però nel sistema assiomatico di base) che asserisce che non esiste una funzione ftale che, per ogni numero ordinale finito n, f(n+1) e f(n) (v. von Neumann
[1925], parte II, $ 5, p. 412, assioma VI 4). La formulazione è in termini di funzioni, anziché di classi, ma tradotta nel
linguaggio delle classi ammonta a escludere l’esistenza di classi non ben fondate. La formulazione dell’assioma di fondazione in von Neumann [1929] (Einleitung, punto 4, p. 231, assioma VI 4) è sempre in termini di funzioni, anziché di classi, ma tradotta nel linguaggio delle classi corrisponde all’enunciazione che abbiamo dato dell’assioma di fondazione in ZF(VIII). Come già osservato, né in [1925], né in [1929] von Neumann include l’assioma nel sistema assiomatico di base. In [1929]
von Neumann si serve dell’assioma per dimostrare che il suo sistema di teoria degli insiemi, che von Neumann sigla con “S° — includente gli assiomi dell’insieme unione, dell’insieme potenza, e dell’insieme infinito, più l'assioma che designeremo più avanti con NBG(L) —, è coerente se è tale una sua versione più simile a ZF, siglata “S*”, in cui l'assioma NBG(L) è sostituito dagli assiomi di rimpiazzamento e di scelta. Dapprima von Neumann dimostra che se S* è coerente rimane tale se ad esso si aggiunge l’assioma di fondazione, poi dimostra che da S* così modificato (un sistema in cui non vi sono Urelemente diversi dalla classe vuota) segue S. Zermelo ([1930a], $ 1, p. 31, assioma F (in Zermelo [2010], p. 402, trad. ingl. a fronte; in Cellucci (ed.) [1978], p. 180; in Ewald (ed.) [1996], vol. II p. 1220)) sarà il primo a includere l’assioma di fondazione tra gli assiomi di ZF, mentre Bernays ([1941], $ 4, p. 6, assioma VII) sarà il primo a includerlo tra gli assiomi di NBG (con il nome di “assioma restrittivo”). 5 V. Zermelo [19302], $ 1, p. 31, assioma F (in Zermelo [2010], p. 402, trad. ingl. a fronte; in Cellucci (ed.) [1978], p. 180; in Ewald (ed.) [1996], vol. II, p. 1220)): «Ogni catena (discendente) di elementi, in cui ogni membro è un elemento del precedente, si interrompe a un in-
dice finito con un Urelement. Oppure, ciò che ha lo stesso significato: ogni sottodominio [Teil/bereich] T contiene almeno un elemento che non ha alcun elemento 7 in 7». Come abbiamo già osservato, le due asserzioni sono equivalenti solo se si assume l’assioma di scelta. L’assioma di scelta non è incluso tra gli assiomi di Zermelo [1930a]; Zermelo spiega che esso «non è stato formulato esplicitamente perché ha un carattere diverso dagli altri e non può servire per la delimitazione dei domini» (Zermelo [1930a], $ 1, p. 31 (in Zermelo [2010], p. 404, trad. ingl. a fronte; in Cellucci (ed.) [1978], p. 180; in Ewald (ed.) [1996], vol. II, p. 1220)), ma aggiunge: «Esso sarà però posto alla
base di tutta la nostra ricerca come principio logico generale, e in particolare, sulla base di tale principio, ogni insieme che compare nel seguito sarà anche considerato come ben ordinabile |[wohlordnungsfahig]» (ibid.). L’assioma di scelta non è dunque inserito tra gli assiomi insiemistici di Zermelo [1930a], perché è considerato un principio logico (l’assioma di scelta era del resto già chiamato «principio logico» in Zermelo [1904], p. 516 (in Zermelo [2010], p. 118, trad. ingl. a fronte, e in van Heijenoort (ed.) [1967], p. 141)). Il nome “assioma di fondazione” (Axiom der Fundierung) è di Zermelo. °° Per una spiegazione più accurata del concetto di modello, v. sopra, cap. 2, nota 139.
786
capitolo 12
(come ZC, in cui è dimostrabile il teorema di Cantor), ha anche un modello infinito numerabile. Il teorema di Lò-
wenheim-Skolem non vale per le teorie di ordine superiore. Ma, anche se formulata al second’ordine, ZC non è
categorica: essa non decide, per esempio, se esista o no il numero ordinale di von
Neumann 20, o se esistano o no
insiemi non ben fondati. Supponiamo dunque di aggiungere a ZC, formulata al second’ordine, gli assiomi di fon-
dazione e di rimpiazzamento formulati al second’ordine, così da ottenere ZFC formulata al second’ordine. Il sistema così formato è finalmente categorico? Quasi, ma non del tutto, perché in esso resta aperta la questione se esistano numeri cardinali (o ordinali) debolmente inaccessibili,” e se sì, quali di essi esistano. Il panorama è il seguente: gli assiomi di ZFC, senza l’assioma dell’infinito, non sono sufficienti a provare l’esistenza del numero &o. Con l’assioma dell’infinito (insieme con altri assiomi di ZFC, tra i quali, essenzialmente, quello di rimpiazzamento) in ZFC si dimostra l’esistenza di numeri infiniti sempre più grandi — per es. di X1, N, N3, No, No+1 No+n
..., €CC. —, ma non si giunge a dimostrare l’esistenza del primo numero cardinale debolmente inaccessibile. Se si assume, con un ulteriore assioma, che esista un insieme avente la potenza del primo numero cardinale debolmente
inaccessibile, si può dimostrare in ZFC ancora l’esistenza di altri numeri ancora più grandi, ma, per giungere a dimostrare l’esistenza del secondo numero cardinale debolmente inaccessibile, occorre un nuovo assioma. Si può procedere così illimitatamente, a postulare l’esistenza di numeri debolmente inaccessibili sempre più grandi, tenendo però presente che la postulazione dell’esistenza di un numero cardinale inaccessibile è sufficiente a dimostrare l’esistenza di tutti inumeri cardinali (e quindi di tutti i numeri cardinali debolmente inaccessibili) minori di esso. Si possono anche riassumere un numero infinito numerabile di assiomi che stabiliscono l’esistenza di @ cardinali debolmente inaccessibili in un solo assioma, postulando che per ogni insieme & ne esista un altro il cui numero cardinale è maggiore di quello di @ ed è debolmente inaccessibile. È tuttavia possibile descrivere numeri debolmente inaccessibili che sono più grandi di tutti gli © cardinali debolmente inaccessibili la cui esistenza si possa garantire con quest’ultimo assioma: è anzi possibile descrivere una scala di infinite classi di numeri cardinali debolmente inaccessibili che hanno questa proprietà, sempre più grandi.” Per stabilire l’esistenza di questi nu-
ST Si parla sia di numeri cardinali debolmente inaccessibili, sia di numeri ordinali debolmente inaccessibili, ma si tenga presente che in ZFC i numeri cardinali sono particolari numeri ordinali, e che, di conseguenza — dato il modo in cui sono definiti —, cardinali e ordinali
debolmente inaccessibili coincidono. Le definizioni di questi numeri si possono dare come segue. Sia ©, un numero ordinale, e &, il numero cardinale corrispondente (nel senso del numero cardinale di ogni insieme ben ordinato che ha numero ordinale @,). I numeri @, e &, si
dicono debolmente inaccessibili, se e solo se valgono le seguenti condizioni: (1) x è un numero ordinale tale che, per ogni numero ordinale y minore di x, si ha s(y) < x, dove “s(y)” indica il successore immediato di y; evidentemente, ciò equivale a richiedere che x non sia il successore immediato di nessun numero ordinale: i numeri ordinali diversi da 0 con questa proprietà sono oggi detti ordinali limite (Cantor li chiamava “ordinali di seconda specie” (Zahlen zweiter Art), in contrapposizione a quelli di prima specie (Zahlen erster Art), che sono ottenuti da un ordinale minore per aggiunta di 1 (v. Cantor [1895-97], $ 15, pp. 330-331 (in Cantor [1915], p. 169)); oppure, in modo equivalente: per ogni numero cardinale (ordinale) y minore di &, (©), si has) < X, (sO) < ©), dove “s(y)” indica il successore immediato di y; evidentemente, ciò equivale a richiedere che &, (@,) non sia il successore immediato di nessun numero cardinale (ordinale): i numeri cardinali (ordinali) diversi da 0 con questa proprietà sono detti cardinali limite (ordinali limite); (11) N, è un cardinale regolare: con ciò intendendo che la somma di meno di &, cardinali, ciascuno minore di X,, è essa stessa minore di
X,; oppure, in modo equivalente: ®, è un ordinale regolare: con ciò s’intende che @, sia un numero ordinale che non è il limite di nessun insieme ben ordinato di ordinali minori di @, avente un numero ordinale 2 < @, (dove il limite di un insieme ben ordinato di ordinali è il numero ordinale più piccolo tra tutti i numeri ordinali più grandi di ogni membro dell’insieme ben ordinato); (111) x è un numero diverso da 0; oppure, in modo equivalente: X, (@,) è un numero cardinale (ordinale) infinito non numerabile. Alcuni autori non assumono la condizione (iii), facendo di @n = ®© e Xy dei numeri debolmente inaccessibili; infatti, essi soddisfano le
prime due condizioni, ma non soddisfano la terza (si tratta di una pura scelta convenzionale: in alcuni contesti può essere comoda una convenzione, in altri un’altra). Qualche esempio. I numeri ordinali ©}, ©, ©3, ©,, 00+1, 00+, (con n finito), e i corrispondenti numeri cardina-
li Ni, No, N3, Nu No+1 No+rn(Con r finito) non sono debolmente inaccessibili perché, pur essendo regolari (assumendo, come in ZFC, l’assioma di scelta) e non numerabili, non soddisfano la prima condizione. ©, e Xw, invece, pur soddisfacendo la prima e la terza condizio-
ne, non sono regolari, perché il numero ordinale @, può essere definito come il limite di un insieme di © < © ordinali minori di @, (cioè:
01, O, 03, ...). La qualifica “inaccessibili” data a questi numeri deriva dal fatto che ciascuno di essi non può essere raggiunto come risultato di operazioni di addizione, moltiplicazione e esponenziazione di numeri cardinali minori di esso; e che nelle teorie standard degli insiemi, tra cui ZFC
e NBGC, non è possibile dimostrare l’esistenza di insiemi aventi numeri debolmente inaccessibili senza postularla attraverso nuovi assiomi. I numeri debolmente inaccessibili sono stati introdotti in Hausdorff [1908], $ 3. Il nome “debolmente inaccessibile” non è però di Hausdorff (Hausdorff chiamava i numeri ordinali debolmente inaccessibili “G-numeri”); l'introduzione del termine “numero inaccessibile”,
nel significato di “debolmente inaccessibile” è attribuita, in Sierpifiski e Tarski [1930], p. 292, a Kazimierz Kuratowski. Oggi si inserisce davanti a “inaccessibile” la qualifica “debolmente” per distinguere questi numeri da quelli fortemente inaccessibili (v. sotto, nota 59). La prima di queste classi, per es., è costituita dai numeri cardinali debolmente iperinaccessibili: un numero cardinale xè tale se e solo se:
(i) è debolmente inaccessibile, (ii) ci sono numeri cardinali debolmente inaccessibili minori di x.
Alternative, critiche e proposte di emendamento al sistema dei Principia
787
meri debolmente inaccessibili occorrono assiomi ulteriori. Si può dimostrare che, se tutti i numeri cardinali debolmente inaccessibili esistono, essi non sono meno di tutti gli ordinali. I numeri di cui abbiamo parlato sono detti grandi cardinali. Oltre ai numeri debolmente inaccessibili, si definiscono i numeri cardinali (o ordinali) fortemente inaccessibili —
0, semplicemente,
inaccessibili.” Ogni cardinale fortemente inaccessibile è a fortiori anche un cardinale de-
bolmente inaccessibile, quindi è un grande cardinale. Se è vera l’ipotesi generalizzata del continuo, i numeri debolmente inaccessibili e quelli fortemente inaccessibili sono la stessa cosa. Se è vera l’ipotesi del continuo — sia o non sia vera l’ipotesi generalizzata del continuo —, il primo cardinale fortemente inaccessibile è anche il primo cardinale debolmente inaccessibile; altrimenti, il primo cardinale fortemente inaccessibile può coincidere con un numero debolmente inaccessibile arbitrariamente grande. La situazione con i numeri fortemente inaccessibili è in ZFC esattamente parallela a quella che si produce con i numeri debolmente inaccessibili: anche con l’ausilio dell’assioma dell’infinito, non si giunge a dimostrare l’esistenza del primo numero cardinale fortemente inaccessibile; se si assume come ulteriore assioma che esista un insieme avente la potenza del primo numero cardinale fortemente inaccessibile, si può dimostrare in ZFC ancora l’esistenza di altri numeri ancora più grandi, ma per giungere a dimostrare l’esistenza del secondo numero cardinale fortemente inaccessibile occorre un nuovo assioma; si può procedere così illimitatamente, postulando l’esistenza di numeri fortemente inaccessibili sempre più grandi, anche riassumendo un numero infinito numerabile di assiomi che stabiliscono l’esistenza di @ cardinali fortemente inaccessibili in un solo assioma, che postuli, per ogni insieme &, l’esistenza di un altro insieme il cui numero cardinale è maggiore di quello di @ ed è fortemente inaccessibile; è però possibile definire numeri fortemente inaccessibili che sono ancora più grandi di tutti gli © cardinali fortemente inaccessibili la cui esistenza si può garantire con gli assiomi suddetti: è anzi possibile descrivere una scala di infinite classi di numeri cardinali fortemente inaccessibili che hanno questa proprietà, sempre più grandi; per stabilire l’esistenza di questi numeri inaccessibili occorrono assiomi ulteriori. Si prova senza difficoltà che, se ZFC è consistente, allora è consistente anche ZFC con l’aggiunta di un assioma che neghi l’esistenza di tutti i grandi cardinali; tuttavia si dimostra anche che non è possibile provare che, se ZFC è consistente, sia consistente anche ZFC con l’aggiunta di un qualsiasi assioma che affermi l’esistenza di qualche grande cardinale. Questo perché in ZFC con l’aggiunta di un assioma che garantisce l’esistenza di almeno un grande cardinale — un numero cardinale debolmente inaccessibile — è dimostrabile la consistenza di ZFC (perché è dimostrabile che ZFC ha un modello); se dunque, a sua volta, la consistenza di ZFC implicasse la consisten-
za di ZFC con l’aggiunta di un assioma che garantisce l’esistenza di almeno un numero cardinale debolmente inaccessibile, quest’ultima teoria implicherebbe la propria consistenza, cosa impossibile per il secondo teorema d’incompletezza di Gòdel.°® In questa situazione, le scelte degli studiosi interessati a rendere categorica la teoria degli insiemi si sono diversificate. Alcuni — come Fraenkel con il suo assioma di restrizione — hanno puntato a rendere più restrittivo possibile il sistema assiomatico, escludendo esplicitamente l’esistenza di tutti i numeri cardinali debolmente o fortemente inaccessibili (cioè, di tutti i grandi cardinali). Altri hanno cercato, all’opposto, di rendere più inclusivo
°° Con “numeri inaccessibili”, senza qualificazioni, si intendevano inizialmente i numeri debolmente inaccessibili, ma dopo gli anni 50 del 900 si intendono in generale i numeri fortemente inaccessibili. Anche i numeri fortemente inaccessibili, come quelli debolmente inaccessibili, possono essere sia ordinali sia cardinali, ma in ZFC i primi coincidono con i secondi. I numeri @; e &, si dicono fortemente inaccessibili, se e solo se valgono le seguenti condizioni:
(i)* per ogni numero y minore di X,, 2"< È, (questa formulazione assume l’assioma di scelta — che è parte di ZFC —; infatti, se l’assioma è falso non sappiamo se 2° sia anch'esso un alef; si può però imporre la condizione (i)* senza dover assumere l’assioma di scelta). (ii) N, (®,) è un cardinale (ordinale) regolare; (iii) x è diverso da 0; oppure: &, (©) non è numerabile. Ogni numero fortemente inaccessibile è anche debolmente inaccessibile: infatti, se si confrontano i requisiti (i)*, (i) e (iii) definenti i numeri fortemente inaccessibili con quelli, (i), (ii) e (iii), elencati sopra, nella nota 57, che definiscono i numeri debolmente inaccessibili, si
vede che il requisito (i)* implica il requisito (i) e gli altri due requisiti coincidono; quindi l'insieme dei numeri fortemente inaccessibili è un sottoinsieme di quelli debolmente inaccessibili. Se è vera l’ipotesi generalizzata del continuo, data la coincidenza, in quest’ipotesi, tra s(y) e 2 per ogni numero cardinale transfinito, si ha anche, all’inverso, che ogni numero debolmente inaccessibile è anche fortemente inaccessibile, cosicché i numeri debolmente inaccessibili coincidono con quelli fortemente inaccessibili. Se si lascia cadere, come fanno alcuni autori,
il requisito (iii), © = © e Xo divengono numeri fortemente (oltre che debolmente) inaccessibili. I numeri fortemente inaccessibili sono stati introdotti da Wactaw Sierpinski e Alfred Tarski in Sierpifski e Tarski [1930]. 9 Sul secondo teorema d’incompletezza di Gòdel, v. sotto, cap. 14, nota 158.
©! V. Fraenkel [1922a], $ II, pp. 233-234.
788
capitolo 12
possibile il sistema assiomatico: Paul Finsler, per esempio, propose un “assioma di completezza” (Axiom der Vollstiindigkeit) affermante l’esistenza di tutti gli insiemi compatibili con gli altri assiomi della sua teoria degli insiemi — che avrebbe l’effetto di assicurare l’esistenza di tutti i grandi cardinali che non rendono il sistema assiomatico incoerente.” La concezione che Zermelo sostiene in un articolo del 1930 intitolato “Uber Grenzzahlen und Mengenbereiche” (“Sui numeri confine e i domini di insiemi”) è diversa, e particolarmente interessante. In questo saggio, Zer-
melo ripresenta, come teoria generale degli insiemi, il proprio sistema assiomatico del 1908, formulato in un linguaggio del second’ordine, modificato con l’aggiunta degli assiomi di rimpiazzamento (che Zermelo ascrive a Fraenkel) e di fondazione, ma con l’eliminazione dell’assioma di scelta e dell’assioma dell’infinito. Quest'ultimo
non è più considerato da Zermelo come parte di una teoria generale degli insiemi — tra non molto capiremo perché. L’assioma di scelta, invece, sebbene sia espunto dagli assiomi della teoria generale degli insiemi, è ugualmente alla base dell’intero sistema, perché è assunto da Zermelo come principio logico. Il sistema così modificato è siglato da Zermelo “ZF” — per distinguerlo dal proprio sistema del 1908 con l'aggiunta dell’assioma di rimpiazzamento, che egli sigla “ZF”, da “Zermelo-Fraenkel”. Il nucleo dell’articolo di Zermelo consiste nella dimostrazione che i domini normali (Normalbereiche) — termine con il quale Zermelo intende i domini, costituiti di insiemi e Urelemente, dei modelli di ZF' in cui “e” denota la relazione di appartenenza insiemistica’’ — sono caratterizzati, a meno di isomorfismi, da due numeri: la base (Basis), che specifica il numero di Urelemente del dominio (Zermelo considera l’insieme vuoto come un Urelement), e la caratteristica (Charakteristik), o numero confine (Grenzzahl).°* Il numero confine, o caratteristica, 7, di un dominio normale è il più piccolo numero ordi-
nale che non è rappresentato nel dominio normale da quelle che Zermelo chiama “successioni di base” (Grundfolgen), che non sono altro che i numeri ordinali di von Neumann, ben ordinati dalla relazione e — con la sola differenza (inessenziale) che il primo elemento di una successione di base può essere, oltre che l'insieme vuoto,
qualsiasi Urelement. Dire che un numero ordinale è “rappresentato”, in un dominio, da una successione di base, significa semplicemente che esiste, nel dominio, almeno una successione di base che ha quel numero come numero ordinale. Dati gli assiomi di ZF”, se 7 non è rappresentato in un dominio normale da nessuna successione di base, non può esserci nello stesso dominio nessun altro insieme ben ordinato che rappresenti quel numero ordinale (cioè che abbia quel numero ordinale).°° x
© V. Finsler [1926], $ 5, p. 110. V. Finsler [1926], $ 5, p. 110. Come abbiamo già avuto modo di notare (v. sopra, nota 51), l'assioma di
completezza di Finsler — proprio come gli assiomi di completezza proposti da Hilbert per la teoria dei numeri reali e per la geometria — non è in realtà un assioma della teoria degli insiemi, ma un meta-assioma della teoria: esso non è parte del sistema assiomatico, perché pone una condizione sui modelli del sistema assiomatico (affermando che i loro domini devono essere i più comprensivi possibile), e non sugli insiemi. ° Zermelo definisce i “domini normali” «i domini costituiti di insiemi e Urelemente per i quali sono soddisfatti gli assiomi “generali” della teoria degli insiemi [...]» (Zermelo [1930a], p. 29 (in Zermelo [2010], p. 400, trad. ingl. a fronte; in Cellucci (ed.) [1978], p. 178; in Ewald
(ed.) [1996], vol. II, p. 1219). % V. Zermelo [19302], $ 4, pp. 40-41: Primo teorema d’isomorfismo (Erster Isomorphiesatz) (in Zermelo [2010], p. 420, trad. ingl. a fron-
te; in Cellucci (ed.) [1978], p. 189; in Ewald (ed.) [1996], vol. II, pp. 1228-1229). 5 V. Zermelo [1930a], $ 2, pp. 32-33, punto 7 (in Zermelo [2010], p. 406, trad. ingl. a fronte; in Cellucci (ed.) [1978], p. 182; in Ewald
(ed.) [1996], vol. II, p. 1222). ° Zermelo dimostra infatti che se in un dominio normale c’è almeno un insieme ben ordinato che ha un dato numero ordinale, lo stesso
numero ordinale è rappresentato nel dominio da una successione di base avente come primo elemento un qualsiasi Urelement u del dominio (v. Zermelo [1930a], $ 2, p. 32, punto 6 (in Zermelo [2010], p. 406, trad. ingl. a fronte; in Cellucci (ed.) [1978], pp. 181-182; in Ewald (ed.)
[1996], vol. II, pp. 1221-1222)). La dimostrazione è la seguente. Per cominciare, è chiaro che, comunque sia costituito il dominio considerato, i primi numeri ordinali saranno rappresentati dalle successioni di base u, {w}, {u, {u}}, ... Supponiamo ora che il teorema sia falso, e
sia Qil primo numero ordinale che contraddice il teorema — cioè il primo numero ordinale di un insieme ben ordinato del modello normale dato che non è rappresentabile tramite una successione di base il cui primo elemento è u. I casi sono due: (1) o @ è il successore immediato di qualche numero ordinale # (2) o @ non è il successore immediato di nessun numero ordinale. Nel primo caso, poiché per ipotesi tutti i numeri ordinali minori di @ sono rappresentabili mediante successioni di base il cui primo elemento è u, si ha che / è rappresentabile mediante una successione di base gg il cui primo elemento è u; ma allora anche & è rappresentabile mediante una successione di base gp, il cui primo elemento è u, che ha per membri tutti i membri di gg più la stessa gg (l’esistenza di questa successione di base è garantita nel sistema di Zermelo dagli assiomi dell’unione e della coppia). Nel secondo caso, poiché ancora tutti i numeri ordinali minori di @ sono rappresentabili mediante successioni di base il cui primo elemento è u, @ sarà rappresentabile tramite una successione di base costituita dall’unione di tutte le successioni di base che cominciano con u e rappresentano i numeri ordinali minori di @ (l’esistenza di tale successione di base è garantita nel sistema di Zermelo dall’assioma di rimpiazzamento, applicato a un insieme ben ordinato avente numero ordinale @ e dall’assioma dell’unione). Dunque, è impossibile che vi sia in un dominio normale un insieme ben ordinato che ha numero ordinale @, ma © non sia rappresentato, nello stesso dominio normale, da una successione di base avente x come primo elemento; e con ciò il teorema è
dimostrato.
Alternative, critiche e proposte di emendamento al sistema dei Principia
7189
La caratterizzazione dei domini normali tramite la base e la caratteristica del dominio, deriva dal fatto che, co-
me dimostra Zermelo, ogni dominio normale di caratteristica 7, P,, si può scomporre in una successione ben ordinata di 7 strati (Schichten), Q4 (con & = 0), e sottodomini o sezioni (Abschnitte), P., (con &= 1), nel modo seguente:
(1) P,=©ocontiene tutti gli Urelemente; (2) Par, con @2 I, è l’unione di P, con Qu, essendo Q, l’insieme potenza di Py (3) Se @è un ordinale limite, P,,è l'unione di tutti i Pg con beta Dunque: lo strato di base, Q, coincide con la prima sezione, P,, ed è l'insieme che ha per elementi l’insieme vuo-
to e tutti gli Urelemente; ogni strato successivo è l’insieme potenza dell’unione di tutti gli strati precedenti; una sezione è l’unione di tutti gli strati precedenti. P, è, nel suo complesso, l’unione di tutte le sezioni Py con 8 < mn Si osservi che, nel caso particolare in cui lo strato di base, Qn, abbia come unico elemento l’insieme vuoto — co-
me accade nella teoria pura degli insiemi —, la sezione P4 1 si identifica sempre con lo strato Q,, venendo a esse-
re Pa+1= CI‘P;(l’insieme potenza di Po Zermelo dimostra, inoltre, che il numero confine di un dominio normale dev'essere (secondo il modo di espri-
mersi oggi usuale, che non è quello di Zermelo) un numero ordinale fortemente inaccessibile (includiamo qui, per comodità espositiva, il numero @ tra i numeri ordinali fortemente inaccessibili, cioè non richiediamo che un numero inaccessibile debba essere infinito non numerabile).
Sebbene Zermelo non lo rilevi, è importante sottolineare che questi risultati valgono solo a condizione che il sistema d’assiomi ZF’ sia formulato —
come intendeva Zermelo —
al second’ordine; Zermelo dimostra, in effetti,
che tutti i modelli di ZF formulato al second’ordine i cui domini sono caratterizzati dallo stesso numero di Urelemente e dallo stesso numero confine sono isomorfi. Per ogni fissato numero di Urelemente, al crescere in grandezza dei numeri confine 7, si ottiene una gerarchia di domini normali sempre più grandi, in cui, dati due domini con diversa caratteristica, uno è sempre isomorfo a una sezione dell’altro.”” Supponiamo, per esempio, di fissare a 1 il numero di Urelemente (nel senso zermeliano, inclusivo dell’insieme vuoto) dei nostri domini, in modo da ave-
re modelli dell’usuale teoria pura degli insiemi, in cui l’unica entità priva di elementi è l’insieme vuoto. Se poniamo 7= ®@ avremo un dominio normale, P,, in cui esistono solo insiemi finiti (insiemi il cui numero cardinale è
minore di Xp). Se poniamo 7 uguale al primo numero fortemente inaccessibile dopo @, i;, avremo un dominio normale, P, , in cui vi sono, oltre a insiemi finiti, anche insiemi infiniti di potenza minore del primo cardinale for-
temente inaccessibile dopo Xp. Se poniamo 7 uguale al secondo numero ordinale fortemente inaccessibile dopo ®, i», otterremo un dominio normale, Lo in cui vi sono, oltre a insiemi finiti, solo insiemi infiniti di potenza mi-
nore del secondo cardinale fortemente inaccessibile dopo No. Quindi, per esempio, un dominio della teoria pura degli insiemi di Zermelo con un assioma dell’infinito che postuli l’esistenza di un insieme di potenza X dovrà ® V. Zermelo [1930a], $ 3, p. 36: Primo teorema di sviluppo (Erstes Entwickelungstheorem) (in Zermelo [2010], p. 412, trad. ingl. a fronte; in Cellucci (ed.) [1978], p. 185; in Ewald (ed.) [1996], vol. II, p. 1225). Il teorema è enunciato così da Zermelo: «Ogni dominio normale P di caratteristica 7 può essere suddiviso in una successione ben ordinata di tipo [d'ordine] 7rdi “strati” [Schichten] Qx non vuoti e tra loro
disgiunti con la proprietà che ogni strato Q, contiene tutti gli elementi di P che non compaiono in nessuno dei precedenti [strati] e i cui elementi appartengono alla “sezione” [Abschnitte] corrispondente Py, cioè alla somma di tutti gli strati precedenti. Il primo strato © contiene tutti gli Urelemente» (ibid.). © Invece della lettera “P”’, oggi si usa di solito la lettera “V’ — già utilizzata nei Principia (v. [PM], vol. I, #24.01) per indicare la classe di tutti gli oggetti (di uno stesso tipo) (una simbologia derivata da Peano (v. per es., Peano [1889], "Logicae notationes", $ IV, p. 28)) —, e si descrive il dominio V di un modello di ZFC costituito solo da insiemi (senza Urelemente) come stratificato in una gerarchia cumulativa di
insiemi Va, dove @è numero ordinale (detto rango di Va), tali che Vo = A (l’insieme vuoto), V4+
è un ordinale limite, Va =
Pi
= Cl°‘Va(l’insieme potenza di Vy), e, se @
(l’unione di tutti i Vg con B< 2. Questa gerarchia cumulativa (si dice “cumulativa” perché dati due
numeri ordinali a e 8, con B< & Vy è sempre un sottoinsieme di V,) di insiemi è nota con il nome di gerarchia di von Neumann, 0 universo di von Neumann, perché fatta risalire a von Neumann [1929] — dove essa è utilizzata come modello per dimostrare la consistenza dell’assioma di fondazione. Poiché tuttavia nel sistema originale di von Neumann gli oggetti fondamentali sono funzioni, e non insiemi, la sua descrizione della gerarchia in parola è molto diversa da quella attuale, risalente a Zermelo [1930a] (v., in proposito G. H. Moore [1982], p. 279).
9 V. Zermelo [1930a], $ 2.
7 V. Zermelo [1930a], $ 4, pp. 41-42: Secondo teorema d’isomorfismo (Zweiter Isomorphiesatz) (in Zermelo [2010], pp. 420 e 422, trad. ingl. a fronte; in Cellucci (ed.) [1978], p. 190; in Ewald (ed.) [1996], vol. II, p. 1229).
capitolo 12
790
avere un numero confine 7almeno uguale al primo numero ordinale fortemente inaccessibile dopo ©; un dominio della teoria pura degli insiemi di Zermelo con un assioma dell’infinito che postuli l’esistenza di un insieme con la potenza del primo cardinale debolmente inaccessibile dopo Xp dovrà avere un numero confine almeno uguale al secondo numero ordinale fortemente inaccessibile dopo No." di Sebbene Zermelo dimostri che, specificando con assiomi opportuni il numero di Urelemente e il numero 7 un sistema, si possono ottenere sistemi (del second’ordine) categorici, egli obietta ai tentativi di Fraenkel e Finsler di ottenere la categoricità attraverso nuovi postulati che tali nuovi postulati «non riguardano affatto la teoria degli insiemi in sé, ma caratterizzano semplicemente un modello affatto particolare scelto dall’ autore di turno».”° Per Zermelo, invece, le cose vanno bene come sono. Il non restringere preliminarmente la teoria degli insiemi a modelli in cui è presente un solo Urelement (l’insieme vuoto) garantisce per Zermelo l’applicabilità generale della teoria degli insiemi.” Per quanto riguarda i numeri confine ze la questione di quali numeri inaccessibili esistano, la posizione di Zermelo consiste nell’ammetterli tutti, ma non come parte dello stesso sistema. Egli scrive, infatti, che «L’esistenza di una successione illimitata di numeri confine si deve [...] postulare come nuovo assioma della “metateoria degli insiemi” [...]».”* Secondo Zermelo, è proprio il fatto che questi numeri confine esistano ma non appartengano tutti a un singolo modello a spiegare l’origine dei paradossi insiemistici: Le “antinomie ultrafinite della teoria degli insiemi” [u/trafiniten Antinomien der Mengenlehre] alle quali si richiamano con tanto zelo e affetto reazionari scientifici e antimatematici nella loro battaglia contro la teoria degli insiemi, queste “contraddizioni” apparenti si basano semplicemente su una confusione fra la teoria degli insiemi stessa, definita in maniera non categorica dai suoi assiomi, e i singoli modelli che la rappresentano: ciò che in un modello appare come un “non-insieme o super-insieme ultrafinito”, in quello immediatamente successivo è già un “insieme” pienamente valido con un numero cardinale e un tipo ordinale e costituisce la prima pietra per la costruzione del nuovo dominio. Alla serie illimitata dei numeri ordinali cantoriani corrisponde una doppia serie ugualmente illimitata di modelli essenzialmente diversi della teoria degli insiemi, in ciascuno dei quali trova espressione l’intera teoria classica.”
Una posizione, questa, di cui è evidente l’analogia con la concezione soggiacente alla teoria (semplice e cumulativa) dei tipi. Ma su ciò torneremo con maggiore ampiezza nel prossimo paragrafo. Prima esaminiamo un altro importante sviluppo della teoria assiomatica degli insiemi. Il sistema originariamente proposto da von Neumann ([1925], [1928a], [1929]), poi semplificato e reso simile, nel modo di formularlo, a quello di Zermelo da Paul Bernays ([1931], [1937], [1941]) e da Kurt Gòdel ([1940]) ha
dato origine a un sistema oggi noto come “teoria degli insiemi di von Neumann-Bernays-Gòdel” e siglato “NBG”. Il sistema NBG è formulato, come ZF, in un linguaggio del primo ordine con identità (lo stesso von Neumann sembra intendere il suo sistema originario in questo modo). Nella sua formulazione attuale, si distinguono, all’interno della categoria più generale delle classi, gli insiemi, che sono sempre membri di altre classi,” dalle " Dicevamo qualche pagina addietro che in ZFC con l’aggiunta di un assioma che garantisca l’esistenza di almeno un numero cardinale debolmente inaccessibile è dimostrabile la consistenza di ZFC, perché ZFC viene ad avere un modello. Da quanto abbiamo appena detto a proposito del sistema ZF°, risulta invece che ogni modello normale di ZFC abbia un dominio caratterizzato da un numero cardinale fortemente inaccessibile — che, come sappiamo, stando agli assiomi di ZFC (che non includono l’ipotesi del continuo) potrebbe essere anche molto più grande del primo numero cardinale debolmente inaccessibile. Per capire il punto, si deve rammentare che se è vera l’ipotesi generalizzata del continuo
i numeri
debolmente
inaccessibili
coincidono
con
quelli fortemente
inaccessibili
(v. sopra, nota 59). Poiché
l’ipotesi generalizzata del continuo è indipendente dagli assiomi di ZFC, se ZFC è coerente ci sono modelli di ZFC in cui l’ipotesi generalizzata del continuo è vera. Data la coincidenza, in questi modelli, tra numeri debolmente e fortemente inaccessibili, l'aggiunta di un assioma a ZFC che garantisca l’esistenza di almeno un numero cardinale debolmente inaccessibile garantisce contemporaneamente l’esistenza del corrispondente numero cardinale fortemente inaccessibile in questi modelli, e quindi di almeno un modello di ZFC. Ciò dimostra anche che in ZFC non ci può essere un teorema che garantisca l’esistenza di almeno un numero cardinale debolmente inaccessibile: perché se fosse così in ZFC sarebbe dimostrabile la coerenza di ZFC stessa, contro il secondo teorema d’incompletezza di Gòdel (v. sotto, cap. 14, nota 158). 72 Zermelo [19302], $ 5, p. 45 (in Zermelo [2010], p. 426, trad. ingl. a fronte; in Cellucci (ed.) [1978], pp. 193-194; in Ewald (ed.) [1996],
vol. II, p. 1232). 73 V. Zermelo [19302], $ 3, p. 38, e $ 5, p. 45 (in Zermelo [2010], p. 416 e p. 426, trad. ingl. a fronte; in Cellucci (ed.) [1978], p. 187 e p.
194; in Ewald (ed.) [1996], vol. II, p. 1227 e p. 1232). 74 Zermelo [1930a], $ 5, p. 46 (in Zermelo [2010], p. 428, trad. ingl. a fronte; in Cellucci (ed.) [1978], p. 194; in Ewald (ed:) [1996], vol. II, p. 1233); sottolineature di Zermelo.
"5 Zermelo [19302], $ 5, p. 47 (in Zermelo [2010], pp. 428 e 430, trad. ingl. a fronte; in Cellucci (ed.) [1978], p. 195; in Ewald (ed.) [1996], vol. II, p. 1233); sottolineature di Zermelo.
"° Considerare gli insiemi come classi che sono membri di altre classi è una semplificazione introdotta da Gòdel in Gòdel [1940]: Bernays invece distingueva tra insiemi e classi aventi la medesima estensione, introducendo nella teoria anche due predicati di appartenenza: uno (l’usuale “€?”°) per l’appartenenza di insiemi ad altri insiemi, e l’altro (simboleggiato da Bernays con “77°) per l'appartenenza di insiemi a
Alternative, critiche e proposte di emendamento al sistema dei Principia
791
classi proprie, le quali non sono mai membri di altre classi. Il sistema originariamente proposto da Gédel in
[1940] fa uso di tre nozioni primitive: quella di classe, quella di insieme, e quella di appartenenza a una classe; un assioma stabilisce poi che qualunque cosa sia membro di qualcosa è un insieme.’”* Tuttavia, è divenuto usuale definire un insieme, facendo uso della sola nozione primitiva di appartenenza, come un oggetto che è membro di qualcosa; in simboli: M(x) = (4y)(x e y) (“M” è l'iniziale del tedesco classe di tutti gli insiemi, si può anche scrivere: “x e V = (4y)(x € y)”. come fa lo stesso Godel in [1940] (p. 3) — come qualcosa che non è un implicano che nel dominio della teoria non vi siano individui: o meglio,
“Menge”: “insieme”); chiamando “V” la Una classe propria si può poi definire — insieme. Si osservi che queste definizioni implicano l’identificazione di tutti gli in-
dividui con l’insieme vuoto — un’idea che, come già sappiamo, è stata largamente accettata nella teoria assiomatica degli insiemi. NBG può essere formulato in modi diversi. In una possibile formulazione esso comprende i seguenti assiomi: e un assioma di estensionalità per tutte le classi (cioè, anche per quelle classi che sono insiemi):
MM(()zex=ze y)Dx=)); e uno schema d’assiomi di comprensione per tutte le classi:
NBG(C)
E) Me
y=M@) 1 F@),”
dove “F(x)” sta al posto di una formula ben formata del linguaggio di NBG che contiene la variabile “x” libera, ma non contiene la variabile “y” libera (in generale, la formula può contenere altre variabili libere diverse da “x” e y”, nel qual caso NBG(C) deve essere considerato equivalente alla sua chiusura universale), né contiene variabili quantificate che non siano limitate a insiemi: ciò significa che, per ogni variabile “°° che compare quantificata nella formula rappresentata da “(x)”, le sottoformule della formula rappresentata da “(x)” rappresentabili con uno schema del tipo “(z)(G(z))” devono avere la forma ‘“(z)(M(2) > Gi(z))”, e quelle rappresentabili con uno 66__99
6,0?
66_.99
66)?
schema del tipo “(4z)(G(z))” devono avere la forma “(4z)(M(z) A Gi(z))” (“G” e “Gy” sono lettere schematiche
che stanno al posto di predicati monadici di NBG, proprio come “/?); questa restrizione comporta che in NBG le 5 EA ù x , c DS 5 È -_8( classi devono essere definite in modo predicativo: non si può definire una classe quantificando su tutte le classi;* e un assioma di fondazione per tutte le classi (ogni classe non vuota è disgiunta da almeno uno dei suoi elementi): (x) (By) e x) > (A2)(2e x A-(AW)(we
zAWE
2»).
Nel suo sistema originale, von Neumann enuncia l’assioma di fondazione ([1925], assioma VI 4), in connessione con il problema di rendere categorica la teoria degli insiemi, ma non lo include nel sistema assiomatico di base. I
primi a includere quest’assioma nel sistema di von Neumann furono Bernays e Gédel."' Poiché dallo schema d’assiomi NBG(C) si può dedurre solo l’esistenza della classe vuota (prendendo come “F(x)” dello schema d’assiomi un enunciato aperto contraddittorio) e della classe che contiene tutti gli insiemi (prendendo come “F(x)” dello schema d’assiomi un enunciato aperto tautologico) — classi che, del resto, potrebbero benissimo coincidere —, in NBG sono necessari altri assiomi che garantiscano l’esistenza di insiemi.*° Il metodo oggi più utilizzato, che risale a Bernays e Gédel.* è di aggiungere a quelli già menzionati i seguenti assiomi, che corrispondono a quelli di ZF: classi (v., per es., Bernays [1937], $ 1, pp. 66-67).
" V. Gòdel [1940], cap. 1, p. 3. 78 V. ibid., assioma 2.
? Quest’assioma non si trova però nelle formulazioni originali di von Neumann, Bernays e Gédel, dove è sostituito da un gruppo di altri assiomi: v. sotto, nota 85.
80 Se si lascia cadere questa condizione, si ottiene la teoria degli insiemi di Mostowski-Kelley-Morse, abitualmente siglata “MKM”.
8! V. Bernays [1931], p. 112, Gòdel [1940], cap. 1, p. 6, e Bernays [1941], $ 4, p. 6, assioma VII (Restrictive axiom). 82 Si osservi, incidentalmente, che NBG(C) consente di dimostrare che la classe di Russell non è un insieme. Partiamo, infatti, dall’istanza
di NBG(C): “Ay)@e y= MA) A xé x)”. Se chiamiamo “a” I°y che verifica la formula precedente (la cui unicità è garantita dall’assioma di estensionalità), cioè, la classe di Russell, per esemplificazione esistenziale otteniamo “(x)(x € a= M(x) 1 xe x)”; asse-
gniamo ora alla “x” di quest’ultima formula il valore a, ottenendo “a € a = M(a) n a € a”, che implica direttamente “—M(a)”. SV Bernays [1941], $ 4, p. 2, assioma V (includente 4 assiomi: separazione, rimpiazzamento, unione e insieme potenza), e p. 5, assioma VI (assioma dell’infinito), e Gòdel [1940], p. 6, Gruppo C (quattro assiomi coincidenti con quelli dati qui).
792
capitolo 12
e insieme unione: (x) (M(x) > (Ay)(M() 1 ()(z € y= (Ame waWE e insieme potenza: (x)(M(x) > (Ay)(M0)) A (2)(z € y=Z2C)); e insieme infinito: (4x)(M@) AA e xAM)p e xDyU{y} € ):;
»));
® rimpiazzamento (schema d’assiomi): (x1)(2%2) (3) (F(x, x) A_F(3, x) D 22.= 23)? MMM
> Ey)M0) A
(2)(ze y= (AW)(we x A F(z, w))))).5!
Un’importante caratteristica del sistema NBG è che — al contrario di ZF — può essere assiomatizzato in modo finito: vale a dire, si può sostituire lo schema d’assiomi NBG(C) con un numero finito di assiomi che consentono di formare particolari classi,
e lo schema d’assiomi di rimpiazzamento con un singolo assioma, in modo che il
numero totale degli assiomi del sistema sia finito. Questo, anzi, è proprio il modo in cui la teoria NBG è presentata in von Neumann [1925], in Bernays [1937], e in Gédel [1940] (per questo, in tali formulazioni non si trova l’assioma NBG(C)).® 86
A questi assiomi si possono aggiungere varie versioni dell’assioma di scelta. Se, come per primo fece Gòde I, si aggiunge a NBG il cosiddetto assioma di scelta globale — asserente l’esistenza di una relazione uno-molti, identificata con una classe (non un insieme) di coppie ordinate, che “sceglie” un solo elemento da ciascun insieme non vuoto esistente — si ottiene un sistema più vicino a quello originale di von Neumann, che è solitamente siglato NBGCG Invece dei quattro assiomi precedenti per gli insiemi, nel sistema originario di von Neumann si assumevano gli assiomi dell’insieme potenza e dell’insieme infinito,*” supplementati da un assioma di limitazione di grandezza,** 84 Si trovano spesso inclusi nella lista gli assiomi dell’insieme vuoto, della coppia e di separazione, ma tali assiomi non sono strettamente necessari, perché il primo è derivabile dall’assioma dell’infinito (se la classe vuota è membro di qualcosa, allora è un insieme per definizione), mentre gli altri due sono derivabili dagli assiomi di rimpiazzamento e dell’insieme potenza (v. sopra, note 42 e 43). 8° Per formulare NBG come teoria comprendente un numero finito di assiomi, si riducono le relazioni a classi di n-uple ordinate, ponendo (x) Sarx € (1, -.., Xn Xn 41) Sar (x1, +-+ Xn): Xn+1) € definendo le coppie ordinate con il metodo di Kuratowski, che identifica la coppia ordinata (x, x) con la classe {{x1}, {x1, x.}} (v. sopra, introduzione, nota 73). Poi, si rimpiazza lo schema d’assiomi NBG(C) con alcuni assiomi (seguo qui Mendelson [1964], $ 4.1, p. 230, che, a sua volta, segue Gòdel [1940], cap. 1, p. 5, fondendo però in un solo assioma — l’assioma (5) — gli assiomi 5 e 6 di Gòdel [1940]; per altre varianti v. Bernays [1931], pp. 108-111, Bernays [1937], $ 2, p. 69, Fraenkel e Bar-Hillel [1958], cap. 2, $ 7, pp. 112-113, e Fraenkel, Bar-Hillel e Lévy [1973], cap. 2, $ 7.2, pp. 129-130), che asseriscono: (1)
l’esistenza della classe di tutte le coppie ordinate (x, y) tali che Mx), MG) ex € y (cioè, l’esistenza della relazione € tra insiemi);
(2) (3) (4)
perogni classe x e ogni classe y, l’esistenza di una classe che è la loro intersezione; per ogni classe, l’esistenza di una classe che è il suo complemento; per ogni classe di coppie ordinate x, l’esistenza di una classe i cui elementi sono i primi membri delle coppie che appartengono a x
(5)
per ogni classe x, l’esistenza della classe di tutte le coppie ordinate (y, z) tali che y e x (assicura, per ogni classe x, l’esistenza del pro-
(assicura l’esistenza del dominio di una qualsiasi relazione); dotto cartesiano x X V, dove V è la classe di tutti gli insiemi);
(6) per ogni classe di triple ordinate (7) perogni classe di triple ordinate Questi assiomi (che corrispondono seguente teorema, che Paul Bernays
(x, y, z), l’esistenza della classe delle triple ordinate (y, z, x); (x, y, z), l’esistenza della classe delle triple ordinate (x, z, y). agli assiomi dei gruppi II e III di von Neumann [1925], parte I, $ 3, p. 399) consentono di ricavare il ([1937], $ 3, pp. 76-77) chiama teorema delle classi (e che corrisponde a quello che von Neumann
[1925], parte I, $ 3, p. 399, chiama teorema di riduzione):
(y) 1)... Con)(1, ..., x) €
y=E MG) A... AM) AF, ..., xp),
dove “F(x1, ..., Xn)” sta al posto di una formula che non contiene la variabile ‘“y” e non contiene variabili quantificate che non siano limitate a insiemi (per la dimostrazione, v. Bernays [1937], $ 3, pp. 70-77, e Mendelson [1964], $ 4.1, pp. 232-233). Lo schema d’assiomi NBG(C)
diviene quindi un caso particolare del teorema delle classi. Lo schema d’assiomi di rimpiazzamento di NBG si può ora riformulare come singolo assioma:
(Mx € 14 Cls > Y)M) > (42) (M(2) A (Mw e z= (Ax) (x e y A (W, x) € v)))), dove “x e 14 Cls” (“x è una relazione uno-molti”) abbrevia: “Re/(x) A (x1) (2) (13) (x, x2) E x A_(x3, x) E
sta per “x
xD x1=x3)”; in cui “Rel 1)” V?” (“x è una sottoclasse della classe V? di tutte le coppie, cioè della classe alla quale, per ogni x e per ogni y, appartiene la
coppia (x, y)”). 86 V. Gòdel [1940], cap. 1, p. 6, assioma E. SISI tratta, rispettivamente, degli assiomi V 3 e V 1 di von Neumann [1925], parte I, $ 3, p. 401. Nella formulazione originale della sua teo-
ria, von Neumann parla di funzioni (o Z-oggetti), argomenti (0 /-oggetti), e argomenti-funzioni (0 /-I-oggetti), invece che, rispettivamente, di classi, elementi di classi, e insiemi, ma questo è inessenziale perché, come osserva egli stesso (v. von Neumann
[1925], parte I, $ 2, p.
396), si può interpretare una funzione come una classe di coppie ordinate e, viceversa, una classe si può interpretare come una funzione che può assumere solo due valori (intuitivamente, il vero e il falso). 88 Si tratta dell’assioma
IV 2 di von Neumann
[1925], parte I, $ 3, p. 400. Von
Neumann
include nel suo sistema
anche l’assioma
dell’insieme unione (assioma V 2, di von Neumann [1925], parte I, $ 3, p. 401) che più tardi è stato dimostrato superfluo da Azriel Lévy ([1968]), perché deducibile dall’assioma di limitazione di grandezza.
Alternative, critiche e proposte di emendamento al sistema dei Principia
793
il quale afferma che una classe x è un insieme (cioè una classe che è membro di qualche classe) se e solo se non esiste una relazione uno-molti tra tutti gli elementi della classe V di tutti gli insiemi (la classe universale) e (alcuni, o tutti) gli elementi di x. Una relazione uno-molti è qui considerata come una classe x di coppie ordinate, tale che (x1) (x2) (X3) ((X1, x2) E x A (X3, x2) € x D x = x3). Una coppia ordinata (x;, x») è identificata con la classe {{x}, {x1, x2}}, e una classe di coppie ordinate è una qualsiasi sottoclasse della classe V? di tutte le coppie, cioè della
classe alla quale, per ogni x e per ogni y, appartiene la coppia (x, y). Dunque, l’assioma di limitazione di grandezza si può formulare come segue:
NBG(L) M@)=-Gn)ocVA0)0)03)
1, 7) € YA 03) € yDY1=I3) A (2)(ze
o, più in breve, riscrivendo “y c V? A 1)
VD (AW)((z,w) e
(01, ya) € YA (93, Ya) € y 2 y1= y3)” come “y e 1
yAwWE x),
Cls” (“y è
una relazione uno-molti”):
NBG(L)
M@=-(y)ye
14 Cls 1 (2)(ze V2(AW)((z,w) e
yAwe
x).
Quest’assioma è molto potente, perché permette, insieme con gli assiomi dell’insieme potenza e dell’insieme infinito, di dimostrare gli enunciati dei restanti assiomi che garantiscono l’esistenza di insiemi," e consente, inoltre, di dimostrare l’assioma di scelta globale.” Poiché NBG(L) implica l’assioma di scelta globale — che permette di scegliere una e una sola entità da ciascun insieme di elementi z, di una classe propria x, con cui una medesima entità y appartenente a V è correlata da una relazione uno-molti postulata da NBG(L) — è evidente che l'assioma NBG(L) implica che x sia una classe propria se e solo se esiste una relazione uno-uno tra gli elementi della classe V di tutti gli insiemi e gli elementi di una sottoclasse di x. Poiché tutti gli elementi di una classe x possono sempre essere correlati da una relazione uno-uno con gli elementi di una sottoclasse di V (una relazione appropriata è la relazione di identità, che correla ogni insieme con se stesso), si ha ogni classe propria deve essere grande quanto la classe V. Ma cosa suggerisce che le classi proprie siano le molteplicità “grandi come l’universo”? All’interno di ZF, si può ragionare così: l'assioma di comprensione di ZF non può ammettere l’esistenza dell’insieme V di tutti gli insiemi (pena la derivazione del paradosso di Russell) e dunque, per l'assioma di rimpiazzamento, non può ammettere l’esistenza di nessun insieme che abbia un sottoinsieme i cui elementi si possano porre in correlazione unouno con quelli di V; pertanto, molteplicità siffatte devono essere classi proprie. Negli anni Cinquanta del Novecento si è dimostrato che NBG (senza assioma di scelta) è un'estensione conservativa di ZF: vale a dire, che ogni teorema di ZF è un teorema sugli insiemi di NBG
(senza assioma di scelta), e
ogni teorema sugli insiemi di NBG (senza assioma di scelta) è già dimostrabile in ZF. In altre parole, NBG, come *° È facile vedere che l’assioma di rimpiazzamento segue dall’assioma di limitazione di grandezza. Supponiamo, infatti, di avere una relazione uno-molti R il cui dominio non è un insieme. Allora, per l'assioma di limitazione di grandezza, anche il suo dominio inverso non è un insieme. Infatti, se il dominio di R non è un insieme, per l’assioma di limitazione di grandezza deve esistere una correlazione uno-molti S tra gli elementi della classe V e il dominio di R. Ma allora il prodotto relativo S|R sarà ancora una relazione uno-molti tra gli elementi di V e quelli del dominio inverso di R, dimostrando che questo dominio inverso non può essere un insieme. Alla fine degli anni Sessanta del Novecento, è stato dimostrato (v. Lévy [1968]) che anche l'assioma dell’insieme unione segue dall’assioma di limitazione di grandezza.
°0 Questo si può vedere così. La classe di tutti i numeri ordinali è ben ordinata, ma il paradosso di Burali-Forti dimostra che non può essere un insieme (se lo fosse, sarebbe un numero ordinale, secondo la definizione di von Neumann (l’insieme di tutti i numeri ordinali da 0 a n è
un numero ordinale), e apparterrebbe dunque alla classe di tutti gli ordinali — cioè a se stesso — e dunque, poiché, secondo la definizione di numero ordinale di von Neumann, se un numero ordinale x appartiene a un numero ordinale y allora x < y, sarebbe minore di se stesso). Poiché, per l’assioma NBG(L), per ogni classe x che non è un insieme deve esistere una relazione uno-molti R tra tutti gli elementi della classe V di tutti gli insiemi e alcuni o tutti gli appartenenti a x, ne deriva che la classe V può essere ben ordinata: infatti, ciascun elemento di V si potrà correlare con il numero ordinale più piccolo con il quale l'elemento di V è correlato da una delle relazioni uno-molti che, secondo l’assioma NBG(L), correlano tutti gli elementi della classe V con alcuni o tutti gli elementi della classe di tutti i numeri ordinali. Poiché ogni insieme è una sottoclasse di V, si ha che ogni insieme può essere ben ordinato. Il fatto che V può essere ben ordinata implica la versione più forte possibile dell’assioma di scelta (assioma di scelta globale), asserente l’esistenza di una relazione uno-molti che “sceglie” un unico rappresentante da ciascun insieme non vuoto esistente. Von Neumann, già in [1925] (parte I, $ 2, p. 398, e $ 3, p. 400), osserva che l’assioma di limitazione di grandezza (IV 2 di von Neumann
[1925]) implica gli assiomi di separazione, di rimpiazzamento e di scelta. Si osservi che, poiché — come mostrato in von Neumann [1929] — se si assume l’assioma di fondazione, nel sistema di von Neumann l’assioma di limitazione di grandezza segue dagli assiomi di rimpiazzamento e di scelta (v. sopra, nota 54), si ha che in NBG l’assioma di limitazione di grandezza equivale agli assiomi di rimpiazzamento e di scelta.
794
capitolo 12
teoria degli insiemi, non è più potente di ZF. Nel decennio successivo, si è dimostrato che NBGC è un’estensione conservativa di ZFC. Questo dimostra che se NBG è consistente, lo è anche ZF (e lo stesso vale per NBGC e ZFC). Viceversa, si dimostra che, se ZF è consistente, lo è anche NBG (e lo stesso vale per ZFC e NBGC).
1.1.4. CONCEZIONE ITERATIVA E LIMITAZIONE DI GRANDEZZA In My Philosophical Development (1959), Russell elenca tre requisiti che — dice — quando si era occupato del problema, gli pareva dovesse avere una soluzione adeguata ai paradossi. Il primo — naturalmente essenziale — era che le contraddizioni scomparissero. Il secondo — descritto come non logicamente indispensabile, ma molto desiderabile — era che la soluzione lasciasse intatta quanta più matematica possibile. «Il terzo», scrive Russell, «che è difficile formulare precisamente, era che la soluzione dovesse, riflettendo, fare appello a ciò che si può chiamare “senso comune logico” — ossia che debba sembrare, alla fine, proprio ciò che ci si sarebbe dovuti aspettare fin dall’inizio».’? A proposito della terza condizione, Russell aggiunge: La terza condizione non è considerata essenziale da coloro che si accontentano della destrezza logica. Il professor Quine, per esempio, ha prodotto sistemi che ammiro molto per la loro maestria, ma che non posso ritenere soddisfacenti perché sembrano creati ad hoc ed essere tali che neppure il logico più ingegnoso li avrebbe pensati se non avesse saputo delle contraddizioni. Su quest’argomento, tuttavia, si è sviluppata una letteratura immensa e molto astrusa, e non dirò altro riguardo ai suoi aspetti più sotti-
RS
Abbiamo visto che il sistema di Zermelo non fu originariamente escogitato, né presentato, su basi intuitive, ma come meccanismo che permettesse di ottenere i risultati matematicamente voluti senza incorrere in contraddizioni. Possiamo però chiederci, da un punto di vista sincronico, se anche il sistema di Zermelo e le sue estensioni siano quel genere di teorie che a nessuno sarebbero venute in mente, se non fosse stato per i paradossi. Mentre la teoria sostenuta da Russell nei Principia ammette la validità del principio secondo cui ogni condizione determina un insieme (principio di comprensione illimitato), ponendo tuttavia, attraverso la teoria dei tipi, delle limitazioni sulle condizioni (significativamente) formulabili (formule ben formate del sistema), la teoria di Zermelo restringe la validità del principio di comprensione in modo da non permettere mai la formazione di insiemi, per così dire, “troppo grandi’ — cioè, grandi quanto l’universo. Quest’idea guida appare in modo evidente quando al sistema originale di Zermelo si aggiunge — come fece lo stesso Zermelo nel 1930 — l’assioma di rimpiazzamento. Su questa base, si può considerare la teoria degli insiemi di Zermelo come una possibile forma di “teoria della limitazione di grandezza”;”* ma si potrebbe legittimamente dubitare che la maggioranza dei teorici avrebbe considerato l’idea di limitare la grandezza possibile degli insiemi, se non fosse stata consapevole dei paradossi. C’è però un altro modo di vedere il sistema di Zermelo e i suoi sviluppi, che è chiaramente delineato nell’articolo di Zermelo del 1930, di cui abbiamo già avuto occasione di parlare, “Uber Grenzzahlen
und Men-
genbereiche”. Nella parte introduttiva di questo saggio, Zermelo scrive: Come ausili della [presente] ricerca si offrono primo le “successioni di base” [Grundfolgen] [...], e in secondo luogo lo “sviluppo” [Entwickelung] del dominio normale [Normalbereich], la sua suddivisione in una successione [Fo/ge] ben ordinata di “strati”
[Schichten] separati, dove gli insiemi appartenenti a uno strato “si radicano” [wurzeln] sempre nei precedenti, cosicché i loro elementi stanno in questi, ed essi stessi servono a loro volta come materiale per i successivi [in breve, il primo strato è l’insieme che ha per Sini l’insieme vuoto e tutti gli Urelemente, e ogni strato successivo è l’insieme potenza dell’unione di tutti gli strati precedenti].
In una nota dello stesso anno’° — all’epoca non pubblicata — Zermelo offre brevi dimostrazioni che, in questa concezione dell’universo insiemistico, gli assiomi di ZF sono tutti veri.” Kurt Godel riprese questa prospettiva 2! V. Russell [1959], cap. 7, pp. 79-80.
°? Ibid.
93 Russell [1959], cap. 7, p. 80.
% Molti autori importanti nella storia dello sviluppo della teoria assiomatica degli insiemi hanno concepito il sistema di Zermelo come una teoria della limitazione di grandezza; tra essi vi sono Bernays, Fraenkel, Gòdel, Lévy, Quine, Wang e Weyl (per i riferimenti, v. Hallett [1984], cap. 5, pp. 198-202). 9 Zermelo [1930a], pp. 29-30 (in Zermelo [2010], p. 400, trad. ingl. a fronte; in Cellucci (ed.) [1978], p. 179; in Ewald (ed.) [1996], vol. II, p. 1219):
°° V. Zermelo [1930b].
Alternative, critiche e proposte di emendamento al sistema dei Principia
795
dagli anni 40, sostenendo che gli assiomi di ZF si possono derivare da una concezione unitaria e intuitiva degli insiemi, oggi nota come concezione iterativa, o gerarchico-cumulativa. Questa posizione ha ricevuto un consenso
crescente, divenendo parte dell’ortodossia negli anni 70 del Novecento. Per capire bene di che cosa si tratti, e come la concezione in parola si rapporti all'idea di limitare la grandezza degli insiemi, seguiremo la traccia di due importanti articoli di George Boolos, rispettivamente, del 1971 e del 1989.” Nel primo articolo, intitolato “The iterative conception of set’, Boolos sottoscrive l’idea di Russell secondo cui
«[u]na risoluzione soddisfacente e definitiva dei paradossi della teoria degli insiemi non può essere incarnata da una teoria che blocchi la loro derivazione attraverso restrizioni tecniche artificiali sull’insieme di assiomi che sono imposte solo perché altrimenti seguirebbero dei paradossi». Tuttavia — egli sostiene — questo non è il caso della teoria degli insiemi di Zermelo. Boolos afferma infatti che tale teoria si basa su una concezione degli insiemi — quella iterativa — che «spesso appare alle persone del tutto naturale, libera da artificialità, niente affatto ad hoc, e tale che magari avrebbero potuto formularla esse stesse».!" Boolos sostiene anche che questa teoria sia l’unica teoria assiomatica degli insiemi (presumibilmente) coerente ad avere un tale contenuto intuitivo: Soltanto ZF (insieme con le sue estensioni e sottosistemi) non è solo una teoria degli insiemi (apparentemente) consistente, ma è anche motivata indipendentemente [dall'esigenza di evitare le contraddizioni]; c’è, per così dire, un’“idea dietro di essa” sulla natu-
ra degli insiemi che si sarebbe potuta proporre anche se, per impossibile, la teoria ingenua degli insiemi fosse stata coerente."
L’idea che, secondo Boolos, sta dietro la teoria ZF è la concezione iterativa degli insiemi — di cui Boolos rinviene una traccia già nella caratterizzazione cantoriana di un insieme come «ogni riunione in un tutto M di 0ggetti determinati e ben distinti della nostra intuizione o del nostro pensiero [...1»,!° che suggerirebbe che «gli elementi di un insieme siano “precedenti a” esso»! Vediamo dunque, nella limpida formulazione di Boolos, in che cosa consista la concezione iterativa degli insiemi: Un insieme è qualsiasi collezione che sia formata a qualche stadio del processo seguente. Si cominci con gli individui (se ce ne sono). Un individuo è un oggetto che non è un insieme; gli individui non contengono membri. Allo stadio zero (contiamo da zero invece che da uno) si formino tutte le possibili collezioni di individui. Se non ci sono individui, si forma a questo stadio solo una collezione, l’insieme nullo, che non contiene membri. Se c’è solo un individuo, si formano due insiemi: l’insieme nullo e l’insieme contenente solo quest’individuo. Se ci sono due individui, si formano quattro insiemi; e in generale, se ci sono n individui, si for-
mano 2” insiemi. È possibile che ci siano infiniti individui. Ancora, assumiamo che una delle collezioni formate allo stadio zero sia la collezione di tutti gli individui, indipendentemente da quanti possano essercene. Allo stadio uno, si formino tutte le possibili collezioni di individui e insiemi formati allo stadio zero. Se c’è qualche individuo, al-
lo stadio uno si forma qualche insieme che contiene sia individui sia insiemi formati allo stadio zero. Naturalmente, si forma qualche insieme che contiene solo insiemi formati allo stadio zero. Allo stadio due, si formino tutte le possibili collezioni di individui, insiemi formati allo stadio zero, e insiemi formati allo stadio uno. Allo stadio tre, si formino tutte le possibili collezioni di individui
e insiemi formati agli stadi zero, uno, e due. [...] Si continui in questo modo, formando a ciascuno stadio tutte le collezioni possibili di individui e insiemi formati agli stadi precedenti.!°°
È evidente l’analogia tra la concezione fin qui descritta da Boolos e quella che risulta dalla teoria dei tipi dei Principia: in entrambe, gli insiemi sono gerarchizzati. Ci sono però anche alcune differenze importanti. Una è
"7 Le dimostrazioni di Zermelo [1930b] sono solo brevemente abbozzate e, almeno la dimostrazione della validità dell’assioma di rimpiazzamento (v. Zermelo [1930b], p. 549) non è conclusiva (non sono riuscito invece a comprendere la deduzione zermeliana dell’assioma di estensionalità (v. ibid.)).
sa per es. Gbdel [1944], p. 459; [1947], $ 3, p. 519; [1951], p. 306; [1964], $ 3, pp. 474-475. 9 V. Boolos [1971] e Boolos [1989]. Altri luoghi classici in cui si sostiene una concezione iterativa degli insiemi sono Shoenfield [1967], $ 9.1, pp. 238-240, e Wang [1974], cap. 6 (pubblicato nel 1974 ma scritto nel 1969-70). Una discussione critica della concezione iterativa si
trova in Parsons [1977]. L'articolo di Boolos del 1971 è sicuramente quello che ha reso popolare, negli ambienti filosofici, la concezione iterativa degli insiemi. !©° Boolos [1971], p. 17. Subito prima, Boolos aveva richiamato il brano di My Philosophical Development in cui Russell parla dei sistemi «tali che neppure il logico più ingegnoso li avrebbe pensati se non avesse saputo delle contraddizioni» (Russell [1959], cap. 7, p. 80). !0! Boolos [1971], p. 16. Anche Hao Wang afferma: «La concezione iterativa di insieme è un concetto intuitivo e questo concetto intuitivo
non ha portato a nessuna contraddizione» (Wang [1974], cap. 6, $ 2, p. 192).
‘°° Boolos [1971], p. 17. !03 Cantor [1895-97], $ 1, p. 282 (in Cantor [1915], p. 85). 104 Boolos [1971], p. 13. Ritengo tuttavia, in accordo con Frapolli [1991], che non si possa attribuire a Cantor una concezione iterativa degli insiemi.
'©5 Boolos [1971], pp. 18-19.
796
capitolo 12
che, mentre nei Principia gli insiemi sono stratificati in modo che un insieme di tipo n possa avere elementi del solo tipo n— 1, nella concezione descritta da Boolos un insieme di tipo n può avere come elementi oggetti di qualsiasi tipo inferiore al tipo n. La concezione iterativa descritta da Boolos è quella sottostante alla teoria che oggi è conosciuta come teoria cumulativa dei tipi. Un’altra differenza tra la concezione iterativa e quella dei Principia emerge proseguendo nella lettura della spiegazione di Boolos: Immediatamente dopo tutti gli stadi zero, uno, due, tre, ..., c’è uno stadio; lo si chiami stadio omega. Allo stadio omega, si formino tutte le possibili collezioni di individui e insiemi formati agli stadi zero, uno, due, ... Una di queste collezione sarà l’insieme di tutti
gli insiemi formati agli stadi zero, uno, due, ... Dopo lo stadio omega c’è uno stadio omega più uno. Allo stadio omega più uno si formino tutte le possibili collezioni di individui e insiemi formati agli stadi zero, uno, due, ..., e omega. [...] Si continui in questo modo. Immediatamente dopo tutti gli stadi zero, uno, due, ..., omega, omega più uno, omega più due, ..., c’è uno stadio, lo si chiami
stadio omega più omega (o omega volte due). Allo stadio omega più omega si formino tutte le possibili collezioni di individui e insiemi formati agli stadi precedenti [...]. Si continui in questo modo....!°°
La possibilità di avere tipi transfiniti è invece esplicitamente esclusa, nei Principia.' Nell’introduzione alla prima edizione dell’opera di Whitehead e Russell si legge infatti: «Non arriviamo [nel costruire funzioni proposizionali di ordine sempre più alto] a funzioni di un ordine infinito, perché il numero di argomenti e di variabili apparenti in una funzione proposizionale dev'essere finito, e pertanto ogni funzione dev'essere di un ordine finito»! Poiché nei Principia le classi sono ridotte a funzioni proposizionali, e il tipo degli argomenti di una funzione proposizionale deve sempre essere inferiore all’ordine della funzione stessa, l’assenza di funzioni proposizionali di ordine infinito implica l’assenza di classi di tipo transfinito. L'origine della differenza è nella concezione dei Principia secondo cui le funzioni proposizionali sono entità simboliche, e quindi — almeno così ritiene Russell (qui in contrasto, come vedremo più avanti, con Ramsey) — devono avere una lunghezza finita. Boolos termina la sua descrizione della concezione iterativa degli insiemi osservando che, per come la si è descritta, «gli insiemi sono formati più e più volte: di fatto, stando ad essa, un insieme è formato a ogni stadio successivo a quello in cui è formato per la prima volta».'°” Boolos preferisce però eliminare questa moltiplicazione degli stessi insiemi a diversi stadi: «Potremmo continuare a dire così se ci piace [cioè che gli stessi insiemi si formano più e più volte]; diremo invece che un insieme è formato una sola volta, cioè, al primo stadio in cui, secondo il nostro vecchio modo di esprimerci, si sarebbe detto essersi formato».!!°
Nella parte seguente del suo articolo, Boolos elenca undici assiomi che formulano, in un linguaggio del primo ordine, una teoria degli stadi che cattura formalmente l’essenziale della concezione iterativa descritta a parole; quindi mostra come da tali assiomi derivino direttamente tutti gli assiomi di ZFC, tranne l’ assioma di estensionalità, lo schema d’assiomi di rimpiazzamento e l’assioma di scelta —
cioè gli assiomi dell’insieme vuoto, della
coppia, dell’unione, dell’insieme potenza, dell’infinito, e lo schema d’assiomi di fondazione. Nel secondo degli articoli che abbiamo menzionato, intitolato “Iteration again”, Boolos semplifica la teoria degli stadi, riducendone il numero degli assiomi a sei. Per comodità, seguiremo quest’ultima esposizione. Prima, però, terminiamo la lettura dell’articolo del 1971 considerando che cosa dice Boolos dei tre principi restanti di ZFC, cioè l’assioma di estensionalità, lo schema d’assiomi di rimpiazzamento, e l’assioma di scelta.
Riguardo all’assioma di estensionalità, Boolos osserva una differenza intuitiva tra quest’assioma e tutti gli altri: chi negasse uno qualsiasi degli altri assiomi, sarebbe inteso come qualcuno che, semplicemente, ne sostenesse la falsità; mentre chi sostenesse che ci sono insiemi diversi aventi esattamente gli stessi elementi sarebbe piuttosto considerato qualcuno che usa il termine “insieme” in un senso diverso da quello abituale. Boolos ritiene dunque che l’assioma di estensionalità sia in qualche senso “analitico”.'!! Egli ammette che gli argomenti di Quine contro il concetto di “analiticità” sono persuasivi e che, finché non abbiamo una spiegazione accettabile di cosa significa per un enunciato “essere vero in virtù del suo significato”, ci dobbiamo trattenere dal definire “analitica” qualsiasi cosa. Nondimeno, egli aggiunge che appare probabile che «qualsiasi giustificazione ci possa essere per accettare l’assioma di estensionalità, è più verosimile che somigli alla giustificazione per accettare la maggior parte degli 106 Boolos [1971], p. 19. 107 Essa era invece ammessa nella teoria dei tipi dei Principles (v. sopra, cap. 6, $ 10.2). 108 [PM], vol. I, introduzione, CApa2 SV p193: 10° Boolos [1971], Db JE
Didi
!!! V. Boolos [1971], pp. 27-28.
Alternative, critiche e proposte di emendamento al sistema dei Principia
797
esempi classici di enunciati analitici, come “Tutti gli scapoli sono non sposati” o “I fratelli o sorelle hanno fratelli o sorelle”, di quanto lo sia la giustificazione per accettare gli altri assiomi della teoria degli insiemi». '!° Riguardo agli assiomi derivati dallo schema d’assiomi di rimpiazzamento, Boolos ritiene che essi non si ricavino dalla concezione iterativa degli insiemi, perché, per es., «che ci siano esattamente @; stadi non sembra essere escluso da nulla di ciò che si è detto nella descrizione approssimativa [la concezione iterativa]».'!? È interessante come Boolos giustifichi l'accettazione degli assiomi di rimpiazzamento: Sebbene non si derivino dalla concezione iterativa, la ragione per adottare gli assiomi di rimpiazzamento è semplicissima: essi hanno molte conseguenze desiderabili e (apparentemente) nessuna indesiderabile.'!*
Un’argomentazione, questa, affatto simile a quella con cui si giustificava l’assioma (lo schema d’assiomi) di ridu-
cibilità nella prima edizione dei Principia: Che l’assioma di riducibilità sia autoevidente è una proposizione che si può difficilmente sostenere. Ma di fatto l’autoevidenza non è mai più che una parte della ragione per accettare un assioma, e non è mai indispensabile. La ragione per accettare un assioma, come per accettare qualsiasi altra proposizione, è sempre largamente induttiva, cioè che molte proposizioni che sono pressoché indubitabili possano essere dedotte da esso, e che non si conosca nessun modo altrettanto plausibile attraverso il quale queste propo-
sizioni potrebbero essere vere se l’assioma fosse falso, e che nulla che sia probabilmente falso possa essere dedotto da esso.'!
Per finire, riguardo all’assioma di scelta, Boolos dice che sembra che «sfortunatamente, la concezione iterativa
sia neutrale rispetto all’assioma di scelta».'!° Scrive Boolos: Supponiamo di cercare di derivare l'assioma ragionando in questo modo: Sia x un insieme di insiemi non vuoti disgiunti [cioè, privi
di elementi in comune]. x si forma a qualche stadio s. I membri dei membri di x si formano a stadi prima di s. Quindi, a s, se non prima, c'è un insieme formato che contiene esattamente un membro di ciascun membro di x. Ma asserire ciò è aggirare la questione. Come jappiamo che una tale scelta è formata? Se si forma una scelta, si forma infatti a s 0 prima. Ma come sappiamo che se ne forma una?
L’articolo di diciotto anni dopo, “Iteration again”, rappresenta una parziale rettifica delle tesi sostenute nel lavoro di cui abbiamo appena parlato — non nei risultati tecnici, ma nel genere di conclusione da essi ispirata. Dopo aver descritto la concezione iterativa, in modo non molto diverso dal 1971,'!5 Boolos riformula la teoria degli stadi,"! S, in un linguaggio L del primo ordine in cui sono presenti due stili di variabili: x, y, z, ... per gli insiemi, e r, s, t, ... per gli stadi. Oltre all’usuale simbolo primitivo “€” (appartenenza), in L vi sono due predicati diadici primitivi: “ (AM)
e x= 40),
dove “A(y)” sta al posto di una formula di L che contiene la variabile “y” libera, ma non contiene la variabile “x” libera. Spec, dice Boolos, «cerca di catturare l’idea che gli insiemi formati a qualsiasi stadio sono “tutte le possibi-
li collezioni” d’insiemi formati agli stadi precedenti a questo».!?? Boolos osserva che un’utile riformulazione di Spec è:
Spec
(9A)
x=(A0) 1 yBs)).
Anche nel secondo articolo, Boolos mostra come dagli assiomi che formalizzano la concezione iterativa degli insiemi, seguano gli assiomi di ZFC ad eccezione di quello di estensionalità,'?* quelli di rimpiazzamento e quello di scelta. Tranne la derivazione dell’assioma di fondazione, le dimostrazioni sono molto semplici.'® Gli assiomi
della coppia, dell’unione, dell’insieme potenza e di separazione sono ricavati da opportune istanze dell’assioma Spec dimostrando, per mezzo degli altri assiomi, che nelle condizioni date dall’istanza di “A(y)”, si ha yBs (*y si forma prima dello stadio s°’). L'assioma dell’insieme vuoto è derivato dallo schema d’assiomi di separazione — cioè “(x (42)Y)(y e x= (x e z A A(Y)))” — prendendo A(y) = y # y. L'assioma dell’infinito è dimostrato mostrando che la classe infinita descritta nell’assioma ZF(VI) si forma al primo stadio transfinito, la cui esistenza è postulata con l’assioma /nf. La dimostrazione offerta da Boolos dell’assioma di fondazione ZF(VIII) è più complessa, e passa attraverso la dimostrazione del seguente schema d’induzione per gli stadi:
12° Boolos [1989], p. 92. ini 123 In Boolos [1971], lo schema d’assiomi di specificazione compare in questa forma. 124 Riguardo alla possibilità di aggiungere l’assioma di estensionalità alla lista di assiomi di S, Boolos scrive: «Si potrebbe pensare che l’argomento seguente mostri che l’estensionalità è evidente secondo la concezione iterativa, e che pertanto sareb-
be stato bene prendere VxVy(Vz(ze
x=z€
y) 2 x= y) come uno degli assiomi di $. Si osservino le affermazioni di unicità implicite
nell’uso, [...] [nella descrizione verbale della concezione iterativa], di espressioni come “/a classe nulla” [...] e le altre affermazioni con-
cernenti il numero di insiemi formati ai primi stadi [...] Queste affermazioni presuppongono la verità dell’estensionalità, che avrebbe pertanto dovuto essere un assioma di $. Come risposta si può dire: Si noti che l’estensionalità era immediatamente applicata per calcolare il numero di insiemi formati persino allo stadio 0, prima che fosse esposta se non una piccola parte della concezione. Che gli insiemi siano identici se i loro membri sono gli stessi
sembrerebbe pertanto un principio per la cui evidenza la concezione iterativa non è responsabile, ma piuttosto la cui verità è per noi perfettamente ovvia (per qualsiasi ragione) prima che ci formiamo la concezione iterativa» (Boolos [1989], p. 94).
125 V. Boolos [1989], appendice, pp. 103-104.
Alternative, critiche e proposte di emendamento al sistema dei Principia
799
(45) (A(5)) > (As) (A(5) A (M(f< 5 > -AM)), “Se uno stadio ha una proprietà rappresentata da ‘A’ allora c’è sempre uno stadio che è il primo ad avere quella proprietà”, dimostrato da Dana Scott nel 1974. Ma, se la prova che l’assioma di fondazione sia derivabile nel si-
stema S non è banale, è però evidente che quest’assioma debba valere, in un'adeguata formalizzazione della concezione iterativa degli insiemi. Infatti, se tutti gli insiemi si formano a partire dal materiale fornito al primo stadio attraverso ripetizioni successive, a ogni nuovo stadio, dell’operazione “insieme di ...”, non possono esserci insiemi “sfondati”. Nella seconda parte di “Iteration again” (pp. 98-102), Boolos mostra come, invece, gli assiomi di estensionalità, di rimpiazzamento e di scelta conseguano da un’altra concezione degli insiemi: quella derivata dall’idea di limitarne la grandezza, che Boolos incorpora in un sistema — siglato “FN” (le iniziali di “Frege-von Neumann”) — che corregge quello (come sappiamo, inconsistente) dei Grundgesetze di Frege.'?° Ma non avevamo detto che anche la teoria di Zermelo si può considerare una teoria della limitazione di grandezza? Sì, ma come abbiamo appena visto, la teoria di Zermelo senza assioma di estensionalità, di rimpiazzamento e di scelta si può considerare derivata dalla concezione iterativa, in cui la limitazione alla grandezza degli insiemi non è un fatto primitivo, ma proviene dall’assunzione che, per ogni stadio, ne esista uno successivo, in cui si formano nuovi insiemi di oggetti degli stadi precedenti, cosicché non si ottiene mai una collezione di tutti gli insiemi.'?” Il sistema FN è invece interamente basato sull’esclusione degli insiemi troppo grandi. FN include una logica del second’ordine insieme con il seguente assioma, che sostituisce l'assioma (V) dei
Grundgesetze"* incorporando lo stesso principio espresso nell’assioma di limitazione di grandezza NBG(L) del sistema di von Neumann:
(New V) *F=*G=F-G. Quest’assioma individua, per ogni concetto F, un oggetto */, surrogato di una classe di Frege, che Boolos chiama sottensione (subtension), in modo che due concetti F e G individuino la stessa sottensione se e solo se, o gli oggetti che cadono sotto l’uno cadono anche sotto l’altro, oppure nessuno dei due concetti è piccolo; dove un concetto F è piccolo se e solo se il concetto universale V, espresso da “essere uguale a se stesso”, non cade dentro F; ove
un concetto G cade dentro un concetto / se e solo se tutti gli oggetti che cadono sotto G sono in corrispondenza biunivoca con una parte, o con la totalità, degli oggetti che cadono sotto F. Così, secondo (New V\), tutti i concetti
che non sono piccoli corrispondono a un’unica sottensione. Boolos, dimostra innanzi tutto che FN è coerente, fornendone un modello nel dominio dei numeri naturali," e poi procede a mostrare come in FN siano deducibili tutti
126 ]] sistema FN è elaborato per la prima volta in Boolos [1987]. Qui si trova il nome “(New V)” per contrassegnare l’assioma di FN che
sostituisce l'assioma (V) dei Grundgesetze di Frege. '27 JI punto è chiarito bene in una nota dell’articolo di Gòdel “What is Cantor’s continuum problem?”: «Da questa spiegazione [iterativa] del termine “insieme” segue subito che non possono esistere un insieme di tutti gli insiemi o altri insiemi di un’estensione simile, perché ogni insieme ottenuto in questo modo dà origine immediatamente ad altre applicazioni dell’operazione “insieme di” e, pertanto, all’esistenza di insiemi più grandi» (GOdel [1947], $ 3, p. 519, nota 14; [1964], $ 3, p. 475, nota 12). AVA sopra, cap. 5, $ 1. 12° V. Boolos [1989], p. 99; v. anche Boolos [1987], pp. 181-182. Il modello mostra che FN è consistente, se lo è la teoria dei numeri naturali. Esso fa corrispondere a ogni concetto G sotto cui cadono infiniti numeri naturali il numero naturale 0, identificato con *G, e a ciascun
concetto F sotto cui ron cadono infiniti numeri naturali un unico numero naturale diverso da 0, identificato con *F. Per far corrispondere a ogni F sotto cui non cadono infiniti numeri naturali un unico numero naturale diverso da 0, da identificare con *, si possono seguire diversi metodi. Possiamo, per esempio, sfruttare il fatto che un numero naturale diverso da 0 ha un’unica decomposizione in fattori primi, prendendo */# = n + 1, dove n è il numero naturale che risulta prendendo i primi m numeri primi, dove m è il numero di numeri che cadono sotto F, ponendoli in ordine di grandezza, elevando ciascun k-esimo numero primo al k-esimo numero, in ordine di grandezza, che cade sotto F e, infine, moltiplicando tutti i numeri così ottenuti; se m. = 0, cioè se sotto F non cade nessun numero, prendiamo n = 0. In questo mo-
do, per es., al concetto sotto cui non cade nessun numero corrisponderà il numero 0 + 1 = 1; a quello sotto cui cade solo il numero 0 corrisponderà il numero 2°+1=2;a quello sotto cui cadono i soli numeri 3 e 8 corrisponderà il numero DX Boolos suggerisce un altro metodo, che tuttavia non comprendo bene, perché mi sembra che faccia corrispondere a ogni / sotto cui cade un solo numero naturale, un medesimo numero naturale. Boolos prende, per ogni concetto G sotto cui cadono infiniti numeri naturali, la
sottensione *G = 0 e, per ogni concetto / sotto cui cadono finiti numeri naturali, la sottensione *1 = n+ 1, «dove n è il numero nella cui rappresentazione binaria c’è un 1 al DE posto se e solo se 4 cade sotto F» (Boolos [1989], p. 99). Il problema è che, per esempio, il numero
naturale designato in notazione binaria da “0001” — il quale, aumentato di un’unità, dovrebbe corrispondere all’insieme che contiene solo il numero 2 — non è altro che il numero 1, e dunque è lo stesso di quello designato, in notazione binaria, da 00000001 — il quale, aumentato di un’unità, dovrebbe invece corrispondere all’insieme che contiene solo il numero 3. Forse Boolos intende n + 1, dove n sia rappresen-
800
capitolo 12
gli assiomi di ZFC, formulata al second’ordine, tranne quelli dell’infinito e dell’insieme potenza — che invece, come sappiamo, erano deducibili nel contesto della concezione iterativa. Seguiamo Boolos nell’esplorazione della teoria della teoria FN.! Lo sviluppo di FN è, a grandi linee, un adattamento di quello della teoria dei Grundgesetze. Innanzi tutto, (New V) consente di dimostrare l’esistenza di almeno un oggetto: la sottensione *V del concetto V = [x : x= x] (mi servo qui della simbologia di Boolos che, in analogia con i simboli oggi spesso usati per designare le classi — dove “{x:A(x}” significa lo stesso che “(A)”, cioè “la classe degli x che soddisfano la formula schematizzata con ‘A’” —, designa i concetti sostituendo le parentesi quadre alle graffe). Infatti, poiché V cade dentro se stesso, non è, per definizione, un concetto piccolo, e pertanto si ha che V — V, e dunque, per (New V), *V = *V, e pertanto (4x) (x = *V). Siccome esiste almeno un oggetto — la sottensione *V — il concetto A = [x : x # x], sotto cui non cade nessun oggetto, è piccolo e non è coestensivo con V, quindi, per (New V), *A # *V. Pertanto ci sono almeno due oggetti: *A e *V. Definiamo 0=y *A. Prendiamo ora, dato un y qualsiasi, il concetto [x : x = y] (“Essere identico a y”): sotto di esso cade un solo oggetto, cioè lo stesso y; pertanto il concetto è piccolo. Sia sy =ar *[x : x = y] (‘sy rappresenta il successore di y). Poiché [x : x # x] è piccolo e, per ogni y, [x : x # x] non è coestensivo con [x : x= y], per (New V) si ha che, per ogni y, sy # 0. Inoltre, se sy= sz, allora y = z, perché [x : x = y] è piccolo, e quindi, per (New V), (m)(x= y=x=z). Definendo il concetto “numero naturale”, N, alla maniera di Frege-Russell, N =gr [x : (M(F0 AM(fFy 23 Fsy) > Fx)], si può sviluppare l’ aritmetica in FN. Ora vediamo come si può sviluppare una teoria degli insiemi in FN. Innanzi tutto si definisce: (A#)
xe y=(4M)(y=*FA Fx,
una definizione che richiama la definizione (A) dei Grundgesetze." | Da (A#), poiché *V = *V e V(*V) (*V cade sotto V), segue immediatamente che *V e *V. Se un concetto F è piccolo, allora, se x e *F, per la definizione (A#), (4G)(*F = *G A Gx), ma allora, per (New V), F- G, e quindi Fx. All’inverso, se Fx, F è un concetto e c’è una sottensione *F, e dunque, per (A#), x e *F. Quindi, se F è piccolo: ve
III
Se F non è piccolo, allora si ha F — V, e quindi *F = *V; poiché *V e *V, si ha quindi *Fe
*V, *V e *F e
*F e *F. Supponendo che F sia [x : x # *V], cioè il concetto sotto cui cadono tutti gli oggetti che sono diversi da #V, si ha, naturalmente, che *V non cade sotto F: —F(*V). Ma poiché V cade dentro F (per verificarlo, si correli #V con il numero 0, ogni numero naturale con il suo successore, e ogni altro oggetto che cade sotto V con se stesso), F non è piccolo, e pertanto *V e */. In generale, se un concetto F non è piccolo e non è coestensivo con V, si ha che -(x)(Fx= Vx), ma @M(xe *F= xe *V); abbiamo quindi in FN un teorema analogo al teorema (Y) dell’appendice dei Grundgesetze di Frege (p. 260), del quale abbiamo parlato nel cap. 5, $ 3. Si definisca ora: x è un insieme (in simboli, “Mx”) se e solo se esiste un concetto che è piccolo e x è la sua sot-
tensione: (Set)
Mx= (AM (F è piccolo
Ax=*F).
F è piccolo se e solo se è falso che F — V, e quindi, per (New V), se e solo se *F # *V. Ponendo Sx (“x è una sottensione”’) =4r (41) (x = *£), per la definizione (Set) si ha Mx= (Sx Ax # *V). Ora possiamo vedere, sempre seguendo Boolos, come si ricavano alcuni assiomi di ZFC in FN. Estensionalità. Se x è un insieme, poniamo, x = *F, allora F e [z :
ze *F] sono coestensivi e piccoli, e pertanto
x=*F=*[z:ze *F]. Quindi, se x e y sono insiemi aventi gli stessi elementi, allora [z:ze x]e[z:ze sia coestensivi sia piccoli ex=*[z: ze x]=*[z:z€ y]=y, e l’assioma di estensionalità è dimostrato. tato, per es., da “0001” come l’operazione di aggiungere un “1” davanti a “0001”, così da ottenere “10001”.
150 V. Boolos [1989], pp. 99-102. BIVA sopra, cap. 5, $ 1.
y] sono
Alternative, critiche e proposte di emendamento al sistema dei Principia
801
Insieme vuoto. *A è una sottensione e, come già dimostrato, #A # #V. Dunque, per la definizione (Set), M(*A).
Separazione. Sia x un insieme, poniamo, x= *F. Sia Ponendo y = *G, si ha (z)(ze
G= [y: y € x A Ay]. Allora (y)(Gy > Fy) e G è piccolo.
y=z€ x A AZ).
Coppia. L'assioma della coppia è un corollario di un teorema più generale di FN affermante che, per ogni insieme x= *F e ogni oggetto w, esiste l’insieme (x+ w) = *[y : Fy v y= w] che ha per elementi w e tutti gli elementi di x (si tratta dell’insieme che di solito si designa con “x U {w}”). Per dimostrarlo, basta mostrare che il concetto [y : Fy v y= w] è piccolo. Si supponga, per assurdo, che gli oggetti che cadono sotto V siano in correlazione uno-uno R ‘con parte di quelli (o tutti quelli) che cadono sotto [y : Fy v y= w]. Sia R la medesima correlazione di R$ tranne che assegna a 0 l’oggetto w, e all’oggetto cui prima era assegnato w l’oggetto che prima era assegnato a 0. È evidente che R stabilisce anche una correlazione uno-uno tra gli oggetti che cadono sotto [y : y # 0] e parte di quelli (o tutti quelli) che cadono sotto F. Ma poiché la relazione [xy : y = sx], che correla ogni oggetto con la sottensione che contiene solo quell’oggetto, è una correlazione uno-uno tra gli oggetti che cadono sotto V e quelli che cadono sotto [y : y # 0], ne viene che F non può essere piccolo, cosa che è contro l’ipotesi che *F= x sia un insieme. Da questo teorema segue che, per ogni insieme x c’è un insieme composto da x e dagli elementi di x (il successore di x, x U {x}, secondo von Neumann). Anche l'assioma della coppia, che asserisce che, dati due oggetti x e y, c’è sempre un insieme {x, y}, è una conseguenza immediata del teorema appena dimostrato, perché {x, y} non è altro che (0+x)+y. Unione. L'assioma dell’unione, nella forma generale asserente che, per ogni insieme x, c’è un insieme i cui membri sono solo i membri dei membri di x, non vale in FN. Un controesempio è s(*V) (l’insieme che contiene
solo la sottensione *V), che è un insieme perché il concetto [x : x = *V] è piccolo, ma la cui unione sarebbe la sottensione *V, che non è un insieme perché V non è piccolo. Boolos osserva però che un teorema dimostrato in Lévy [1968], prova che una versione modificata dell’assioma dell’unione vale in FN: l’assioma dell’unione vale
per gli insiemi puri. Per vedere di che cosa si tratti, dobbiamo prima seguire Boolos nello sviluppo della teoria FN riguardante gli insiemi puri. Boolos definisce puro un oggetto x se e solo se: (a)
(F)(F è chiuso > Fx),
dove “F è chiuso” significa: (b)
M(Sx Ae
x 253 FE)
Fx.
Quindi, x è puro se e solo se cade sotto tutti i concetti chiusi, ossia se e solo se ha tutte le proprietà le quali, se appartengono a tutti i membri di una sottensione, appartengono alla sottensione stessa. Boolos dimostra qui due teoremi: Teorema 1. Se Sx e (Y))( € x > y è puro), allora x è puro." Teorema 2. Se x è puro, allora Mx e (y)(y € x > y è puro). 132 Dimostrazione. Per dimostrare che x è puro, occorre provare che, supponendo che F sia chiuso, si ha Fx. gli y appartenenti a x sono puri, quindi, per (a), di ogni y che appartiene a x è vero Fy. Poiché Sx e (y)(y € x gue Fx. Q.E.D. 133 Dimostrazione. Sia G il concetto [x : Mx A (y)(y € x > y è puro)], in parole, il concetto essere un insieme no puri. Se si dimostra che G è chiuso, poiché per ipotesi x è puro, dalla (a) si ha Gx, e dunque il teorema
Abbiamo, per ipotesi, che tutti > Fy), e F è chiuso, da (b) setutti gli elementi del quale soè provato. Si tratta dunque di
provare che G è chiuso; cioè, secondo la definizione (5), che (x)(Sx A (Y) € x > Gy) > Gx,, ovvero che, supponendo
(i) Sx AQ) E xD Gy), segue Gx, cioè:
(ii) MxAM)0 € x > y è puro). Mostriamo innanzitutto che Mx. Supponiamo che x non sia un insieme: —-Mx. Poiché, come si è già mostrato in precedenza,
802
capitolo 12
Dai teoremi 1 e 2 segue immediatamente che un oggetto x è puro se e solo se x è un insieme e tutti i suoi membri sono puri (quindi, né *V, né s(*V), né ss(*V), ecc. sono puri). Che un oggetto sia puro implica che esso, i suoi elementi, gli elementi dei suoi elementi, ecc. sono tutti insiemi (non vale l’implicazione inversa, perché potrebbero esserci insiemi i cui elementi, gli elementi di questi elementi, ecc., siano tutti insiemi, ma che sono “sfondati”,
mentre, come vedremo tra poco, per gli insiemi puri di Boolos si dimostra l’assioma di fondazione). Estensionalità, separazione e coppia per insiemi puri. Se x e y sono puri e, per ogni insieme puro z, z E x = z2 € y, allora per tutti gli oggetti z vale che ze x= ze y e dunque, per l’estensionalità, x= y. Quindi l’assioma di estensionalità vale ancora quando è relativizzato agli insiemi puri. Nello stesso modo si dimostra che gli assiomi di separazione e della coppia valgono se relativizzati a insiemi puri.
Fondazione per insiemi puri. Poiché tutti i membri degli insiemi puri sono puri, si può dimostrare il seguente teorema per gli insiemi puri: (4x) (x è puro A Gx) > (4x) (x è puro A Gx A Y)(y € xD -Gy));
“Se una proprietà qualsiasi vale per almeno un insieme puro, allora c’è un insieme puro x tale che Gx e G non vale Mei per nessun membro di x”°.!** Segue da questo teorema per gli insiemi puri vale l’assioma di fondazione (per vederlo, si prenda, al posto di x°, “xe w”). Gli insiemi puri, dunque, sono quelli che si possono “costruire” a partire dall’insieme vuoto. Ma
(13
39
(13
(in) Mx=(Sx nx#*V), da Sx (vero per (1)), -Mx e (iii) si ha chex=*V, e dunque x € x e, per (i), Gx, e dunque, per definizione di G, (iv) Mx.
Mostriamo ora che (y)(y € x > y è puro), provando che, nell’ipotesi:
(Mie si ha che y è puro. Da (i) e (v) si ricava Gy, e dunque, per definizione di G: (vi) My A (2)(ze y>zè puro); e, poiché My > Sy (se y è un insieme, è una sottensione), (vi) implica: (vii) SyA()(ze ya zè puro); da (vii), per il Teorema 1: (vili) y è puro. Da (vili), scaricando l’ipotesi (v) e generalizzando, si ha:
(x)
Mo € x 23 yè
puro).
Infine, da (iv) e (ix), si ha (ii), cioè Gx, e quindi G è chiuso. Q.E.D.
Ò
Dimostrazione. Assumendo, per ipotesi, che F sia un concetto tale che:
0)
x>Fy) > Fr),
allora, per la def. (6) si ha: (ii) è chiuso; per la def. (a) abbiamo: (ill) (xè puro > (F è chiuso > Fx); da (ii) e (111) si ha: (iv) @)(xè puro > Fx. Da (iv), scaricando l’ipotesi (i), si ha: MV Oboe xD> FE) 25M è puro > Fx). Da (v): (vi) -(xè puro > FM) 3-0) e x) 23 Fx), da cui: (vii) (Ex) (x è puro A-Fx) > (Ev) e x > Fy) Ax. Sostituendo “(x è puro A Gx)” a “Fx? in (vii) si ha: (vili) (4x)(x è puro A (x è puro A Gx)) > A») (0) e x > —(y è puro A Gy) A (x è puro A_Gx)), cioè: (ix) (x) (xè puro A Gx) > (Ax) (x è puro A Gx A Y)(y € xD -( è puro 1 Gy))).
Nell'ipotesi che x sia puro, tutti i suoi membri y sono puri, cosicché “(y)(y e x > —(y è puro A Gy))” equivale a “)(y e x > -Gy)Y”?; quindi, nell’ipotesi che x sia puro, (ix) equivale a: (x) (#x)(x è puro A Gx) > (4x) (x è puro A Gx 1(y) e xD -Gy)). Q.E.D.
Alternative, critiche e proposte di emendamento al sistema dei Principia
803
l’assioma di fondazione non vale per gli insiemi in generale: l’insieme s(*V) è un controesempio, perché è falso che s(*V) contenga un elemento che non ha elementi in comune con s(*V) (infatti, *V e *V).
Scelta. Per provare l’assioma di scelta in FN, Boolos dimostra: (1) che i numeri ordinali sono ben ordinati, (2) che il concetto di numero ordinale, On, non è piccolo, dunque esiste una relazione uno-uno tra gli oggetti che cadono sotto V e una parte, o la totalità, degli oggetti che cadono sotto On. Questo induce ovviamente un buon ordinamento della sottensione universale *V, dimostrando l’assioma di scelta
globale (v. sopra, nota 90). I numeri cardinali e ordinali non si possono definire in FN alla maniera di Frege-
Russell, perché V cade dentro i concetti di cui essi sarebbero la sottensione e quindi, per (New V), i numeri si identificherebbero l’uno con l’altro. Per esempio, V cade dentro il concetto sotto cui cadono tutti gli insiemi di un solo elemento, e cade anche dentro il concetto sotto cui cadono tutti gli insiemi di due elementi, e quindi, per (New V), si avrebbe 1 = 2= *V. Boolos definisce quindi i numeri, all’interno di FN, alla maniera di von Neumann. Un insieme x è transitivo se e solo se tutti i membri dei suoi membri sono anche suoi membri: (y)(z)(y €
ZAZE XD yE x); un numero ordinale è definito da Boolos come un insieme che è puro, transitivo, e tale che tutti i suoi membri sono transitivi. Da questa definizione segue il
x ; < 13 Teorema 3. Se x è un ordinale, e y € x, allora y è un ordinale.'? Poiché gli ordinali contengono solo ordinali, che sono insiemi puri, il principio di induzione per gli insiemi puri dà luogo a un principio di induzione per gli ordinali: (4x) (x è un ordinale n Gx) > (4x)(x è un ordinale A Gx A (Y))y € xD -Gy));
“Sotto ogni concetto sotto cui cade almeno un numero ordinale cade un numero ordinale che è il primo a cadere sotto di esso”. Ciò implica che la relazione € sia connessa sugli ordinali. Poiché essa è anche transitiva (gli ordinali sono transitivi) e irriflessiva, gli ordinali sono ben ordinati da e. Ora Boolos si serve del paradosso di BuraliForti per dimostrare:
Teorema 4. On = [y : y è un ordinale] non è piccolo. '*° L'assioma di scelta globale segue immediatamente. Rimpiazzamento. L'assioma di rimpiazzamento, sia nella forma generale, sia nella forma relativizzata agli insiemi puri, segue in FN dall’assioma di scelta. Supponiamo che x sia un insieme e F una relazione uno-molti, e supponiamo, per assurdo, che vi sia una correlazione uno-uno tra gli oggetti che cadono sotto V e parte di quelli (o anche tutti quelli) che cadono sotto il concetto [y : (4z)(z € x) A Fyz]. Per l’assioma di scelta (che consente di scegliere un solo elemento z e x da ciascun gruppo di elementi di x rimpiazzati dal medesimo y), si ha allora che c’è una correlazione uno-uno tra gli oggetti che cadono sotto V e parte di quelli (o tutti quelli) che cadono sotto [y:y€ x]; ma ciò è impossibile perché, per ipotesi, x è un insieme, e dunque il concetto [y : y € x] è piccolo. Quindi [y : (4z)(z e x) A Fyz] è piccolo. Ponendo w= *[y : (42)(ze x) A Fyz], si ha infine che YM)(ye w= (42) (2 € x) A Fyz) (infatti, se F è piccolo, x e *F = Fx).
!35 Poiché x è puro, e y appartiene a x, anche y è puro, e poiché tutti i membri di x sono transitivi, anche y è transitivo. Inoltre, se z € y, allora, per la transitività di x, z € x, e z è transitivo. Quindi tutti imembri di y sono transitivi. 156 Dimostrazione. Si supponga, per assurdo, il contrario. Sia x = *On. Allora x è un insieme e (y)(y € x= On (y)). Tutti i membri di x sono puri e Sx, quindi, per il Teorema 1, x è puro. Se z € y e y € x, allora z e y sono ordinali, e z € x, quindi x è transitivo. Se y € x, allora y è un ordinale, ed è transitivo, quindi tutti i membri di x sono transitivi. Quindi x è un ordinale, e pertanto x € x, che è impossibile, perché x è pu-
ro, e l’assioma di fondazione vale per gli insiemi puri.
804
capitolo 12
Unione per insiemi puri. Possiamo ora comprendere come l’assioma dell’unione si dimostri per gli insiemi puri in FN. La dimostrazione offerta in Lévy [1968] (che Boolos non riporta) consiste nel mostrare che, nel sistema di von Neumann, per ogni insieme x di insiemi di numeri ordinali (definiti alla maniera di von Neumann), esiste un insieme x che è l’unione degli insiemi contenuti in x. Usando il principio di rimpiazzamento da ciò segue che per ogni insieme di von Neumann, y, esiste un insieme U y che è l’unione degli insiemi contenuti in y (dopo aver dimostrato, servendosi del paradosso di Burali-Forti, che l’insieme dei numeri ordinali non è un insieme, e quindi che — per l’assioma NBG(L) di von Neumann — deve esistere una relazione F uno-molti tra tutti gli elementi della classe universale e quelli dell’insieme dei numeri ordinali. si rimpiazza ogni elemento z di ogni elemento di y (che dev'essere, ovviamente, un elemento della classe universale) con il più piccolo ordinale n tale che Fn). Per dimostrare che per ogni insieme x di insiemi di numeri ordinali, esiste un insieme Ux che è l’unione degli insiemi contenuti in x, Lévy prova dapprima che ogni insieme di numeri ordinali (di von Neumann) ha un confine superiore. Poi, dato un insieme x di insiemi di numeri ordinali, prende la classe, z, dei minimi confini superiori degli
insiemi contenuti in x; poiché x è un insieme, per il principio di rimpiazzamento anche z sarà un insieme, e dunque sarà anch’esso limitato superiormente. Prendendo il minimo confine superiore, &, di z, si avrà che i numeri ordi-
nali contenuti x sono contenuti anche in @ e dunque, poiché @ è un numero ordinale, e dunque un insieme, anche U x è un insieme. La dimostrazione vale nel sistema di von Neumann per gli insiemi, e dunque vale per gli insiemi puri di FN. Infinito e insieme potenza. Non sono dimostrabili, in FN, né in forma generale, né nella forma relativizzata agli
insiemi puri. Inoltre, nessuno dei due è dimostrabile in FN assumendo l’altro. La ragione è chiara: con l’ausilio di questi assiomi (e degli altri dimostrabili in FN) si può dimostrare l’esistenza di insiemi molto grandi; ma, in una
teoria della limitazione di grandezza, non possiamo sapere se tali insiemi non sono troppo grandi per esistere. Per esempio, FN ha un modello nel dominio dei numeri naturali; dunque, in questo modello, i concetti sotto cui cadono un'infinità numerabile di oggetti non danno luogo a insiemi, ma alla sottensione *V. FN è dunque un sistema adeguato per l’aritmetica, ma non per fondare la teoria dei numeri reali. Anche assumendo un assioma dell’infinito, non possiamo provare in FN che valga l’assioma dell’insieme potenza. Infatti, potrebbe essere che il numero degli oggetti esistenti sia 2"°, nel qual caso l’insieme potenza di un insieme infinito numerabile non potrebbe esistere. ( La conclusione di Boolos, in ‘“Iteration again”, è che «è un errore pensare che la teoria degli insiemi, cioè, ZF con [assioma di] scelta, segua interamente dalla concezione iterativa».!! In un articolo successivo, intitolato “Must we believe in set theory?”, Boolos precisa quale sia, a suo parere, la
portata filosofica dei risultati ottenuti negli articoli che abbiamo ora considerato. Dopo aver ripreso l'osservazione che la concezione iterativa degli insiemi è intuitiva, ma da essa non seguono alcuni importanti assiomi di ZFC (quelli di estensionalità, di rimpiazzamento e di scelta), ora Boolos aggiunge una considerazione che dice essere «di gran lunga più importante»:!5° Anche se la concezione iterativa è supplementata in modo che ne segua il rimpiazzamento, che ragione abbiamo di pensare che una storia del genere sia corretta? Certamente, se la storia da cui questi principi sugli insiemi e gli stadi si possono ricavare è vera, allora la teoria degli insiemi [ZFC] è vera, ma perché dovremmo credere che la storia sia di fatto vera? Forse dopo un po”, la storia di-
viene falsa e questi insiemi non esistono. '5°
Boolos ammette che alcuni assiomi di ZFC s’impongono come indubbiamente veri, ma questi non sempre coincidono con quelli ricavabili dalla concezione iterativa degli insiemi. Infatti, appaiono come indubitabili, secondo Boolos, l’assioma di estensionalità e quello della coppia. «Ma non sono per niente convinto», continua Boolos, «che qualcuno degli assiomi dell’infinito, dell’unione, o della potenza ci s' imponga in questo modo o che lo facciano tutti gli assiomi di rimpiazzamento che possiamo comprendere».'‘° Sull’assioma dell’insieme potenza (ricavabile, come sappiamo, dalla concezione iterativa), Boolos scrive:
137 V. Boolos [1989], p. 103; corsivi di Boolos.
158 Boolos [1998b], p. 127. Wlbidi
14 Boolos [1998b], p. 130.
Alternative, critiche e proposte di emendamento al sistema dei Principia
805
Ma non mi sembra irragionevole pensare che forse non si dia il caso che per ogni insieme, ci sia un insieme di tutti i suoi sottoinÈ È si 5 SEA -, : zx age È 4 siemi. L'assioma, io credo, non ci si impone come vero, come fanno l’estensionalità e l'insieme coppia [...].''
La concezione iterativa degli insiemi si basa su una metafora costruttiva. Questo può renderla intuitiva quanto può esserlo l’idea concettualista che le entità matematiche siano create da noi, attraverso un processo di definizio-
ne progressiva. Tuttavia, la concezione iterativa non è coerente con il concettualismo. In primo luogo, l’idea che gli stadi proseguano nel transfinito è evidentemente platonica. Inoltre, l'assioma di comprensione di ZF ammette che un insieme appartenente a un certo stadio si possa definire attraverso una formula in cui compaiono variabili
quantificate che variano su tutti gli insiemi, anche su quelli che non sono stati ancora costruiti a quello stadio — ammette, cioè, definizioni impredicative. Ma da un punto di vista concettualista le definizioni impredicative sono illegittime: non possiamo definire un’entità attraverso una totalità di cui essa è parte, più di quanto possiamo costruire un pilastro usando del materiale da costruzione di cui il pilastro stesso sia parte. La concezione iterativa appare dunque un ibrido, che fonda la sua plausibilità su una metafora concettualista, ma che, in realtà, è accetta-
bile solo in un quadro platonista.'! Una delle critiche più diffuse alla teoria ramificata dei tipi dei Principia è un’imputazione di incoerenza: mentre la ramificazione conseguente al rifiuto delle definizioni impredicative presupporrebbe una concezione costruttivista della matematica, l’assioma di riducibilità sarebbe accettabile solo da una prospettiva platonista (v. sotto, $
2.3). Adesso vediamo che anche ZF non può dirsi immune da questa stessa critica.
1.2. RUSSELL E IL SISTEMA DI ZERMELO Facciamo un passo indietro. Nel 1908 — l’anno in cui Zermelo pubblicò per la prima volta la sua teoria assiomatica degli insiemi — Russell era giunto alla conclusione che la propria teoria ramificata dei tipi risolvesse tutti i paradossi, consentendo la derivazione dell’intera matematica classica. Sostenendo la teoria nei Principia, egli non assunse tuttavia un atteggiamento dogmatico. Nella prefazione dei Principia, datata novembre 1910, si legge: Una gran parte del lavoro implicato nella stesura di quest'opera è stato speso sulle contraddizioni e i paradossi che hanno colpito la logica e la teoria degli aggregati. Abbiamo esaminato un gran numero di ipotesi per trattare queste contraddizioni. [...] Nel corso di questo studio prolungato, siamo stati condotti, come c’era da aspettarsi, a modificare occasionalmente le nostre posizioni; ma gradualmente è divenuto per noi evidente che si deve adottare qualche forma della dottrina dei tipi se si vogliono evitare le contraddizioni. La particolare forma della dottrina dei tipi difesa in quest'opera non è logicamente indispensabile, e ce ne sono varie altre forme ugualmente compatibili con la verità delle nostre deduzioni. Siamo scesi nei particolari, sia perché la forma della dottrina che difendiamo ci pare la più probabile, sia perché era necessario produrre almeno una teoria perfettamente definita che eviti le contraddizioni. Ma difficilmente qualcosa nel nostro libro sarebbe mutato dall'adozione di una diversa teoria dei tipi.!*
Non solo nei Principia non c’è dogmatismo riguardo a quale teoria dei tipi possa essere la migliore, ma la prefazione del libro continua mostrando che, in realtà, Russell ammetteva anche la possibilità di una teoria logica di-
versa da quella dei tipi:
14 Boolos [1998b], p. 131. Un importante motivo di dubbio addotto in Boolos [1998b], sulla verità del complesso degli assiomi di ZFC, è
la possibilità di dimostrare, in questa teoria, l’esistenza di numeri cardinali di grandezza esorbitante, per la nostra intuizione (seppure “piccoli”, rispetto ai cosiddetti “grandi cardinali”). Boolos prende come esempio il primo numero cardinale 4 tale che 4= &,, che egli chiama “K°. Kè il numero cardinale N LP, ossia il limite della serie di numeri cardinali No, Xx; X Rag ® (cioè, il numero cardinale più piccolo tra tutti i numeri cardinali più grandi di ogni membro di questa serie). Benché sia «incredibilmente grande» (Boolos [1998b], p. 121) alla luce del senso comune, come inaccessibile (v. sopra, note 57 e rimpiazzamento). Boolos osserva ZFC —, l’esistenza di ximplica
rileva Boolos ([1998b], p. 120), xnon è neppure (essendo il limite di una serie di © elementi) un numero 59), e la sua esistenza si dimostra senza difficoltà in ZFC (utilizzando, in modo essenziale, l'assioma di (v. Boolos [1998b], p. 120) che, se i numeri cardinali sono i cardinali di von Neumann — l’esistenza di almeno
xinsiemi.
come usuale in
La domanda che allora ci pone Boolos, è se davvero, accettando ZFC,
crediamo che esistano tutte queste entità: «Pensate davvero che vi siano tutti questi insiemi? Davvero?» (Boolos [1998b], p. 122). Boolos ritiene che di solito siamo (e dovremmo essere) scettici, su questo (v. Boolos [1998b], pp. 123-124), ed egli stesso lo è: «Non è che io creda
che x esista e non è che io creda fermamente che x non esista. Senza molte o molto buone ragioni, e senza opinioni forti sulla questione, tendo in qualche modo a pensare che probabilmente non esista, ma sono realmente abbastanza incerto. E sono anche dubbioso che si possa provvedere qualcosa che si potrebbe chiamare una ragione e che risolva la questione» (Boolos [1998b], p. 121). 142 Una difesa della tesi dell’incoerenza filosofica della concezione iterativa si trova in Rieger [2007], $ 8. 143 [PM], vol. I, prefazione, p. vii.
806
capitolo 12 In realtà, possiamo andare oltre, e dire che, supponendo che esista qualche altro modo di evitare le contraddizioni, non molto nel nostro libro, eccetto quando tratta esplicitamente dei tipi, dipende dall’adozione della dottrina dei tipi in qualsiasi forma, qualora si sia mostrato (come noi crediamo di aver mostrato) che sia possibile costruire una logica matematica che non porti a contraddizionigi
È dunque naturale chiedersi perché, quando, già nel marzo del 1908, Russell seppe del sistema presentato da Zermelo non l’abbia considerato come un’alternativa possibile alla propria teoria dei tipi: la teoria di Zermelo non è neppure menzionata, nei Principia. Russell riteneva che una teoria adeguata degli insiemi dovesse trovare posto all’interno di una teoria logica che eliminasse rutti i paradossi. Considerando la teoria degli insiemi parte della logica, egli supponeva che dovesse trarre origine da qualche principio che connettesse gli insiemi con le proprietà: un principio di comprensione, dunque. Ma la teoria di Zermelo non può funzionare con il solo assioma zermeliano di comprensione: è ovvio che, se non si hanno già degli insiemi, affermare che si può ricavare l’insieme di tutti gli oggetti già appartenenti a un insieme che godano di una certa proprietà è un’asserzione vuota. L'esistenza di alcuni insiemi di partenza, e di quelli ricorsivamente ottenibili da questi attraverso l'applicazione di certe regole, è quindi direttamente postulata da Zermelo. Ma tale postulazione non è sostenuta da nessun argomento logico: appare puramente ad hoc. In realtà, quando, nel 1908, Zermelo propose il suo sistema originario, non aveva nessuna concezione unifican-
te del concetto di “insieme” (solo nel 1930 egli presenterà quella che oggi è nota come concezione iterativa degli insiemi), né tentava una spiegazione del perché all’interno della teoria intuitiva degli insiemi sorgano antinomie. I suoi assiomi erano scelti con l’unico criterio dichiarato di ottenere un sistema abbastanza permissivo da consentire di ricavare tutti i risultati matematicamente interessanti, ma abbastanza restrittivo da non consentire la derivazione
dei paradossi insiemistici noti.'* In altri termini, nella teoria di Zermelo le antinomie insiemistiche note erano forse evitate, ma non risolte —
se, come scriveva Peano nel 1906, «Solutione de antinomia es indicatione de pun-
cto ubi es errore in ratiocinio».!‘ In contrasto con ciò, all’epoca Russell era giunto alla conclusione che la propria teoria ramificata dei tipi non solo evitasse le contraddizioni note, ma spiegasse perché esse sorgano, riconducendone l’origine a un denominatore comune: la violazione del “principio del circolo vizioso”, il quale si giustifica, a sua volta, sulla base di un’ontologia nominalista, nei confronti di classi, proposizioni, e funzioni proposizionali, che riconduce le condizioni di verità di ogni enunciato alle condizioni di verità di enunciati atomici. Quest’idea è espressa chiaramente nei Principia: «è nostra convinzione che la teoria dei tipi, com’è esposta in quanto segue, conduca sia ad evitare le contraddizioni, sia alla scoperta della precisa fallacia che ha dato origine ad esse [corsivo mio]».!!” Ma se la teoria di Zermelo fosse davvero riuscita a evitare tutte le contraddizioni, sarebbe pur sempre stato un passo in avanti nella direzione di una teoria logica alternativa a quella dei Principia. Un po’ come la teoria dei numeri naturali di Peano aveva costituito per Russell un indubbio passo avanti nella direzione di una definizione logica del concetto di “numero naturale”. Russell si rendeva però conto che la teoria di Zermelo, non supplementata da altro, non riusciva affatto a eliminare tutti i paradossi. In una lettera a Jourdain del 15 marzo 1908 Russell scrive: Ho finora letto l’articolo di Zermelo una sola volta, e non accuratamente [...]. Concordo interamente con le tue critiche. Penso che
il suo assioma per evitare le classi illegittime sia così vago da essere inutile [...].!48
La precedente lettera di Jourdain è perduta, cosicché non sappiamo di preciso quali fossero le critiche al sistema di Zermelo cui Russell si dichiara d’accordo. Riferendosi però, evidentemente,
all’assioma HI di Zermelo,
Russell ci dice che esso è vago. Il motivo, si può supporre, è che Zermelo non specifica quali proprietà siano da
144 Ibid. 14 La mancanza di un principio guida, nella presentazione originale del sistema di Zermelo, fu all’origine del suo rifiuto, nel 1909, da parte di Poincaré (v. Poincaré [1909], $ 5, pp. 473-475, e $ 7, pp. 481-482). Poincaré argomenta che se gli assiomi sono intesi meramente come
principi arbitrari, perché siano accettabili occorre una dimostrazione della loro coerenza; ma Zermelo non fornisce questa dimostrazione, né può farlo — secondo Poincaré — perché intende basare l’intera matematica su tali assiomi. Bisognerebbe allora — continua Poincaré — che gli assiomi fossero basati sull’intuizione; ma non è neppure così, perché Zermelo accetta alcuni assiomi intuitivi, ma ne respinge altri (come il principio secondo cui qualsiasi collezione di oggetti è un insieme) che, se aggiunti ai primi (scelti arbitrariamente), renderebbero il sistema incoerente.
14 Peano [1906b], p. 344. 147 [PM], vol. I, introduzione, p. 1. 148 In Grattan-Guinness [1977], p. 109.
Alternative, critiche e proposte di emendamento al sistema dei Principia
807
considerarsi definite. Sappiamo che Zermelo si serviva della clausola secondo cui le proprietà in grado di separare, all’interno di un insieme dato, un nuovo insieme, devono essere “definite” per bloccare la derivazione di para-
dossi oggi detti “semantici”. Per esempio, dato l'insieme dei numeri reali, non sorgono obiezioni se utilizziamo la proprietà espressa da “x è un numero algebrico” per ottenere, attraverso l'assioma di separazione, l’insieme di tutti i numeri reali algebrici; ma se cerchiamo di utilizzare la proprietà espressa da ‘x è definito con un numero finito di parole italiane” per isolare, all’interno dello stesso insieme dei numeri reali, l’insieme di tutti i numeri reali de-
finibili con un numero finito di parole italiane, incorriamo nel paradosso di Richard. Zermelo non fornisce tuttavia un criterio per distinguere le proprietà legittime da quelle illegittime. Si può dunque supporre che Russell ritenesse — a ragione — la teoria di Zermelo inadeguata a trattare con i paradossi “semantici”. Ma Russell non poteva non avere in mente anche la versione intensionale del suo stesso paradosso — che non è un paradosso “semantico”. Come escluderla, se non chiarendo quali funzioni proposizionali siano legittime e quali no? Già in “On some difficulties in the theory of transfinite numbers and order types” (1905), dopo aver dichiarato: «Ciò che è dimostrato dalle contraddizioni che abbiamo considerato è in generale questo: “Una funzione proposizionale di una variabile non determina sempre una classe”»,'* Russell aggiunge una nota a piè di pagina in cui precisa: Qui si deve comprendere che gli argomenti che mostrano che non c’è sempre una classe mostrano anche che non c’è sempre un’entità separabile che sia la funzione proposizionale (in quanto opposta ai suoi valori); e che qualche funzione proposizionale di due variabili non determina una relazione in intensione [in intension] o in estensione [in extension], se per relazione intendiamo
un’entità separabile che può essere considerata separatamente dai termini correlati.'°°
Nel 1908, Russell aveva elaborato una teoria dettagliata su quali funzioni proposizionali siano legittime e quali non lo siano (in sintesi, le funzioni proposizionali illegittime sono quelle che violano la teoria ramificata dei tipi). È proprio su questo punto, cioè la caratterizzazione precisa di quali funzioni proposizionali siano illegittime, che Russell ritiene carente la teoria di Zermelo. Questa carenza fece sospettare a Russell che nel sistema di Zermelo fossero ancora derivabili nuovi paradossi insiemistici. Infatti, la menzionata lettera a Jourdain del 15 marzo
1908
continua così: [...] inoltre, poiché egli [Zermelo] non riconosce la teoria dei tipi, sospetto che i suoi i suoi assiomi non eviteranno realmente le
contraddizioni, ossia sospetto che si possano produrre nuove contraddizioni [new contradictions could be manufactured) specificamente designate ad essere consistenti con i suoi assiomi. Perché mi sento sempre più sicuro che la soluzione risieda nei tipi così come sono generati dal principio del circolo vizioso, ossia il principio “Nessuna totalità può contenere membri definiti in termini di se ge o “Qualsiasi cosa che contenga una variabile apparente non dev'essere un valore possibile di quella variabile apparenLessa
Oggi sappiamo che la nozione di funzione proposizionale definita di cui si fa uso nella teoria di Zermelo si può precisare in modo adeguato. Ma questo richiede una teoria logica su cui basare la teoria insiemistica di Zermelo. Ed è proprio questa teoria logica che Russell riteneva di aver trovato con la sua teoria ramificata dei tipi. Con un vantaggio, però, agli occhi di Russell: che la teoria degli insiemi si può introdurre come parte della logica dei Principia, mentre adottando la prospettiva di Zermelo — o di coloro che negli anni Venti e Trenta ne hanno precisato la teoria — essa si trova ad essere completamente staccata dalla logica di base: una teoria puramente matematica, non ridotta a logica. Cosa che non è accettabile nella prospettiva logicista di Russell. Riguardo alla coerenza della teoria di Zermelo, se immersa in una logica adeguata, oggi ci sono in realtà pochi dubbi, anche se una dimostrazione di ciò non esiste. Si può dimostrare la coerenza di Z all’interno di ZF, ma natu-
ralmente la cosa non è decisiva, perché ZF è una teoria (molto) più potente di Z, a causa della presenza in essa dell’assioma di rimpiazzamento.'° D”altra parte, il secondo teorema d’incompletezza di Gòdel'?* implica che non possa esistere una dimostrazione della coerenza di Z (0 di ZF) se non all’interno di sistemi più potenti, e dunque più dubbi, di Z (o di ZF). Tuttavia, la circostanza che, nonostante il lavoro intenso che per più di un secolo è stato
14° Russell [1906a], $ II, pp. 144-145. !50 Russell [1906a], $ II, p. 145, nota 1. 5! In Grattan-Guinness [1977], p. 109. !52 È proprio l’assioma di rimpiazzamento che permette di dimostrare la consistenza relativa di Z rispetto a ZF, perché esso, consentendo di dimostrare in ZF l’esistenza di un insieme di 2@ elementi, permette di costruire in ZF un modello con un dominio di 2© elementi per Z. 153 V. sotto, cap. 14, nota 158.
808
capitolo 12
condotto in ZF e su ZF, non siano mai emerse in essa contraddizioni, offre senza dubbio una buona garanzia em-
pirica che ZF sia coerente. Non è però scomparsa — nonostante l’emergere, a partire dal 1930, della concezione iterativa degli insiemi — l’impressione che ZF e i sistemi assiomatici correlati siano in qualche modo ad hoc. È vero che la concezione iterativa degli insiemi è intuitiva, ed è anche vero che nella gerarchia di modelli delineata in Zermelo [1930a]i para-
dossi insiemistici sono bloccati, ma manca una spiegazione standard di che cosa ci sia di sbagliato nella formazione di insiemi non stratificati, o troppo grandi. Già nel 1902 Russell aveva indicato come possibile soluzione ai paradossi insiemistici una stratificazione degli insiemi,'?* e nel 1905 aveva considerato la possibilità di una teoria della limitazione di grandezza." Nel 1908, egli era convinto di aver risolto il problema: anche il sistema dei Principia impedisce la formazione di classi “troppo grandi”, o di classi non stratificate, ma lo fa attraverso assunzioni logiche che impediscono la violazione del principio del circolo vizioso — che è precisamente, per Russell, il “puncto ubi es errore in ratiocinio”. Se però si respinge la teoria dei tipi dei Principia, non è chiaro perché gli insiemi non stratificati, 0 “troppo grandi”, conducano a paradossi. Cantor adduceva una ragione teologica a suffragio dell’inammissibilità di insiemi troppo grandi: l'impossibilità di assegnare confini all’infinito assoluto; Sine tale motivazione, proprio perché teologica, fa infine appello a un mistero. Riassumendo, la teoria dei tipi sostenuta nei Principia aveva, agli occhi di Russell, tre importanti vantaggi sul sistema di Zermelo: (1) quello di essere una teoria logica, comprendente la teoria degli insiemi, capace di evitare, con lo stesso meccanismo, tutti i paradossi che Russell considerava “logici”; (2) quello di spiegare perché certi ragionamenti intuitivi sono sbagliati e conducono a contraddizioni; (3) quello di fornire una ragionevole sicurezza contro il presentarsi di nuove contraddizioni — ragionevole sicurezza basata sulla diagnosi precisa del genere di fallacia all’origine di tutti i paradossi noti.
2. CRITICHE E EMENDAMENTI ALLA TEORIA DEI PRINCIPIA 2.1. LA TEORIA DEI TIPI CONTRADDICE SE STESSA? L’obiezione secondo cui la teoria dei tipi non è formulabile senza contraddire se stessa è antica: se ne trova una versione già in Wittgenstein [1914] (pp. 108-109), poi in Paul Weiss [1928] (pp. 67-69), in Black [1944] (pp. 235236), ed essa è ancora ripresa da William e Martha Kneale ([1962]) che scrivono: BEL) Hi.] sembra impossibile formulare la teoria [dei tipi] senza violarei suoi stessi precetti perché parole come “funzione”,2? 6 “entità”, e “tipo” devono sempre rimanere libere da restrizioni di tipo. Se, per esempio, diciamo che nessuna funzione può essere asserita in modo significante di tutte le entità senza distinzione di tipo, la nostra asserzione involge la generalità illimitata che si dichiara essere impossibile. E ancora deve esserci qualcosa di sbagliato in una qualsiasi definizione di un tipo secondo la quale due entità sono dello stesso tipo se una funzione proposizionale che può essere affermata o negata in modo significante dell’una può anche essere affermata o negata in modo significante dell’altra. Perché quando cerchiamo di applicare una tale definizione in un caso particolare, e diciamo, per esempio, che Platone è dello stesso tipo di Socrate ma la saggezza non è dello stesso tipo, ci troviamo presi in una contraddizione. Dalla nostra dichiarazione segue che Platone non è dello stesso tipo della saggezza, e tuttavia la dichiarazione stessa mostra chiaramente che esiste almeno una funzione che può essere affermata veridicamente di Platone e negata veridicamente della saggezza, cioè l’essere dello stesso tipo di Socrate.'”
Lo stesso Whitehead, trent'anni dopo la prima edizione dei Principia (com’è noto, egli non collaborò alla seconda edizione), scrive: Russell aveva perfettamente ragione. Confinando il ragionamento numerico all’interno di un tipo, si evitano tutte le difficoltà. Egli aveva scoperto una regola di sicurezza. Ma sfortunatamente questa regola non si può esprimere se non presupponendo che la nozione di numero si applichi oltre i limiti della regola. Perché il numero “tre” in ciascun tipo appartiene esso stesso a tipi diversi. Inoltre ciascun tipo è esso stesso di un tipo distinto dagli altri tipi. Così, secondo la regola, la concezione di due tipi diversi è un nonsenso, e la concezione di due diversi significati del numero tre è un nonsenso. Ne segue che il nostro solo modo di comprendere la regola èun nonsenso.'°*
154 Nell’ appendice B dei Principles (v. sopra, cap. 6, $ 10).
!55 V. Russell [1906a], $ II, pp. 152-154 (v. sopra, cap. 8, $ 3). 156V. sopra, cap. 4, $
2.1.3.
157 Kneale e Kneale [1962], cap. 11, $ 2, p. 670.
!55 Whitehead [1941], $ V, pp. 671-672 (in Whitehead [1947], p. 103).
Alternative, critiche e proposte di emendamento al sistema dei Principia
809
Nel 1944, Russell replicò così a Black ([1944]): Mr. Black sostiene che la teoria dei tipi, se vera, mi ha preoccupato molto; la stessa parola “tipo” una riformulazione. Le parole, in se stesse, sono quisiscono il loro stato di tipo attraverso le regole
non può essere formulata senza contraddizione. Questo è un punto che in passato contravviene alla lettera della teoria. Ma si può evitare il problema per mezzo di tutte dello stesso tipo; esse sono classi di serie simili di forme o rumori. Esse acsintattiche cui sono soggette. Quando dico che “Socrate” e “umanità”4” sono di tipi
differenti, non intendo né le parole come occorrenze fisiche né ciò che significano [la loro denotazione] [...]. Differenze di tipo si-
gnificano differenze di funzione sintattica. Due parole di tipi differenti possono comparire tra virgolette in modo che una possa rimpiazzare l’altra, ma non possa rimpiazzare l’altra quando le virgolette sono assenti.'°°
Sebbene Russell appaia qui confondere le parole con i loro nomi, ciò che intende è abbastanza chiaro: se «parole di tipi differenti possono comparire tra virgolette in modo che una possa rimpiazzare l’altra», allora sono i nomi delle parole ad essere dello stesso tipo. Le parole, in quanto simboli di un linguaggio, non sono tutte dello stesso tipo, perché hanno funzioni sintattiche diverse; i loro nomi, tuttavia, hanno la medesima funzione sintattica e so-
no, quindi, tutti dello stesso tipo. Così, per esempio, si può dire: “‘Socrate’ è dello stesso tipo di ‘Platone’’’ o Socrate” non è dello stesso tipo di ‘saggezza’”’, dove le parole “Socrate” e “saggezza” sono menzionate, ma non si può dire: “Socrate è dello stesso tipo di Platone” e “Socrate non è dello stesso tipo della saggezza”, dove le stesse parole sono usate. Lo stesso Black ([1944], pp. 236-237) aveva suggerito qualcosa di simile come possibile via d’uscita alla sua
(943
stessa obiezione.'° Quasi mezzo secolo dopo, tuttavia, Peter HyIton ([1990a], cap. 7, pp. 317-318, e [1990b]) ha
ripreso questa critica alla teoria dei tipi con un riferimento più puntuale ai Principia. Egli menziona l’inizio del primo capitolo dell’introduzione dei Principia, in cui si legge: Troveremo che la variabile non ristretta è ancora soggetta a limitazioni imposte dal modo della sua occorrenza, ossia cose che si possono dire in modo significante riguardo a una proposizione non si possono dire in maniera significante riguardo a una classe o a una relazione, e così via. Ma le limitazioni cui è soggetta la variabile non ristretta non necessitano di essere esplicitamente indicate, poiché esse sono i limiti di significanza dell’asserzione in cui compare la variabile, e sono dunque intrinsecamente determinate da
quest’asserzione.'°'
Questo brano — afferma Hylton'° — suggerisce che non vi sia nessuna necessità di formulare esplicitamente le limitazioni imposte dalla teoria dei tipi; tuttavia — egli continua — i Principia contengono esplicite asserzioni sulle restrizioni di tipo, e questo non solo «nella prosa espositiva, che ha forse una funzione puramente euristica»,9 ma, al contrario anche nei suoi enunciati formali.
Hylton si riferisce in particolare, agli enunciati in *9.131 e *9.14 dei Principia. *9.131 è una definizione di “essere dello stesso tipo”; riportiamola qui: *9.131. Definizione di “essere dello stesso tipo”. Quella che segue è una definizione passo per passo, la definizione per i tipi più alti presupponendo quella per i tipi più bassi. Diciamo che v e v “sono dello stesso tipo” se (1) entrambi sono individui, (2) entrambi sono funzioni elementari che prendono argomenti dello stesso tipo, (3) u è una funzione e v è la sua negazione, (4)uè px 0yw x, evè p% vyw&,dove g% eyw&
sono funzioni elementari, (5)uè ()Y). g(t,yevè (2). y(*,z), dove @(*,9), g(t,9) so
no dello stesso tipo, (6) entrambi sono proposizioni elementari, (7) u è una proposizione e
vè -u, 0 (8) uè A). gxevè )).wvy,
dove @ % e w % sono dello stesso tipo.
*9.14 è una proposizione primitiva che fa un uso essenziale della nozione di “essere dello stesso tipo” prima definita: *9.14. Se “@x” è significante, allora se x è dello stesso tipo di a, “@a” è significante, e viceversa. Pp.
Secondo Hylton, queste asserzioni violano la teoria dei tipi. Ecco la sua spiegazione: 159 Russell [1944b], p. 692. 150 Black [1944] (pp. 237-239) respinge comunque la teoria dei tipi, per motivi legati essenzialmente al fatto che essa introdurrebbe forzature nel linguaggio ordinario. !6! [PM], vol. I, introduzione, cap. 1, p. 4.
} V. Hylton [1990b], p. 160, e HyIton [1990a], cap. 7, p. 318.
!05 Ibid.
810
capitolo 12
È importante vedere con chiarezza esattamente il perché un’asserzione enunciante la teoria dei tipi — in effetti il concetto stesso “è dello stesso tipo di” — viola le restrizioni di tipo. Se la clausola [the clause] “a è dello stesso tipo di x” non è del tutto oziosa (e di
fatto non lo è), dev'essere qualche volta vera e qualche volta falsa. Cioè, deve esserci un oggetto, chiamiamolo b, di cui è sensato dire che è dello stesso tipo di un oggetto dato a, ma nel cui caso ciò non è vero; e deve esserci un altro oggetto, c, che è dello stesso tipo di a, e nel cui caso ciò possa anche essere detto. Ma allora c’è una funzione proposizionale, quella espressa da “x è dello stesso tipo di 4”, che si può applicare in modo significante sia a d sia a c (veridicamente in un caso, falsamente nell’altro). Ma per un principio fondamentale della stessa teoria dei tipi (espressa nella clausola “viceversa” di *9.14) da ciò dovrebbe conseguire che d e c sono dello stesso tipo. Poiché “è dello stesso tipo di” èx transitiva, questa conclusione è direttamente contraria all’assunzione iniziale che b è differente in tipo da a, ma che c è dello stesso tipo di GU
Come ha argomentato Gregory Landini ([1996a]),'® la tesi di HyIton ([1990b], [1990a], cap. 7, pp. 317-318) secondo cui principi come *9.131 e *9.14 violerebbero la teoria dei tipi è errata. Landini osserva che questi principi non violano la teoria dei tipi perché sono metalinguistici: «Essi riguardano la grammatica formale dei Principia e le condizioni per la buona formazione dei simboli». '°° Il punto cruciale — rileva Landini — è che essi sono necessari «solo perché [nei Principia] gli indici di ordine/tipo [nel linguaggio oggetto] sono assenti». '°”Landini fa qui riferimento alla decisione degli autori dei Principia di servirsi dell’espediente dell’ “ambiguità tipica” — cioè all’espediente di evitare sempre di specificare gli indici di ordine/tipo di una funzione proposizionale — che, nota Landini, «è intelligibile soltanto come una convenzione per sopprimere i simboli di ordine/tipo; il linguaggio formale e il sistema deduttivo devono essere formulati con essi, e allora (con regole per la reintroduzione) essi possono essere soppressi». Per Landini — con il quale concordiamo — principi come *9.131 e #9.14 non sono «realmente a proposito di funzioni in un senso ontologico», ma sono «a proposito di simboli»: essi «sono usati per caratterizzare le formule ben formate in un sistema che ha evitato di avere indici di ordine/tipo per le sue variabiloci Se ciò è corretto, allora l’asserzione fatta nei Principia secondo cui «le limitazioni a cui è soggetta la variabile non ristretta non richiedono di essere esplicitamente indicate [...]»!?° è validata: i principi che riguardano i tipi sono principi metalinguistici che si rendono necessari, nei Principia, solo per l’uso dell’espediente abbreviativo dell’ambiguità tipica, ma sono del tutto inutili, se il sistema è formulato utilizzando indici di tipo. Non occorrono certo principi indipendenti, per es., per decidere che espressioni aventi gli stessi indici di tipo sono dello stesso tipo. A questa tesi, secondo cui gli enunciati che descrivono la teoria dei tipi devono èssere intesi come metalinguistici, si oppone il punto di vista molto diffuso, in letteratura, secondo cui la concezione russelliana della logica non sarebbe compatibile con la possibilità di una prospettiva metalinguistica su di essa. Questa è proprio la posizione di Hylton, il quale osserva come la logica, per Russell, [...] è una sistematizzazione del ragionamento in generale, del ragionamento come tale. Se abbiamo una corretta sistematizzazione, essa comprenderà tutti i principi corretti di ragionamento. Data una tale concezione della logica non può esserci una prospettiva esterna. Qualsiasi ragionamento, semplicemente in virtù dell’essere un ragionamento, cadrà all’interno della logica; qualsiasi proposizione che potremmo voler avanzare è soggetta alle regole della logica.!”!
Secondo Hylton, la teoria logica, così com’è concepita da Russell, non può ammettere una metateoria, perché
questa metateoria dovrebbe essere al di fuori del ragionamento razionale, e ciò è impossibile.'”? Indubbiamente, Russell esclude la possibilità di condurre ragionamenti al di fuori della logica; per esempio, nei Principles, parlando degli assiomi della logica proposizionale, egli scrive: [...] si deve osservare che il metodo del supporre falso un assioma, e di dedurre le conseguenze di quest’assunzione, che si è trovato eccellente in casi come l’assioma delle parallele, non è qui universalmente valido. Perché tutti i nostri assiomi sono principi di 164 Ibid. V. anche Hylton [1990a], cap. 7, p.317.
‘65 106 167 18 '6°
V. anche Landini 1 andini [1996a], I andini [1996a], andini [1996a], TIandini [1996a],
[1998a], $ 10.2, pp. 259-261. p. 297. p. 298. p. 296. p. 298.
190 [PM], vol. I, introduzione, cap. 1, p. 4.
!7! Hylton [1990b], p. 148. 172 V. anche Hylton [1990a], cap. 5, pp. 200-203. Per posizioni analoghe si vedano van Heijenoort [1967], pp. 326-327; Grattan-Guinness [1977], pp. 112-113; Goldfarb [1979], p. 353, [1982], pp. 693-694, [1988], p. 69, [1989], p. 236; Korhonen [1996], p. 449.
Alternative, critiche e proposte di emendamento al sistema dei Principia
811
deduzione; e se essi sono veri, le conseguenze che sembrano seguire dall’impiego di un principio opposto non seguono realmente, si Pepi ; Sat DIE i; ; 5 s . 173 cosicché gli argomenti dalla supposizione della falsità di un assioma sono qui soggetti a fallacie particolari.”
Russell afferma qui che gli assiomi di un sistema logico servono per fare deduzioni logiche (invece di dire che sono regole di deduzione, potremmo dire che possono essere trasformati in regole di deduzione). Se regole di deduzione valide vengono cambiate in regole di deduzione invalide, le deduzioni non saranno più affidabili. In breve,
Russell sta dicendo qui che non è legittimo argomentare al di fuori della logica. Da ciò, tuttavia, Hylton inferisce che Russell non possa ammettere nessun metalinguaggio per un linguaggio logico — cosicché, per esempio, gli
enunciati che formulano la teoria dei tipi non possono essere intesi come metalinguistici, ma devono essere formulati nello stesso linguaggio oggetto della logica. Hic est saltus. Ma leggiamo prima Hylton: La difficoltà non deriva dal semplice fatto che ci sono distinzioni di tipo; essa deriva dal fatto che queste distinzioni devono essere formulate all’interno [del linguaggio oggetto] dei Principia. Il fatto cruciale qui è che secondo la concezione della logica che ho attribuito a Russell non può esservi nessuna vera meta-prospettiva sulla logica: la logica si applica a ogni asserzione, e quindi anche alle asserzioni che sono volte a limitare l’ambito della variabile usata in altre asserzioni.!”*
Come ha argomentato Landini in diversi saggi,” tuttavia, la concezione universalistica della logica non obbliga Russell a escludere la possibilità di un metalinguaggio per un linguaggio logico. Russell — come già Frege prima di lui — non identifica la logica con un calcolo logico, con un sistema formale interpretabile in riferimento a diversi universi di discorso — cioè a diversi domini di oggetti —, ma la concepisce come una scienza. Tale scienza, se vista come ricerca, indaga sulle verità massimamente generali dell’ universo — quelle verità, si potrebbe dire, che devono essere vere in ogni mondo possibile —, se vista come corpo di conoscenze, è costituita da tali verità massimamente generali. Russell, come Frege prima di lui, ritiene che la logica abbia per oggetto /a realtà esattamente come le altre scienze. Questa scienza può certamente fare uso di linguaggi e sistemi formali, ma non s’identifica con essi, proprio come la fisica, o la biologia, non s’identificano con i linguaggi e i sistemi formali che si possono approntare per la fisica, o per la biologia. Russell era perfettamente consapevole della possibilità di formalizzare la logica in sistemi differenti (cioè con differenti insiemi di assiomi e regole di deduzione),'”° ma certamente avrebbe respinto l’idea che vi siano diverse logiche, proprio come avrebbe respinto l’idea che vi possano essere diverse fisiche. Nulla esclude, in questa prospettiva, la possibilità di usare parte della logica per formulare un calcolo logico: un calcolo logico e il suo metalinguaggio potrebbero benissimo esprimere entrambi parte della logica. 173 Russell [1903a], $ 17, p. 15. Russell torna sulla distinzione tra uso degli assiomi come premesse di una dimostrazione 0 come principi di deduzione nei Principia (vol. I, *2, p. 106) e nell’Introduction to Mathematical Philosophy (v. Russell [1919a], cap. 14, pp. 150-151). Dicendo che tutti gli assiomi di una teoria logica sono “principi di deduzione”, Russell intende che gli assiomi possono fornire (per mezzo di sostituzioni opportune) entrambe le premesse, p e‘ p > q! (uso qui le virgolette angolari di quasi-citazione di Quine: v. sopra, cap. 11, nota 197), della deduzione di una proposizione qg per mezzo del modus ponens. Quando gli assiomi forniscono la premessa p essi sono, dice
Russell nell’Introduction, «premesse sostanziali (substantive premisses)» (ibid., p. 150), ma quando forniscono la premessa ‘p > g! essi sono usati, secondo Russell, come principi formali di deduzione, perché stabiliscono «il fatto che la premessa implica la conclusione» (ibid., p. 150), e ci danno così «la forma dell’inferenza» (ibid., p. 151). Interpreto questo nel modo seguente: Russell vede nel secondo uso degli assiomi delle regole formali di deduzione perché esso consente di dimostrare regole di deduzione derivate (non primitive). Vale a dire che la presenza nel sistema dei Principia di un assioma della forma ‘A > B, dove A e B sono formule qualsiasi, consente di dimostrare,
con l’ausilio del modus ponens, la validità della regola derivata “Da A si può dedurre B”. Si osservi, però, che Russell non confonde gli assiomi con le regole di deduzione (primitive) come il modus ponens: come risulta chiaramente dal passo menzionato dell’ Introduction, egli distingue infatti tra i principi formali di deduzione (a p. 150 dell’Introduction, Russell ha cura di porre in corsivo la parola “formal”, nell’espressione “formal principles of deduction”) — che sono gli assiomi —, e i principi di deduzione non formali, come il modus ponens, inesprimibili nel linguaggio oggetto della teoria (v. Russell [1903], $ 38, e [PM], vol. I, #1, p. 94).
174 Hylton [1990b], p. 159. RE
per es., Landini [1996a], pp. 291-293; Landini [1996c], pp. 555-559; Landini [1998a], $ 1.8, pp. 30-41 (per una discussione più am-
pia). Una posizione simile a quella di Landini è sostenuta in Proops [2007], pp. 19-21. Per una critica convincente dell’idea che la concezione universalistica della logica implichi il rifiuto della possibilità di una metateoria, v. anche Blanchette [2012], $ 7.2.1. 17° Si trovano esempi di ciò senza uscire dai Principia. Per esempio, Denis Vernant ([2005]) ha osservato: «Il #9 (PM: 127) introduce le quantificazioni universali ed esistenziali come due idee primitive. Ma il paragrafo successivo propone un “metodo alternativo” che ammettendo come idea primitiva la negazione, permette di definire la quantificazione esistenziale a partire dall’universale secondo la definizione *10.01:
(1) px =pr-@M)- px. E la lampante illustrazione del carattere relativamente “arbitrario” che Russell ha sempre attribuito alla scelta delle idee e proposizioni primitive (cfr. PM Intro/1)» (Vernant ([2005], p. 102).
812
capitolo 12
Che Russell non identifichi i limiti della logica con i confini di un linguaggio formale è evidente già nei Principles, laddove egli scrive, a proposito della regola del modus ponens: «Questo è un principio non suscettibile d’enunciazione simbolica formale, e illustrante le limitazioni essenziali del formalismo».!””
Non voglio sostenere che Russell, all’epoca della prima edizione dei Principia, riconoscesse la necessità di distinguere tra linguaggio e metalinguaggio (né lo suggerisce Landini), ma l’unica accusa che gli si può muovere per questo — in un’epoca in cui nessuno faceva questa distinzione!” — è quella di non avere precorso i tempi, perché la mancata distinzione tra linguaggio e metalinguaggio non è affatto un portato della teoria dei Principia, né, in senso più lato, del logicismo russelliano. Prova ne sia che, in seguito, Russell accettò senza riserve tale di-
stinzione. Già in un saggio di una dozzina d’anni posteriore alla prima edizione dei Principia — la sua introduzione al Tractatus di Wittgenstein — Russell adombra la possibilità di una gerarchia di linguaggi (nessuno dei quali, si badi, sarebbe fuori dei limiti della logica!), tali che un linguaggio superiore possa esprimere cose che in un linguaggio inferiore restano inesprimibili. Il problema cui si riferisce Russell in questo contesto è proprio quello degli enunciati logici. Russell scrive che, secondo Wittgenstein, [...] la proposizione [qui, conforme all’uso di Wittgenstein, “proposizione” (proposition) sta per “enunciato”] logica è un'immagine (vera o falsa) del fatto, e ha in comune con il fatto una certa struttura. È questa struttura comune che la rende capace di essere un'immagine del fatto, ma la struttura non può essa stessa essere formulata in parole [cannot itself be put into words], per-
ché è una struttura di parole, così come dei fatti cui esse si riferiscono. Tutto ciò, quindi, che è implicito nell’idea stessa dell’espressività del linguaggio deve restare non suscettibile di essere espresso nel linguaggio, ed è, pertanto, inesprimibile. Questo inesprimibile contiene, secondo Mr. Wittgenstein, la totalità della logica e della filosofia.”
Russell esprime «qualche esitazione» nell’accettare questa posizione di Wittgenstein, «nonostante i potentissimi argomenti che egli adduce a suo sostegno»; '5° egli continua: Ciò che causa esitazione è il fatto che, dopotutto, Mr. Wittgenstein riesce a dire molto su ciò che non può essere detto, suggerendo così al lettore scettico che forse vi possa essere qualche scappatoia attraverso una gerarchia di linguaggi, o mediante qualche altra , : 181 via° d’uscita.
Quale sia la sua proposta per far fronte alla difficoltà messa in luce da Wittgenstein, Russell lo chiarisce alla pagina successiva della sua introduzione: Queste difficoltà mi suggeriscono una possibilità come questa: che ogni linguaggio abbia, come dice Mr. Wittgenstein, una struttura riguardo alla quale, ne/ linguaggio, nulla può essere detto, ma che ci possa essere un altro linguaggio che tratti della struttura del primo linguaggio, e avente esso stesso una nuova struttura, e che a questa gerarchia di linguaggi possa non esservi limite. Mr. Wittgenstein risponderebbe naturalmente che la sua intera teoria è applicabile senza mutamenti alla totalità di tali linguaggi. La sola replica sarebbe negare che vi sia una totalità del genere. Le totalità riguardo alle quali Mr. Wittgenstein sostiene che sia impossibile parlare logicamente sono nondimeno da lui ritenute esistenti, e sono l’oggetto [subject-matter] del suo misticismo. La totalità risultante dalla nostra gerarchia sarebbe non solo logicamente inespressibile, ma una finzione, una pura illusione, e in questo modo la supposta sfera del mistico sarebbe abolita. Una tale ipotesi è molto difficoltosa, e posso vedere obiezioni ad essa cui al momento non so come rispondere. Tuttavia non vedo come un'ipotesi più semplice possa sottrarsi alle conclusioni di Mr. Wittgenstein."
177 Russell [1903a], $ 18, p. 16. Qualche paragrafo più avanti, nei Principles, Russell ribadisce che il modus ponens «elude la formulazione
formale, e indica una certa incapacità [failure] del formalismo in generale» (Russell [1903a], $ 38, p. 34). Russell prosegue distinguendo nettamente il pertanto (therefore) del modus ponens dall’ implica (implies) dell’implicazione materiale, dicendo che il primo, a differenza del secondo, compare tra proposizioni asserite e permette di asserire il conseguente quando l’antecedente è asserito (v. ibid., pp. 34-35). Russell spiega (ibid., p. 35) che questa distinzione risolve il puzzle proposto da Lewis Carroll in Carroll [1895], che mostra come, sapendo solo chep è vera e che è verap > g, non si è in grado di dedurre g. V. anche [PM], vol. I, #1, p. 94. 178 Russell elaborò i suoi punti di vista sulla logica molto prima che fosse noto il teorema d ’indefinibilità di Tarski secondo cui non è possi bile definire un predicato di verità per un linguaggio sufficientemente potente (per esempio, per esprimere l’aritmetica elementare) all’interno del linguaggio stesso. Il teorema d’indefinibilità si può considerare un corollario del primo teorema d’incompletezza di Gòdel (0 viceversa). (Per maggiori informazioni sul primo teorema d’incompletezza di Godel, v. sotto, cap. 14, $ 2.) Sebbene il teorema di Tarski sia stato pubblicato due anni dopo quello di Gòdel (v. Tarski [1933]) sappiamo che Tarski l’aveva scoperto, indipendentemente da Gòdel, già nel 1929. 17° Russell [1921b], pp.xx-xxi.
150 Russell [1921b], p.xxi.
181 Ibid.
152 Russell [1921b], p.xxii.
Alternative, critiche e proposte di emendamento al sistema dei Principia
813
Qui Russell suggerisce che, in ogni linguaggio logico, possono esserci cose inesprimibili in quel linguaggio, ma esprimibili in un metalinguaggio (sempre logico) del primo. Quali cose? Quelle che riguardano la struttura logica del linguaggio stesso. Qui Russell reputa ancora l’idea “difficoltosa”, è vero, ma diciotto anni dopo, nell’ Inquiry into Meaning and Truth, egli accetta senza riserve l’idea tarskiana di una gerarchia di linguaggi: Tarski, nel suo importante libro Der Wahrheitsbegriff in den formalisierten Sprachen [v. Tarski [1933]], ha mostrato che le parole “vero” e “falso”, applicate agli enunciati di un linguaggio dato, richiedono sempre un altro linguaggio, di ordine superiore, per la loro definizione adeguata. La concezione di una gerarchia di linguaggi è implicata [involved] nella teoria dei tipi, che, in qualche forma, è necessaria per la soluzione dei paradossi; essa gioca un ruolo importante nel lavoro di Carnap come in quello di Tarski. La suggerii nella mia introduzione al Tractatus di Wittgenstein, come una via d’uscita dalla sua teoria che la sintassi può solo essere “mostrata”, non espressa in parole. Gli argomenti per la necessità di una gerarchia di linguaggi sono schiaccianti, e d’ora in poi ne assumerò la validità. '5*
Una posizione ribadita da Russell nell’articolo “Logical positivism”, pubblicato nel 1950: Il Wiener Kreis [Circolo di Vienna”] e l’ammirevole periodico Erkennmnis fecero un lavoro eccellente, finché non furono fermati da Hitler e dall’ Anschluss. Dalla scuola di Vienna fu sviluppata la gerarchia di linguaggi, una dottrina che avevo brevemente suggerito come un modo per sfuggire al piuttosto particolare misticismo sintattico di Wittgenstein. [...] E risultato che, dato un qualsiasi linguaggio, esso deve avere una certa incompletezza, nel senso che ci sono cose da dire circa il linguaggio che non si possono dire ne/ linguaggio. Ciò è connesso con i paradossi — il mentitore, la classe delle classi che non sono membri di se stesse, ecc. Questi paradossi mi erano parsi richiedere per la loro soluzione una gerarchia di “tipi logici”, e la dottrina di una gerarchia di linguaggi appartiene allo stesso ordine d’idee. Per esempio, se io dico “Tutti gli enunciati [sentences] nel linguaggio L sono veri o falsi”, questo non è esso stesso un enunciato nel linguaggio L. È possibile, come ha mostrato Carnap, costruire un linguaggio in cui si possono dire molte cose circa il linguaggio, ma mai tutte le cose che si potrebbero dire: alcune di esse apparterranno sempre al “metalinguaggio”. Per esempio, c’è la matematica, ma comunque “matematica” possa definirsi, ci saranno asserzioni
[statements] circa la matematica che apparterranno alla ‘“metamatematica”,
e devono
essere escluse dalla matematica
sotto pena di contraddizione. C’è stato un ampio sviluppo tecnico di logica, sintassi logica, e semantica. In quest'ambito, Carnap ha svolto gran parte del lavoro. Der Begriff der Wahrheit in den formalisierten Sprachen di Tarski è un libro molto importante, e se paragonato con i tentativi dei filosofi del passato di definire la “verità” mostra l’aumento di potenza derivato da una tecnica interamente moderna.'**
Nessun dubbio che qui Russell accetti l’idea di un metalinguaggio per un qualsiasi linguaggio logico come non problematica per la sua concezione della logica. Accettando un approccio simile alla teoria dei tipi sembrerebbe persistere, tuttavia, una difficoltà già esposta, per esempio, in Copi [1971]: In breve, l’obiezione che la Teoria Semplice dei Tipi non può essere formulata senza violare i suoi stessi precetti, non è veramente risolta dall’affermazione che la teoria riguarda solo i simboli, non le cose. Perché quando un linguaggio incorporante una teoria dei
tipi è interpretato, si devono imporre tipi a quelle cose nei termini delle quali il linguaggio dev'essere interpretato.'*°
Copi spiega: Si supponga che il linguaggio in questione sia governato da una regola sintattica che impedisce l'ammissione di una formula come
“Xe y"” se non quando m + 1= n. Allora le classi @ e f di un qualsiasi modello che possa costituire un’interpretazione del linguaggio devono essere soggette a restrizioni esattamente analoghe. Altrimenti vi saranno fatti riguardanti le classi @ e f del modello che il linguaggio in questione non sarà adeguato a formulare. "5°
Un parere analogo era stato espresso, anni prima, da Frederic B. Fitch ([1946]): Un modo per cercare di affrontare l’obiezione [...] è asserire che una formulazione di una teoria dei tipi è semplicemente la formulazione di certe stipulazioni più o meno arbitrarie o convenzionali circa i modi consentiti di combinare simboli. Questa risposta sembra andare benissimo finché ci si limita al regno dei simboli non interpretati, ma appena si entra nel regno dei concetti semantici diviene necessario applicare distinzioni di “tipo” ai significati dei simboli tanto quanto ai simboli stessi [...].'*”
183 184 185 186 !87
Russell [1940], cap. 4, p. 62. Russell [1950], pp. 370-371. Copi [1971], $ 2.4, p. 74. Copi [1971], $ 2.4, pp. 73-74. Fitch [1946], p. 225. Riportato anche in Copi [1971], $ 2.4, p. 74.
814
capitolo 12
L’obiezione di Fitch e Copi presuppone che i simboli suddivisi in tipi denotino tipi di entità. Questa premessa è però falsa riguardo alla teoria sostenuta nei Principia. Nei Principia — secondo l’interpretazione che ne abbiamo fornito nel precedente capitolo — c’è un solo tipo di entità: il tipo degli individui, di cui fanno parte sia gli universali, sia i particolari. Le funzioni proposizionali, le classi e le proposizioni non sono concepite come entità extralinguistiche. La gerarchia dei tipi dei Principia è solo una gerarchia di simboli, non di entità. In “The philosophy of logical atomism” (1918) Russell lo afferma esplicitamente: «La teoria dei tipi è in realtà una teoria di simboli, non di cose». !8 Tuttavia, come abbiamo visto (v. sopra, cap. 10, $ 2, e cap. 11, $ 1.2), dopo la prima edizione dei Principia,
Russell sostenne che gli universali — attributi e relazioni in intensione — sono entità di tipo diverso tra loro, e diverso dal tipo degli individui. Questo comporta, naturalmente, il problema rilevato da Copi e Fitch. In un brano di “Logical atomism” (1924), Russell riconosce apertamente il problema, che era stato posto da Wittgenstein già dieci anni prima, e risponde così: Le parole [...] sono tutte dello stesso tipo; pertanto quando i significati di due parole sono di tipi differenti, le relazioni delle due parole con ciò per cui stanno sono anch'esse di tipi differenti. Parole-attributo [attribute-words] e parole-relazione [relation-words]
sono dello stesso tipo, pertanto possiamo dire in modo significante “Le parole-attributo e le parole-relazione hanno differenti usi”. Ma non possiamo dire in modo significante “Gli attributi non sono relazioni”. Per la nostra definizione dei tipi, poiché le relazioni sono relazioni, la forma di parole “Gli attributi sono relazioni” non dev'essere falsa, ma priva di significato, e la forma di parole “Gli attributi non sono relazioni”, similmente, non dev'essere vera, ma priva di significato. Nondimeno, l’asserzione “Le paroleattributo non sono parole-relazione” è significante e vera.!°
È importantissimo osservare che la difficoltà posta qui in luce da Russell è completamente diversa dalla precedente, perché non pone in questione la teoria dei tipi dei Principia, e la conseguente gerarchia di finzioni proposizionali, ma la formulabilità di un’u/teriore partizione in tipi dell’unico tipo di entità riconosciuto nella prima edizione dei Principia: quello costituito dagli individui. La difficoltà che viene a crearsi con quest’ultima suddivisione in tipi — che è del tutto indipendente dalla gerarchia dei tipi dei Principia — è sostanzialmente quella che avevamo incontrato nella distinzione ontologica fregeana tra funzioni (fra le quali vi sono, secondo Frege, i concetti e le relazioni) e oggetti: il paradosso di Kerry." Ma il paradosso di Kerry non prova che una teoria in cui esso sorge sia sbagliata. Perché, se davvero esiste una radicale differenza di categoria ontologica tra particolari e universali, questa differenza non può non essere rispecchiata in un corretto simbolismo logico. L’inesprimibilità delle differenze di tipo delle entità diviene in questo caso — proprio come l’aveva concepita Frege'" — uno degli inevitabili limiti espressivi di qualsiasi linguaggio logico consistente.
2.2. CRITICHE AL PRINCIPIO DEL CIRCOLO VIZIOSO I paradossi derivano tutti — secondo Russell — da una violazione del principio del circolo vizioso. Per esempio, l’affermazione di Epimenide il cretese pretende di riferirsi alla totalità delle affermazioni fatte dai cretesi, alla quale questa stessa affermazione apparterrebbe; nel paradosso di Cantor, si definisce il numero di tutti i numeri cardinali facendo riferimento alla totalità di tutti i numeri cardinali, alla quale apparterrebbe anche il numero che è definito. Il principio del circolo vizioso ha suscitato da subito le obiezioni della maggior parte degli autori. Ramsey, per esempio, osserva che: «possiamo riferirci a un uomo come al più alto in un gruppo, identificandolo così per mezzo di una totalità di cui esso stesso è un membro senza che vi sia nessun circolo vizioso». Nello stesso spirito, Quine scrive che una specificazione impredicativa «non è visibilmente più viziosa che selezionare un individuo come il tipico uomo di Yale sulla base di medie di punteggi di Yale che includono il suo». Se l’abbiamo interpretato correttamente," lo stesso Poincaré — il primo a pubblicare la proposta che i paradossi scaturissero da circoli viziosi — riteneva che solo alcune delle definizioni in cui un oggetto è definito attraverso una totalità di cui 155 Russell [1918-19], $ VII, p. 267. 18° Russell [1924a], p. 334. Per un rilievo simile, si veda anche Russell [1940], cap. 2, p. 38.
1° V. sopra, cap. 5, $ 2. AVE Sopra, cap. 5, $ 2.
!°2 Ramsey [19262], $ III, p. 41. !°? Quine [1969a], $ 34, p. 243; v. anche Quine [1987], “Impredicativity”, p. 94. DOT sopra, cap. 8, $ 4.2.3.
Alternative, critiche e proposte di emendamento al sistema dei Principia
815
esso stesso fa parte siano effettivamente circoli viziosi — definizioni impredicative. Per Poincaré, si ha una definizione impredicativa solo quando la totalità in questione non può essere considerata come “già data”, come già esistente: cosa che avviene sempre, secondo Poincaré, nel caso di totalità infinite, poiché egli respinge l’esistenza dell’infinito attuale.
Nell’articolo del 1944 “Russell’s mathematical logic”,"° Gòdel distingue tre forme che il principio del circolo vizioso assume in Russell: (1) Nessuna totalità può contenere membri definibili solo in termini di tale totalità. (2) Nessuna totalità può contenere membri che involgono la totalità stessa. (3) Nessuna totalità può contenere membri che la presuppongono. In effetti, Russell caratterizza il principio del circolo vizioso in tutti e tre i modi: [1] “Se, ammesso che una certa collezione abbia un totale, essa avesse membri definibili soltanto in termini di quel totale, allora la detta collezione non ha un totale”. [Russell [1908], $ I, p. 63, e [PM], vol. I, introduzione, cap. 2, $ I, p. 37.] Nessuna totalità può contenere membri definiti in termini di se stessa. [Russell [1908], $ IV, p. 75.] [2] “Tutto ciò che involge [involves] tutti di una collezione non dev'essere un membro della collezione”. [Russell [1908], $ I, p. 63, e [PM], vol. I, introduzione, cap. 2, $ I, p. 37.]
[3] [D]ato un qualsiasi insieme di oggetti tali che, se supponiamo che l’insieme abbia un totale, conterrà membri che presuppongono questo totale, allora tale insieme non può avere un totale. [[PM], vol. I, introduzione, cap. 2, $ I, p. 37.]
Si osservi però che in “Mathematical logic...” ($ I, p. 63) Russell asserisce esplicitamente di intendere «Se, ammesso che una certa collezione abbia un totale, essa avesse membri definibili soltanto in termini di quel totale, allora la detta collezione non ha un totale» come /’inversa di «Tutto ciò che involge tutti di una collezione non dev'essere un membro della collezione». Inoltre, tutti e tre i modi di caratterizzare il principio del circolo vizioso compaiono nella medesima pagina dei Principia, dove sono trattati come equivalenti. Non c’è quindi dubbio che Russell li intendesse come tre maniere di descrivere il medesimo principio. Gòdel vi legge invece «tre principi diversi, di cui il secondo e il terzo sono molto più plausibili del primo».'”° Nel seguito dell’articolo, Gédel si concentra in ogni caso sulla prima forma del principio — quella che concerne la definibilità —, che è, egli dice, particolarmente interessante, [...] perché solo questa rende impossibili le definizioni impredicative [...] e pertanto distrugge la derivazione della matematica dalla logica, effettuata da Dedekind e da Frege, e una buona parte della stessa matematica moderna. Si può dimostrare che il formalismo della matematica classica non soddisfa il principio del circolo vizioso nella sua prima forma, poiché gli assiomi implicano l’esistenza di numeri reali definibili in tale formalismo solo con un riferimento a tutti i numeri reali.”
Secondo Gédel, il principio del circolo vizioso, nella sua prima forma, si applica solo in una prospettiva concettualista o nominalista, non in una realista: [...] sembra che il principio del circolo vizioso nella sua prima forma si applichi solo se le entità implicate sono costruite da noi. In questo caso deve chiaramente esistere una definizione (cioè la descrizione della costruzione) che non si riferisca a una totalità cui
l’oggetto definito appartiene, perché la costruzione di una cosa non può certamente basarsi su una totalità di cose cui appartenga la stessa cosa da costruirsi. Se, invece, si tratta di oggetti che esistono indipendentemente dalle nostre costruzioni, in fondo non c’è
nulla di assurdo nell’esistenza di totalità contenenti membri che possono essere descritti (cioè, univocamente caratterizzati)'’* solo con riferimento a tale totalità.!°
95 V. Gédel [1944], pp. 454-455. 196 Gòdel [1944], p. 455.
1°” Ibid.
!98 Si dice che un oggetto a è descritto da una funzione proposizionale @(x) se @(x) è vero per x= a e per nessun altro oggetto. [Nota di G6Odel.]
'99 Gédel [1944], p. 456. Per una riflessione analoga, si veda anche lo scritto di Gédel del 1933 (non pubblicato all’epoca) “The present situation in the foundations of mathematics”. Qui G6del dice che una definizione impredicativa «presuppone che la totalità di tutte le proprietà esista in qualche modo indipendentemente dalla nostra conoscenza e dalle nostre definizioni, e che le nostre definizioni servano puramente a isolare alcune di queste proprietà già esistenti. Se presupponiamo questo, il metodo delle definizioni impredicative è assolutamente legittimo (come è stato rilevato da Ramsey), perché certamente non c’è nulla di obiettabile nel caratterizzare un elemento particolare di una totalità data in precedenza mediante un riferimento all’intera totalità; è quello che facciamo, per es., quando parliamo dell’edificio
816
capitolo 12
In una nota a piè di pagina inserita al termine del passo appena riportato, Gòdel rinvia a Ramsey [1926a]; ma è da notare che, molto prima di Ramsey, il punto su cui insiste Gédel era stato rilevato da Zermelo, il quale già nel 1907 scriveva, replicando alla critica di Henri Poincaré a una definizione impredicativa utilizzata nella sua prima dimostrazione del teorema del buon ordinamento: Un oggetto non è dapprima creato [geschaffen] attraverso una tale “determinazione” [Bestimmung], piuttosto, ogni oggetto può essere determinato in modi molto diversi [...]. Una definizione può benissimo basarsi su concetti che sono equivalenti a quello da definire [.. ql
Lo stesso punto è stato in seguito sottolineato da altri logici. Per esempio, Quine scrive: Se si considerano le classi come preesistenti, ovviamente non c’è obiezione a individuarne una per mezzo di una caratteristica che presuppone la sua esistenza; per il concettualista, d’altra parte, le classi esistono solo finché ammettono una generazione ordinata.
201
La tesi secondo cui il principio del circolo vizioso è giustificato da un punto di vista concettualista, ma non da un punto di vista realista è oggi standard. Il concettualista non nega l’esistenza di universali, ma ritiene che questi siano, in qualche modo, costruiti dalla mente umana; in particolare, egli pensa che le entità matematiche siano simili a palazzi, strade e dighe in questo senso: esistono solo nel momento in cui sono effettivamente costruite. Il principio del circolo vizioso, per un concettualista, dice semplicemente che non possiamo costruire qualcosa usando del materiale che presuppone di aver già costruito quella cosa. Per un realista, gli universali esistono, invece, indipendentemente dal pensiero; in particolare, egli ritiene che le entità matematiche somiglino ai pianeti e alle stelle in questo: esisterebbero anche se non fosse mai esistito nessun uomo. Da questo punto di vista, il principio del circolo vizioso non vale più: l’esistenza delle entità matematiche non può dipendere dal nostro modo di caratterizzarle. Russell di certo non era un concettualista: egli ammetteva l’esistenza di universali indipendenti dalla mente umana. Per rimanere a ridosso dell’epoca della prima edizione dei Principia, possiamo citare due brani, già riportati nel precedente capitolo, rispettivamente, da “The philosophical importance of mathematical logic” (1911) e da “Le réalisme analytique” (1911): La logica e la matematica ci obbligano [...] ad ammettere un genere di realismo nel senso scolastico, vale a dire, ad ammettere che
c’è un mondo di universali e di verità che non si appoggiano direttamente su tali e tali esistenze particolari. Questo mondo di universali deve sussistere [subsist], sebbene esso non possa esistere [exist] nello stesso senso in cui esistono i dati particolari.?°°
Gli universali [...] non esistono nello stesso senso dei particolari; è meglio dire che essi sussistono [subsistent]. La loro sussistenza
non dipende in nessun modo dalle menti che li conoscono; le scienze astratte hanno, dunque, come loro oggetto qualcosa di completamente indipendente da qualsiasi elemento mentale.”
Ma come poteva Russell coniugare l'apparente concettualismo questo franco realismo nei confronti degli universali? La soluzione è che le funzioni proposizionali dei Principia non dei tipi dei Principia non riflette una costruzione di entità, ma una funzioni proposizionali e proposizioni dei Principia si interpreta
implicito nel principio del circolo vizioso con sono universali: sono solo simboli. La gerarchia costruzione di simboli. Se la quantificazione su come sostituzionale, il principio del circolo vi-
zioso è valido. R. Mark Sainsbury ([1979]) ha visto bene il punto. Egli delinea così l'introduzione di variabili so-
stituzionali per predicati: Cominciando con un linguaggio del primo ordine, Ly, e qualche classe P di predicati-Ly, si estende Ly in L aggiungendo un quantificatore predicativo [su predicati] e variabili appropriate e caratterizzando la verità delle quantificazioni-L secondo le linee: “E @) ...
più alto di una città» (GGdel [1933], p. 50). 200 Zermelo [1907], $ 2, 5, pp. 117-118 (in Zermelo critica si trova in Poincaré [1906b], $ XIV, p. 315, 515, punto 7 (in Zermelo [2010], p. 116; trad. ing. a 201 Quine [1953b], $ 6, pp. 125-126. V. anche Quine 202 Russell [191 @]bjo EB}
203 Russell [1911b], p.410.
i [2010], pp. 138 e 140, trad. ingl. a fronte, e in van Heijenoort (ed.) [1967], PRLOIFAEA! ed è diretta contro la definizione impredicativa dell’insieme L,in Zermelo [1904], p. fronte e in van Heijenoort (ed.) [1967], p. 140); in proposito, v. sopra, cap. 4, $ 4.2.3.1. [1969a], $ 34, p. 243.
Alternative, critiche e proposte di emendamento al sistema dei Principia
817
@ ... è vero in Lseesolo se per qualche membro, “w?”, di P, “... w ...” è vero in L. Il lato destro deve parlare di verità in L, piuttosto che in Lo, poiché se sono iterati quantificatori-L “... y ...” non sarà un enunciato- Ly.
Poi osserva: [I]n un’interpretazione [della quantificazione sostituzionale su predicati] nello stile di Kripke, la caratterizzazione della verità in L
dipende in modo cruciale da un’antecedente caratterizzazione di verità in Ly: l’idea è che la caratterizzazione di verità in Ly, insieme con la caratterizzazione della verità per la quantificazione-L [sostituzionale], debba determinare univocamente la classe delle verità in L. Come sottolinea Kripke (“Substitutional Quantification” [v. Kripke [1976], pp.] 331-2 (per i quantificatori su nomi) e [p.] 368 (per i quantificatori su enunciati)), la conseguenza è che nessun membro di P può contenere il quantificatore-L. Altrimenti, la verità Lo poppe
essere caratterizzata antecedentemente alla caratterizzazione della verità L, e ci sarebbe un genere di circolarità vi-
ziosa.
Sainsbury procede spiegando: Per rafforzare questo punto, si supponga che [la classe di sostituzione] P contenga il predicato “(A@)(@$)”. Potremmo allora essere condotti a sostenere che la verità o falsità dell’enunciato “@@)(@a)” dipenda dalla verità o falsità del seguente esempio di “@a” (rimpiazzando “@” con il predicato “(A@)(@é)?): “Ap)(@a). Ciò significa che c’è un enunciato la cui verità o falsità non è stata determinata da ciò che si è detto circa Ly e L; e ciò vuol dire che non è stata data una caratterizzazione adeguata. [...]
Se si desidera evitare la circolarità viziosa del genere appena menzionato, e si desidera anche estendere per quanto possibile le istanze rilevanti alla quantificazione predicativa sostituzionale, si arriva plausibilmente a una gerarchia di quantificatori predicativi, che mostra una straordinaria rassomiglianza con la teoria ramificata dei tipi di Russell (cfr. “Substitutional Quantification” [v.
Kripke [1976], pp.] 368).2°9 Il principio del circolo vizioso è dunque valido, in un’interpretazione nominalista delle funzioni proposizionali e delle proposizioni dei Principia.
2.3. CRITICHE ALL’ASSIOMA DI RIDUCIBILITÀ Il principio del circolo vizioso implica l’invalidità delle definizioni impredicative; tuttavia, queste definizioni si rivelano indispensabili nella matematica classica. Per esempio (v. sopra, cap. 3, $ 9.4, e cap. 11, $ 2.3.1), il limite superiore di un segmento di numeri reali è un numero reale, definito attraverso un riferimento alla totalità di tutti i numeri reali di cui esso stesso è parte. Dunque, se non si ammettono le definizioni impredicative, il teorema della matematica classica secondo cui ogni classe superiormente limitata di numeri reali ha un minimo confine superiore si perde. Una definizione impredicativa era stata usata da Frege e, al tempo dei Principles, dallo stesso Russell per definire la classe dei numeri naturali: questa classe era definita con un riferimento a tutte le classi contenenti tutti i numeri naturali, e quindi con un riferimento a se stessa. L'assunzione dell’assioma di riducibilità — in realtà, come abbiamo visto, degli schemi d’assiomi di riducibili-
tà (per funzioni monadiche e diadiche) — pone in grado di utilizzare questo tipo di definizioni senza rinunciare al principio del circolo vizioso. Supponiamo, per esempio, di voler definire la proprietà di essere un numero naturale come segue:
(1) NZ sa (MO AD(Fy>
FO+1)D>FZ)
dove “N Z” esprime la proprietà di essere un numero naturale. Possiamo leggere questa definizione così: “Essere un numero naturale è avere tutte le proprietà che tutti i numeri naturali hanno”. Questa è una definizione impredicativa e non è dunque ammissibile, secondo i criteri imposti da Russell. Tuttavia è ammissibile quest’altra definizione:
(2) Né =w (M(F!0AM(F!y> F!+1)) > F! 2):
204 Sainsbury [1979], cap. 8, $ 3, p. 284. 205 Ibid. 206 Tbid:
818
capitolo 12
“Essere un numero naturale è avere tutte le proprietà predicative che hanno tutti i numeri naturali”. La (2) è ammissibile proprio perché in essa non si fa più riferimento a tutte le proprietà, ma solo a tutte le proprietà predicative; poiché N £ non è una funzione di ordine immediatamente superiore all’ordine dei suoi argomenti, essa non è una funzione predicativa e dunque non fa parte della totalità di proprietà attraverso le quali è definita. La (2), però, non dice la stessa cosa della (1), salvo che non si assuma che, per ogni funzione proposizionale, ne esista una formalmente equivalente che sia predicativa: e questo è proprio quanto postula l’assioma di riducibilità. In sostanza, con l’assunzione dell’assioma di riducibilità, la proprietà di essere un numero naturale non è più definita attraverso un (impossibile) riferimento a se stessa, ma attraverso un riferimento a una controparte di se stessa nella schiera delle proprietà predicative — la cui esistenza è garanuta dall’assioma di riducibilità. Se scriviamo la (2) in termini di classi, in base alla definizione contestuale di “classe” dei Principia, otteniamo la definizione dei numeri cardinali come la classe di tutto ciò che appartiene a tutte le classi cui appartengono 0 e i successori di ogni loro elemento:
(3) NCinduct=y $((M@(0e aAMbye
apDytle dpxre 0),
In un’interpretazione intuitiva, questa definizione sarebbe impredicativa, poiché la classe, NC induct, dei numeri naturali vi è definita con un riferimento a una totalità di classi di cui essa stessa è un elemento. Non lo è però
nell’interpretazione di Russell. In quest’interpretazione, infatti, non si assumono classi, ma le asserzioni sulle classi devono essere tradotte in corrispondenti asserzioni su funzioni proposizionali predicative. Una volta che (3) sia parafrasata in questo modo, cessa di essere impredicativa, ma, grazie all’assioma di riducibilità, asserisce la stessa cosa della (3) nella sua interpretazione ingenua. L’assioma di riducibilità è stato molto criticato. Una ragione di perplessità è che esso non sembra filosoficamente coerente con quel principio del circolo vizioso che è a fondamento della teoria ramificata dei tipi. Quine, per esempio, osserva: «l’aggiunta di quest’assioma, ingiustificabile da un punto di vista concettualista, ha l’effetto di ripristinare l’intera logica platonica delle classi. Un concettualista serio rigetterà l'assioma di riducibilità come falso». Che l’assioma di riducibilità sia invece giustificato da un punto di vista realista (riguardo all’esistenza di classi) è posto in luce dallo stesso Russell, il quale nei Principia offre un’ argomentazione per mostrare che, assumendo l’esistenza di classi, l’assioma di riducibilità può essere dimostrato: Si deve osservare, in primo luogo, che se assumiamo l’esistenza di classi, l’assioma di riducibilità si può dimostrare. Poiché in tal caso, data una qualsiasi funzione @ 2 di qualsiasi ordine, c'è una classe @ consistente proprio di quegli oggetti che soddisfano @ 2 . x Quindi “x” è equivalente a “x appartiene ad @°. Ma “x appartiene ad Q è un’asserzione che non contiene variabili apparenti, ed è quindi una funzione predicativa di x. Quindi se assumiamo l’esistenza di classi, l’assioma di riducibilità diviene superfluo. L’assunzione dell’assioma di riducibilità è pertanto un’assunzione più ristretta dell’assunzione che ci sono classi.”
Come già aveva fatto nel 1908,°!° Russell cerca di accrescere la plausibilità dell’assioma di riducibilità accostandolo all’assunzione dell’esistenza di classi — assunzione quest’ultima che, scrive Russell: «è stata finora fatta senza esitazione».°!! Il suggerimento implicito di Russell è questo: l’assunzione dell’esistenza delle classi era stata considerata ovvia — almeno prima della scoperta dei paradossi —; ma l’assioma di riducibilità è più debole dell’assioma secondo cui vi sono classi (poiché il primo è deducibile dal secondo, ma non viceversa) e quindi dovrebbe risultare ancora più plausibile. Quando Russell dice che l’assioma di riducibilità è un’assunzione più ristretta di quella che «ci sono classi», bisogna interpretarlo, naturalmente, come se intendesse “Ci sono tutte le
classi di oggetti di uno stesso tipo logico”, o “Tutte le funzioni proposizionali definiscono classi”; è infatti ovvio che se, per esempio, esistessero solo le classi definibili in modo predicativo, l’esistenza di classi non legittimerebbe affatto l’assioma di riducibilità. L'argomento di Russell ci dice qualcosa di importante sullo statuto ontologico delle funzioni proposizionali dei Principia. Esso consiste nel nominare una classe & di oggetti che soddisfano una funzione proposizionale qualsiasi e nel considerare la funzione predicativa “x e @?. È ovvio che, se le “funzioni proposizionali” dei Principia 207 V. [PM], vol. II, #120.01. 208 Quine [1953b], $ 6, p. 127. 209 [PM], vol. I, introduzione, cap. 2, $ VI, p. 58.
210 V_ Russell [1908], $ V, p. 81. 21! [PM], vol. I, introduzione, cap. 2, $ VI, p. 58.
Alternative, critiche e proposte di emendamento al sistema dei Principia
819
fossero anche entità non linguistiche — attributi monadici o poliadici —, la stessa argomentazione proverebbe che l’assioma di riducibilità è superfluo, senza bisogno di ricorrere alle classi. Per esempio, data una funzione proposizionale (in senso ontologico) monadica d’individui, di ordine arbitrariamente elevato, basterebbe nomina-
re questa funzione, chiamandola, per esempio, ‘“f%”, e avremmo un'espressione priva di variabili vincolate quanto “X e Q°. Dunque, in una prospettiva realista riguardo alle funzioni proposizionali (in senso ontologico), l’intera gerarchia degli ordini delle funzioni proposizionali (in senso ontologico) collasserebbe: tutte le espressioni di funzione proposizionale vere degli stessi argomenti, di qualunque ordine, si ridurrebbero a modi diversi di riferirsi alla stessa entità. L'assioma di riducibilità sarebbe del tutto inutile. Ciò è una riprova che le funzioni proposizionali impredicative, nei Principia, non possono essere concepite come entità extralinguistiche, e che il procedimento di porre un accento circonflesso su una variabile di un enunciato aperto — in modo da ottenere, per es., “@ x” da “@x° — non è un modo di formare simboli appartenenti al linguaggio oggetto dei Principia che denotano attributi. Naturalmente, secondo la nostra interpretazione, neppure le funzioni proposizionali predicative sono concepite come entità extralinguistiche, nei Principia. L’assioma di riducibilità annulla la distinzione tra ordini di funzioni proposizionali nei soli contesti estensionali, postulando che debbano sempre esistere caratterizzazioni predicative delle entità e degli insiemi di entità che si possono caratterizzare impredicativamente. Da un punto di vista metafisico, l’assioma di riducibilità richiede che vi siano sempre universali (attributi o classi e relazioni in estensione) che, se nominati, consentono di costruire de-
finizioni predicative di tutte le entità e gli insiemi di entità definibili in modo impredicativo. Russell ha ragione nell’asserire che l’assioma è più ristretto dell'assunzione dell’esistenza di (tutte le) classi; ma lo è in modo filoso-
ficamente vacuo: solo perché, postulando l’esistenza di tutti quegli universali che servono per costruire la matematica classica, si astiene dallo specificare se questi universali siano attributi, oppure classi e relazioni in estensione. Si tratta precisamente di quel tipo di assioma che, nell’/ntroduction to Mathematical Philosophy, Russell accosta al furto: «Il metodo di “postulare” ciò che vogliamo ha molti vantaggi; sono gli stessi vantaggi che ha il furto sul lavoro onesto».?!° Non sorprende che egli non ne sia mai stato soddisfatto. Nella prima edizione dei Principia si osserva: «Che l’assioma di riducibilità sia autoevidente è una proposizione difficilmente sostenibile».?!* Nella stessa edizione, l’assioma è difeso sulla base di un’ «evidenza induttiva»:?!*
i ragionamenti basati su di esso appaiono tutti validi; in altri termini, esso porta ai risultati voluti, e non ad altri. Resta però che sembra tanto difficile presentare l’assioma di riducibilità come un assioma logico, quanto lo sarebbe presentare come tali, per esempio, gli assiomi di Zermelo. Già Wittgenstein, nel 7ractatus Logico-Philosophicus, rileva il carattere extralogico dell’assioma: La validità universale [A//gemeingtiltigkeit] logica potrebbe chiamarsi essenziale [wesentlich], in contrasto con quella accidentale, come quella della proposizione: “Tutti gli uomini sono mortali”. Proposizioni come l’“Axiom of Reducibility” di Russell non sono proposizioni logiche e questo spiega la nostra sensazione: Che esse, se vere, potrebbero esserlo solo per un caso fortunato [einen giinstigen Zufall).?!°
Wittgenstein prosegue: Si può pensare un mondo nel quale 1’Axiom of Reducibility non valga. Ma è chiaro che la logica non ha nulla a che fare con la questione se il nostro mondo sia realmente così o no.?!°
Pochi anni dopo, in “The foundations of mathematics”, Ramsey fa eco quasi testualmente” Wittgenstein:
217
alle parole di
Nella Prima Edizione dei Principia Mathematica si proponeva [...] un assioma speciale, 1’ Assioma di Riducibilità [...]. Non vi è ragione di reputare vero quest’assioma; e se esso fosse vero si tratterebbe di un caso fortunato e non di una necessità logica, poiché
212 Russell [1919a], cap. 7, p. 71. 213 [PM], vol. I, introduzione, CAPA
214 Ibid.
ASAVILI Apa59)
È Wittgenstein [1921], prop. 6.1232.
216 Wittgenstein [1921], prop. 6.1233. 217 Nel testo del Tractatus e nel brano originale di Ramsey l'eventualità che l’assioma di riducibilità possa essere vero è considerata quasi con le stesse parole, come “einen giinstigen Zufall” nel Tractatus (‘a happy chance” nella trad. ingl. di C. K. Ogden e Frank P. Ramsey, e “a fortunate accident” nella trad. ingl. di D. F. Pears e B. F. McGuinness) e come “a happy accident” nel testo di Ramsey.
820
capitolo 12 non è una tautologia. [...] Un tale assioma non trova posto in matematica, e qualsiasi cosa che non possa essere dimostrata senza
usarlo non può affatto considerarsi dimostrata.?!*
Nello stesso articolo, Ramsey offre una dimostrazione che l’assioma di riducibilità non è una contraddizione,
ma può essere vero, e non è neppure una tautologia, ma può essere falso. La dimostrazione che l’assioma può essere vero è molto semplice, ed è sostanzialmente la stessa considerazione che fa Russell sull’equivalenza tra l’assioma di riducibilità e l’asserzione dell’esistenza di tutte le classi di oggetti di un certo tipo logico: «è chiara-
mente possibile che ci sia una funzione atomica che definisce ogni classe di individui. Nel qual caso ogni funzio.
°
.
°
ne sarebbe equivalente non semplicemente a una funzione elementare, ma a una atomica».
219
L
a seconda
d
par
te
della dimostrazione — che l’assioma potrebbe essere falso — è argomentata così: [...] è chiaramente possibile che vi siano un’infinità di funzioni atomiche, e un individuo a tale che qualunque funzione atomica prendiamo ci sia un’altro individuo che concorda con a rispetto a tutte le altre funzioni, ma non rispetto alla funzione presa. Allora ; 1.220 (0). 9! x= @!a non potrebbe essere equivalente a nessuna funzione elementare di x.
Ramsey osserva che, in un mondo in cui vi fossero infinite qualità, e un individuo a tale che, qualunque qualità Q si prenda, vi sia sempre almeno un altro individuo che concorda con a rispetto a tutte le altre qualità, ma non ri-
spetto a Q, la proprietà di essere uguale ad a non sarebbe equivalente a nessuna proprietà predicativa. Infatti, qualunque numero di qualità consideriamo che non includa tutte le qualità (cioè infinite), vi sarà sempre, per le ipotesi, un individuo w che concorda con a rispetto a tutte le qualità considerate, ma non rispetto a un’ulteriore qualità W, cosicché a e w saranno distinti, ma non distinti da un qualsiasi numero finito di qualità che, designate da sim-
boli della forma ‘“f%”, possano dare luogo a una funzione proposizionale priva di variabili vincolate della forma SPIA fa che sia equivalente a(0)(0!/x= ld". Si osservi, però, che l’obiezione che l’assioma di riducibilità non è una verità logica è valida solo dal punto di
vista logicista. Da un punto di vista genericamente assiomatico, non si possono muovere all’assioma di riducibilità più obiezioni di quante se ne possano muovere, per esempio, agli assiomi di ZF: anche in questi casi, infatti, è facile immaginare un mondo in cui tali assiomi non valgano: si pensi, banalmente, a un mondo dove non vi sono insiemi. Non è dunque un atteggiamento coerente respingere l’assioma di riducibilità sulla scorta dell’argomento di Wittgenstein-Ramsey secondo cui esso, se vero, enuncerebbe una verità extralogica, accogliendo senza riserve
una teoria assiomatica degli insiemi come ZF. Al di fuori di un’ottica logicista, l’assioma di riducibilità può legittimamente essere respinto solo se si hanno ragioni indipendenti per rifiutare la teoria ramificata dei tipi cui è collegato, oppure, adottando una prospettiva concettualista o nominalista, perché è un assioma platonista. Fraenkel e Bar-Hillel — che pure non sostengono una teoria ramificata dei tipi con assioma di riducibilità — nel loro libro Foundations of Set Theory, sono tra i pochi a mettere debitamente in guardia contro un certo tipo di critica all’assioma di riducibilità: L’obiezione sollevata da Ramsey, Waismann e altri, che quest’assioma sarebbe di carattere empirico piuttosto che logico, quindi se vero lo sarebbe solo fattualmente e, per così dire, per una fortunata coincidenza [...] sembra essere poco giustificata. Di fatto,
assioma, tuttavia, è respinto dagli intuizionisti e dagli altri autori costruttivisti non perché è considerato empiricamente falso o dubbio ma perché la sua accettazione non si accorda con la loro attitudine costruttivista. Per un platonista, l'assioma di riducibilità non
è meno logico dell’assioma di comprensione, e se egli respinge l’uno o l’altro, o entrambi, lo fa perché il sistema logico che li incorpora è contraddittorio o in qualche senso inefficiente.”
Naturalmente, Russell è un logicista, e quindi la critica di Wittgenstein-Ramsey costituisce per lui un’obiezione pertinente. In effetti, già nell’Introduction to Mathematical Philosophy, egli mostra di essere giunto, indipendentemente da Wittgenstein” e da Ramsey, a conclusioni simili alle loro:
2! Ramsey [1926a], $ II, p. 28. 22 Ramsey [1926a], $ V, p. 57. Per il significato di “funzione atomica” e “funzione elementare” in Ramsey, v. sotto, nota 288. 226 Ramsey [1926a], $ V, p. 57. 22! Fraenkel e Bar-Hillel [1958], cap. 3, $ 5, p. 153, nota, e Fraenkel, Bar-Hillel e Lévy [1973], cap. 3, $ 5, p. 174, nota 3.
222 Russell scrisse l’Introduction nella primavera del 1918. A causa della guerra, egli non aveva notizie di Wittgenstein — il quale combatteva nell’esercito austriaco — dall’agosto del 1914. I contatti tra i due filosofi ripresero solo nel 1919, quanto Wittgenstein inviò a Russell una copia dei 7ractatus, che aveva terminato nell’estate dell’anno precedente.
Alternative, critiche e proposte di emendamento al sistema dei Principia
821
La logica pura, e la matematica pura (che è la stessa cosa), aspira ad essere vera, nella fraseologia leibniziana, in tutti i mondi pos-
sibili, non solo in questa confusa paccottiglia di mondo in cui la sorte ci ha imprigionati. [...] Considerato da questo punto di vista strettamente logico, non vedo alcuna ragione di credere che l’assioma di riducibilità sia logicamente necessario, che è ciò che s’intenderebbe dicendo che è vero in tutti i mondi possibili. L'ammissione di quest’assioma in un sistema di logica è pertanto un difetto, anche se l’assioma è empiricamente vero. È per questa ragione che la teoria delle classi non si può considerare completa come la teoria delle descrizioni. C’è bisogno di ulteriore lavoro sulla teoria dei tipi, nella speranza di arrivare a una dottrina delle classi che non richieda una tale assunzione dubbia.?°*
Sempre nell’Introduction, Russell adombra la possibilità di trattare l'assioma di riducibilità come gli assiomi moltiplicativo e dell’infinito: [...] assioma di riducibilità, come i nostri due precedenti assiomi matematici [l'assioma moltiplicativo e quello dell’infinito] potrebbe benissimo essere formulato come ipotesi ogni volta che è usato, invece di essere assunto come realmente vero. Possiamo de» . ° 2 durre le sue conseguenze ipoteticamente; possiamo anche dedurre le conseguenze del supporlo falso.?*
Sei anni dopo, nella seconda edizione dei Principia — preparata senza la collaborazione di Whitehead — Russell esplorerà quanto si possa effettivamente ottenere rinunciando all’assioma di riducibilità.
2.4. LA SECONDA EDIZIONE DEI PRINCIPIA Tra il settembre e l’ottobre del 1921, Leon Chwistek spedì a Russell il manoscritto di una prima versione del suo saggio “The theory of constructive types” — che poi sarebbe stato pubblicato tra il 1924 e il 1925 (v. Chwistek [1924-25]). In questo saggio, Chwistek accetta la teoria ramificata dei tipi dei Principia, rifiutando però l’assioma di riducibilità. Dal 1912, gli interessi di Russell si erano volti dalla logica all’epistemologia, cosicché egli lesse il lavoro di Chwistek solo nel 1923, quando, per preparare la seconda edizione dei Principia, tornò brevemente a occuparsi di quegli argomenti. In una lettera a Chwistek del 21 ottobre 1923, Russell mostra tuttavia poco entusiasmo per la sua proposta; egli scrive: «Non ho dubbi che, se semplicemente si elimina l'assioma di riducibilità, senza altri cambiamenti, non è possibile fare molto di più di quello che ha fatto lei». Russell si professa tuttavia d'accordo con Chwistek riguardo all’assioma di riducibilità: «È chiaro che l'assioma dev'essere eliminato», scrive, aggiungendo però: «Ma adesso propendo per l’idea [...] che tutte le funzioni di proposizioni siano funzioni di verità, e che tutte le funzioni di funzioni siano estensionali».
Nell’introduzione alla seconda edizione dei Principia, Russell riprende queste osservazioni. Dopo aver ammesso che quello di riducibilità «non è il genere d’assioma di cui ci si possa ritenere soddisfatti»,”°° spiega di non essere neppure soddisfatto dell’opzione di Chwistek, definita “eroica”, di rinunciare all’assioma — nel quadro della teoria ramificata dei tipi — senza adottare per esso nessun sostituto, perché, osserva Russell, dal lavoro dello stes-
so Chwistek°°” risulta chiaro che la sua posizione «ci costringe a sacrificare una gran quantità di matematica ordinaria».°* Russell propone allora di rinunciare all’assioma di riducibilità rimpiazzandolo in parte, però, con altri due principi, che attribuisce al Wittgenstein del Tractatus:”?° (1) «le funzioni di proposizioni sono sempre funzioni di verità»;
223 224 225 226
Russell Russell Lettera Russell
[1919a], cap. 17, pp. 192-193. [1919a], cap. 17, pp. 191-192. riportata in Jadacki [1986], p. 255. [1925], p. xiv.
227 Il riferimento indicato da Russell è qui sempre al lavoro di Chwistek “The theory of constructive types”. 228 Russell [1925], p. xiv.
229 V. Ibid. Il riferimento è a Wittgenstein [1921], prop. 5.54 e segg. Nel luogo citato, Wittgenstein scrive: «Nella forma proposizionale generale, la proposizione compare nella proposizione solo come base delle operazioni di verità» (prop. 5.54; v. anche Wittgenstein [1921], prop. 5: «La proposizione è una funzione di verità di proposizioni elementari. (La proposizione elementare è una funzione di verità di se stessa.)», e prop. 5.3: «Tutte le proposizioni sono risultati di operazioni di verità con le proposizioni elementari»). Contro quella che appare come una classe di evidenti eccezioni a tale principio, cioè quella di enunciati di “atteggiamento proposizionale” come “A crede che p”, o “A pensa p”, ecc., Wittgenstein obietta, piuttosto ermeticamente, «Ma è chiaro che “A crede che p”, “A pensa p”, “A dice p” sono della forma “‘p’ dice p”» (prop. 5.542). Fin dalla sua introduzione al Tractatus, Russell interpreta quest’asserzione di Wittgenstein come segue: “A crede che p” si dovrebbe analizzare come un enunciato che dice che l’enunciato (0 il comportamento, il pensiero, ecc.) “p” con cui A mani-
festa la sua credenza è vero se e solo se accade il fatto p (v. Russell [1921b], pp. xix-xx).
822
capitolo 12
: RE: a AR N PROLE : 230 (2) «una funzione [proposizionale] può comparire in una proposizione solo attraverso i suoi valori».
Che una funzione proposizionale possa comparire in una proposizione solo attraverso i suoi valori significa che un simbolo di funzione proposizionale non può comparire in un enunciato nella posizione di un nome, ma solo nella posizione di un predicato, ossia affiancato da una costante o da una variabile.??! Secondo questa tesi, in una funzione proposizionale, “f(@ 2)”, di “@î”, “@? comparirà solo nei contesti enunciativi “@4,”, “@9”, “Paz”, ..., 0 “mu, “ou, 3... (dove “ay”, “@, “d3”, ... sono costanti e “xy”, ‘%7°, ‘%3”, ... sono Variabili vincolate),7?° 99:
cosicché ‘f(@ î)” sarà una funzione di “@a;”, “9a”, “Paz”, ..., 0 dei valori di “gx”, “@x”, “@x3”, ... per ogni as-
segnazione di valori a “xy”, “x”, “37, ...,°5 e, per il principio (1), sarà una funzione di verità di “@4;”, “947”, “ga;”, 0 dei valori di “@x”, “@x”, “Mx”, ..., cioè il suo valore di verità dipenderà solo dai valori di verità di “pa”, “Pa”, “Pax”, ..., e dai valori di verità dei valori di “x”, “gx”, ‘“@x3”. Di conseguenza, funzioni proposizionali aventi la medesima estensione daranno lo stesso valore di verità se prese come argomenti di una stessa funzione di funzioni proposizionali. In altri termini, i due principi precedenti ammontano ad assumere una tesi di estensionalità, secondo cui «tutte le funzioni di funzioni sono estensionali, ossia:
=
y.D.f(PZ)=f(Yî).
234
All’inizio dell’appendice C dei Principia (aggiunta alla seconda edizione), Russell osserva: Gli usi che abbiamo fatto di quest’assunzione [di estensionalità] possono essere convalidati per definizione, anche se l’assunzione non è universalmente vera. Vale a dire, possiamo decidere che la matematica debba limitarsi a funzioni di funzioni che rispettino la precedente assunzione. Questo equivale a dire che la matematica è essenzialmente estensionale piuttosto che intensionale. Potremmo, su questa base, astenerci dall’indagare se la nostra assunzione sia universalmente vera o no. L'indagine, tuttavia, è importante
di per sé, e noi, in quanto segue, suggeriremo certune considerazioni senza arrivare a una conclusione dogmatica. +
Russell dedica il resto dell’appendice C al tentativo di giustificare la validità generale del principio di estensionalità. L'importanza dell’argomento — si può supporre — risiede per Russell innanzitutto nel fatto che, se il principio di estensionalità avesse validità generale, la sua assunzione alla base della matematica sarebbe conciliata con la tesi logicista. 230 Russell [1925], p. xiv. V. anche [PM], vol. I, appendice C, p. 659. 231 Ciò spiega perché Russell scriva: «Non ci sono matrici [cioè enunciati aperti non contenenti variabili vincolate] logiche [cioè contenenti solo variabili] della forma f!(@! 2 ). Le sole matrici in cui @ 2 sia il solo argomento sono quelle contenenti @! a, 9! d, 0! c, ..., dove a, db, c, sono costanti; ma queste non sono matrici logiche [poiché contengono costanti, oltre che variabili] essendo derivate dalla matrice logica @!x. Poiché @ può solo comparire attraverso i suoi valori, deve comparire, in una matrice logica, con uno o più argomenti variabili. Le funzioni logiche più semplici di g soltanto sono (x).@!x e (4x).@! x, ma queste non sono matrici [perché contengono una variabile quantificata]. Una matrice logica filet SS) è sempre derivata da una funzione-tratto [stroke-function: il riferimento è al tratto di Sheffer (v. sopra, cap. 6, nota 108) — l’unico connettivo fondamentale assunto nella seconda edizione dei Principia] Fpi, P2, P3: +++» Pn)
sostituendo @! x, @! x», ..., @! x AP, Pa, -.-, Pa» (Russell [1925], $ IV, p. xxxi). Into “3”, ... possono anche essere variabili libere, ma solo se la funzione di funzione proposizionale è della forma “f(@ 2 , x1, x, IRON) 233 Ciò diviene evidente se si considera che, nell’introduzione alla seconda edizione dei Principia (v. Russell [1925], $ V, pp. xxxiii-xxxiv),
Russell accetta l’idea che — in teoria — si possano interpretare le quantificazioni universali come congiunzioni potenzialmente infinite, e le quantificazioni esistenziali come disgiunzioni potenzialmente infinite, cosicché “(x)(9@x)” sia considerato il prodotto logico “@a A_@b A @c N ...”, mentre “(4x)(g@x)” sia considerato la somma logica “pa v gb v pe V ...?, dove a, b, c, ..., ecc., sono tutti i valori possibili di “Xx” — secondo la concezione di Wittgenstein (v. Wittgenstein [1921], propp. 5.5, 5.502, 5.51, 5.52), che poi sarà fatta propria anche da
Ramsey (v. Ramsey [1926a], $ I, p. 8). Landini sostiene che «nella sua introduzione alla seconda edizione Russell investiga e respinge l’idea di sviluppare congiunzioni e disgiunzioni infinite» (Landini [2011a], cap. 7, p. 364; v. anche Landini [2007a], cap. 6, p. 216) e, in nota, accusa: «A dispetto di ciò, Potter sostiene che la seconda edizione di Russell adottò congiunzioni e disgiunzioni infinite. Vedi Michael Potter, Reasons Nearest Kin (Oxford, Oxford University Press, 2000), p. 204» (Landini [2011a], nota 41 al cap. 7, pp. 441-442; v. anche Landini [2007a], cap. 6, p. 216, nota 44). Il testo della seconda edizione dei Principia chiarisce, credo, che in teoria Russell accetta il rimpiazzamento di enunciati contenenti quantificatori con congiunzioni e disgiunzioni infinite (v. Russell [1925], $ V, p. xxxiiî), sebbene poi
osservi che, non potendosi operare «in pratica» con congiunzioni e disgiunzioni infinite come se fossero finite, tale rimpiazzamento non dispensa dall’introduzione di assiomi specifici che governino l’uso delle variabili vincolate (v. Russell [1925], $ V, p. xxxiv).
234 Russell [1925], $ VI, p. xxxix. 235 [PM], vol. I, appendice C, p. 659.
Alternative, critiche e proposte di emendamento al sistema dei Principia
823
Russell osserva che esempi come “A crede p” e “p verte su [is about] A” sembrano, prima facie, contraddire il principio: Se A crede p e p è vero, non ne segue che A creda ogni altra proposizione vera g; né, se A crede p, e p è falso, ne segue che A creda ogni altra proposizione falsa g. Ancora, la proposizione “A è mortale” verte su A; ma la proposizione “8 è mortale”, che è ugualmente vera, non verte su A. Così la funzione “p verte su A” non è una funzione di verità di prio
Nel seguito, Russell distingue una proposizione come fatto (as a fact)” 237 da una proposizione come veicolo di verità o falsità: La seguente serie di segni neri: “Socrate è mortale”, è un fatto di geografia. Il rumore che farei se dicessi “Socrate è mortale” sarebbe un fatto di acustica. L’evento [occurrence] mentale quando nutro la credenza “Socrate è mortale” sarebbe un fatto di psicologia. Nessuno di questi introduce la nozione di verità o falsità, che è, per la logica, la caratteristica essenziale delle proposizioni.?**
La distinzione tra una proposizione come fatto linguistico e una proposizione come veicolo di verità o falsità — che Russell spiega in modo piuttosto involuto — è semplicemente quella tra enunciati menzionati e enunciati usane Quando diciamo ‘“‘Socrate’ compare nella proposizione ‘Socrate è greco””, stiamo prendendo la proposizione fattualmente [factually]. Presa in questo modo, è una classe di serie [di suoni, o di segni sulla carta, per es.], e “Socrate” è un’altra classe di serie [di
suoni, ecc.]. La nostra asserzione è vera solo quando prendiamo la proposizione e il nome come classi. Il particolare “Socrate” [la particolare istanza del segno “Socrate”] che compare all’inizio del nostro enunciato non compare nella proposizione “Socrate è greco” [dove compare, invece, un’altra istanza del segno “Socrate”]; ciò che è vero è che un altro particolare strettamente rassomi-
gliante ad esso compare nella proposizione. È dunque assolutamente essenziale a tutte le asserzioni simili prendere parole e proposizioni come classi di occorrenze simili, non come singole occorrenze [cioè istanze di segni]. Ma quando asseriamo una proposizione, la singola occorrenza è tutto ciò che è rilevante. Quando asserisco “Socrate è greco”, le particolari occorrenze delle parole hanno significato, e l’asserzione è fatta dalla particolare occorrenza di quest’enunciato. E dire di quest’enunciato “*Socrate’” compare in esso” è semplicemente falso, se intendo il “Socrate” che ho appena scritto [l'istanza del segno], perché era un diverso “Socrate” [una diversa istanza del segno] che vi compariva.??°
La conclusione di Russell è che: Una proposizione come veicolo di verità o falsità è una particolare occorrenza, mentre una proposizione considerata fattualmente è una classe di occorrenze simili. E la proposizione considerata fattualmente che compare nelle asserzioni come “A crede che p” e “p 240 verte su A”.
Riguardo ad “A crede che p”, Russell osserva: Alcuni sostengono che una proposizione debba essere espressa in parole prima che possiamo crederla; se fosse così, non ci sarebbe, dal nostro punto di vista, alcuna differenza vitale tra credere e asserire.‘
L’analisi russelliana di “A asserisce che Socrate è greco” è: Se A è la serie di eventi che costituiscono la persona [che fa l’asserzione], ala classe dei rumori “Socrate” [cioè di tutte le istanze
del segno “Socrate”], f la classe “è”, e yla classe “greco”, allora “A asserisce che Socrate è greco” è (omettendo la rapidità della successione):
(Ax, y, 2).xe a.ye B.ze r.xty ÙU xizUù ziyc A. [x Ly” indica, nei Principia, la relazione in estensione che ha per unico elemento la coppia ordinata (x, y) (v. [PM], vol. I, #55). L'ultima clausola della formula precedente significa dunque che la serie x, y, z fa parte della serie di eventi che costituiscono Aq
Se la credenza fosse una relazione con proposizioni in senso linguistico, è chiaro che l’analisi sarebbe simile a quella per l’asserzione. Ma Russell sembra volersi mantenere agnostico, al riguardo, e propone un‘analisi di “A 236 [PM], vol. I, appendice C, pp. 659-660. 27 Un’evidente eco del Wittgenstein del Tractatus, per il quale le proposizioni sono fatti. 6 [PM], vol. I, appendice C, p. 660.
2° [PM], vol. I, appendice C, pp. 664-665. 240 [PM], vol. I, appendice C, p. 665. 24 [PM], vol. I, appendice C, p. 662. da [PM], vol. I, appendice C, p. 661.
824
capitolo 12
crede che p” secondo la quale “p” rappresenterebbe una proposizione come fatto mentale, piuttosto che linguistiCO: Ma se adottiamo una prospettiva meno eterodossa, diremo che quando un uomo crede “Socrate è greco” ha simultaneamente due pensieri, uno dei quali “significa” [means] Socrate mentre l’altro “significa” greco, e questi due pensieri sono relati nel modo che chiamiamo “predicazione”. Non è necessario per i nostri fini definire “significato”, oltre il notare che due diversi pensieri possono “avere lo stesso significato”. La relazione “avente lo stesso significato” è simmetrica e transitiva; inoltre, se due pensieri “hanno lo
stesso significato”, l’uno può rimpiazzare l’altro in ogni credenza senza alterarne il valore di verità. Così abbiamo una classe di pensieri, chiamata “Socrate”, che tutti “hanno lo stesso significato”; si chiami questa classe @. Abbiamo un’altra classe di pensieri, chiamata “greco”, che tutti “hanno lo stesso significato”; si chiami questa classe 4. Si chiami P la relazione di predicazione tra due pensieri. (Questaè la relazione che vale tra il nostro pensiero del soggetto e il nostro pensiero del predicato. È del tutto ano dalla relazione che vale tra il soggetto e il predicato quando la nostra credenzaè vera.) Allora “A crede che Socrate sia greco” è (x, y).xe a.ye B.xPy.x, ye CA. [L'ultima clausola della formula asserisce che x e y fanno parte della serie di eventi che (per Russell) costituisce l'individuo A.]
Qui, ancora, la proposizione come compare nelle funzioni di verità è scomparsa.”
Come si vede, l’analisi non è molto diversa da quella dell’asserzione — in pratica, la differenza è che alla relazione seriale tra parole si sostituisce la relazione P di predicazione tra pensieri. Riguardo a “p verte su A”, Russell prende l’esempio di “‘Socrate è greco” verte su Socrate” e scrive: Dobbiamo qui distinguere (1) il fatto, (2) la credenza, (3) la proposizione verbale. Il fatto e la credenza, comunque, non sollevano problemi separati, perché è del tutto chiaro che Socrate è un costituente del fatto nello stesso senso in cui il pensiero di Socrate è un costituente della credenza.[?4] E la proposizione verbale non solleva difficoltà, poiché un’istanza della proposizione verbale è una
serie contenente una parte che è un’istanza di “Socrate”. Vale a dire, “Socrate” (la parola) è una classe di serie di rumori, diciamo 4; e “Socrate è greco”è un’altra classe di serie, diciamo x; e il fatto che “Socrate” compaia in “Socrate è greco” è: Pe u.>.(30).Qe€ E
1.0
P.[PeQ
sono, rispettivamente, istanze della proposizione (verbale) “Socrate è greco” e della parola
“Socrate” .]?4
243 [PM], vol. I, appendice C, p. 662. SETA proposito dell’essere “costituente di un fatto” alla pagina successiva Russell osserva: «Ci sono coloro che negano la legittimità dell’analisi. Senza ammettere che abbiano ragione, possiamo schematizzare una teoria che essi non siano costretti a rifiutare» ([PM], vol. I,
appendice C, p. 663). La teoria proposta da Russell a uso dei monisti è un altro esempio di applicazione del principio russelliano di astrazione (v. sopra, cap. 2, $$ 3.2 e 3.3): «Assumiamo chei fatti [facts] siano suscettibili di vari generi [Kinds] di rassomiglianze [resemblances] e differenze [differences]. Due fatti
possono avere rassomiglianza-particolare [particular-resemblance]; allora diremo che vertono sullo [are about] stesso particolare. Ancora essi possono avere rassomiglianza-predicato [predicate-resemblance], o rassomiglianza-relazione-diadica [dyadic-relation-resemblance], 0
ecc. Diremo che un fatto verte su un solo particolare se due fatti qualsiasi che hanno rassomiglianza particolare con il fatto dato hanno rassomiglianza-particolare l’uno con l’altro. Dato un tale fatto, possiamo definire il suo unico particolare come la classe di tutti i fatti che hanno rassomiglianza-particolare con il fatto dato. In questo caso, dire che Socrate è un costituente del fatto che Socrate è greco (assumendo convenzionalmente che Socrate sia un particolare) è dire che il fatto è un membro della classe di fatti che è Socrate. Nel caso di una credenza su Socrate, che è essa stessa un fatto composto di pensieri, diremo che una credenza verte su Socrate se è una della classe di fatti costituenti una certa idea che “significa” [means] Socrate, in qualunque senso possiamo dare a “significato”. Qui un’idea è presa come una classe di fatti fisici, vale a dire tutte le credenze che “si riferiscono a” [refer to] Socrate» (ibid.).
Russell procede definendo i predicati con una procedura simile: dato «un fatto che sia solo suscettibile di due generi di rassomiglianza, ossia rassomiglianza-particolare e rassomiglianza-predicato», che sarà «un fatto soggetto-predicato», il «predicato implicato in esso è la classe dei fatti con cui esso ha rassomiglianza-predicato» (ibid.). Per le relazioni, Russell osserva:
«Assumeremo anche vari generi di differenza: differenza-particolare [particular-difference], differenza-predicato [predicate-difference], ecc. Questi non sono necessariamente incompatibili con il corrispondente genere di somiglianza; per es. (R (x, x) e R (x, y) hanno entrambe
rassomiglianza-particolare rispetto a x e differenza-particolare rispetto a y. Questo ci permette di definire ciò che si intende dicendo che un particolare compare due volte in un fatto, come x compare due volte in R (x, x). Primo: R (x, x) è un fatto-relazione-diadica [dyadic-relationfact] perché è suscettibile di rassomiglianza-relazione-diadica con altri fatti; secondo: due fatti qualsiasi aventi rassomiglianza-particolare con R(x, x) hanno rassomiglianza-particolare l’uno con l’altro. Questo è ciò che intendiamo dicendo che R (x, x) è un fatto-relazione-
diadica in cui x compare due volte, non un fatto soggetto-predicato. Si prenda poi un fatto-relazione-triadica [triadic-relation-fact] R (x, x, z). Questo è, per definizione un fatto-relazione-triadica perchéè suscettibile di rassomiglianza-relazione-triadica. I fatti aventi rassomiglianza particolare con R (x, x, 2) si possono dividere in due gruppi (non tre) tali che due membri qualsiasi di un gruppo hanno rassomiglianza particolare l’uno con l’altro. Ciò mostra che c’è una ripetizione, ma non se sia x 0 z ad essere ripetuto. I fatti di un:gruppo sono R (x, x, c) per la variazione di c; i fatti dell’altro sono R (a, b, 2) per la variazione di a e b. Ciascun fatto del gruppo R (x, x, c) appartiene a solo
due gruppi costituiti per mezzo della rassomiglianza-particolare, mentre i fatti del gruppo R (a, b, 2), eccetto quando accade che a = b, appartengono a tre gruppi costituiti per mezzo della rassomiglianza-particolare. Questo definisce ciò che s’intende dicendo che x compare due volte e z una volta sola nel fatto R (x, x, 2). È ovvio che possiamo trattare le relazioni tetradiche ecc. nello stesso modo» ([PM], vol. I, ap-
pendice C, pp. 663-664). 245 [PM], vol. I, appendice C, p. 662.
Alternative, critiche e proposte di emendamento al sistema dei Principia
825
La conclusione dell’appendice C non è che la tesi dell’estensionalità debba essere senz'altro accettata in generale, ma che gli apparenti paradossi generati da enunciati della forma “A crede p” e “p verte su A”, «riposano sulla confusione tra proposizioni fattuali e assertive»,”‘° cioè sulla confusione tra proposizioni come fatti e proposizioni come veicolo di verità o falsità.” Le conseguenze della tesi dell’estensionalità e dell’abbandono dell’assioma di riducibilità sulla teoria delle classi dei Principia sono — osserva Russell — da un lato una semplificazione, dall’altro una complicazione.” La semplificazione è che, se tutte le funzioni proposizionali formalmente equivalenti del medesimo ordine si identificano, «non c’è più nessuna ragione di distinguere tra funzioni e classi».”'° Infatti, se tutte le funzioni di funzioni
sono estensionali, laddove @ 7 e w2 siano funzioni proposizionali dello stesso ordine si ha:
M(g=waif(pZ7)=f(v2). Ciò implica (prendendo ‘
‘
M(@= wa pî = v2.
= @2” come “f(—)”, e assumendo @ ? = @ 2) che 250
I simboli “@ %” e “*(@x) — osserva Russell — assumono pertanto lo stesso significato — ma Russell suggeri-
sce di continuare a usare «la notazione £(@x), che è spesso più conveniente di @ £».??! Russell ne conclude: «Così le classi, in quanto distinte dalle funzioni, perdono anche quell’esistenza umbratile che esse conservano in #20.
Lo stesso si applica, ovviamente, anche alle relazioni in estensione»;°°° una frase un po” criptica con la quale intende, suppongo, che una classe non ha più alcuna caratteristica che la distingua da una funzione proposizionale che la definisce — o più precisamente, che un simbolo di classe ha lo stesso uso di un simbolo di funzione proposizionale soddisfatto da tutti e solo i membri della classe. La complicazione è dovuta alla teoria ramificata dei tipi. La teoria ramificata dei tipi è ancora sostenuta, nella seconda edizione dei Principia, sulla base di una concezione che ammonta a intendere la quantificazione su fun-
zioni proposizionali come sostituzionale:”’’in questo modo, il significato di una variabile di funzione proposizionale è fissato solo se sono date le espressioni che possono prenderne il posto — cosicché tra tutte queste espressioni non può essercene alcuna che contenga la variabile stessa. Da ciò consegue che: Per quanto possiamo ampliare il significato di @, una funzione di x in cui @ compare come variabile apparente ha un significato ampliato in modo corrispondente, cosicché, comunque g possa essere definito,
(P.fi(p! î,xe(IP.f!(p! î,x)
246 [PM], vol. I, appendice C, p. 666. 247 Russell discuterà nuovamente la tesi dell’estensionalità nell’ Inquiry into Meaning and Truth (cap. 19), giungendo a una conclusione che si può riformulare sinteticamente come segue: Russell argomenta che la tesi vale nei contesti de re — «in which both indication and expression are relevant» (p. 271) —, ma non nei contesti de sensu — «in which only expression is relevant» (ibid.). Quindi propone (ibid.) un punto di vista che dice essergli stato suggerito da Norman Dalkey, secondo cui, «in “A crede che B abbia caldo”, le parole “che B abbia caldo” descrivono ciò che è espresso da ‘B ha caldo”» — dove ciò che è espresso da “B ha caldo” è ciò che è comune agli stati fisici e mentali di coloro che credono che B abbia caldo. Russell non sottoscrive decisamente tale teoria, ma commenta che si tratta di una posizione «attraente», e che «può essere vera» (ibid.), spiegando: «Secondo questo punto di vista, le parole “che B abbia caldo” non si riferiscono realmente a B, ma descrivono lo stato di A. [...] Potrei (in teoria) sostituire a “che B abbia caldo”, parole descrittive dello stato della mente e del corpo esistente in coloro che sono impegnati a credere che B abbia caldo. Questo punto di vista rende necessario tracciare una netta distinzione tra “p” e “che p”. Ogniqualvolta è realmente “p” che compare, possiamo preservare il principio di estensionalità; ma quando è “che p” che compare, la ragione per la non validità del principio è che “p’ non compare realmente» (pp. 271-272). Questo consente a Russell di concludere che il principio di estensionalità «non sia dimostrato falso, quando interpretato in modo ristretto, dall’analisi di enunciati come “A crede p”» (p. 273).
248 V. Russell [1925], $ VI, p. xxxix.
24 250 21 2°
Ibid. V. ibid. Ibid. Ibid.
253 Cocchiarella ([1987b], p. 215) ha visto questo chiaramente, anche se sostiene — contrariamente a noi — che la quantificazione su fun-
zioni proposizionali nella prima edizione dei Principia fosse invece intesa come oggettuale.
capitolo 12
826
non possono mai essere valori per gx. Il tentativo di renderli tali è come tentare di prendere la propria ombra. E impossibile otteneÈ o : CIO ù SMR ne FRENO - 254 re una variabile che abbracci tra i suoi valori tutte le possibili funzioni di individui.
La complicazione individuata da Russell nella teoria delle classi della seconda edizione dei Principia cche
avendo identificato funzioni proposizionali e classi, e avendo rinunciato all’assioma di riducibilità, «dobbiamo ora distinguere classi di ordini diversi composte di membri dello stesso ordine. Prendendo come caso più semplice le classi d’individui, %(@!x) deve distinguersi da *(@x) [dove “@!” è una funzione del primo ordine e “@,” è una funzione del second’ordine”’°] e così via».?° Come ha osservato Landini,”°” da ciò si desume che — al contrario di quanto accade nella prima edizione dei Principia — porre accenti circonflessi su tutte le variabili libere di una formula è un modo di formare effettivi termini del linguaggio formale della seconda edizione dei Principia.
Il risultato complessivo di questa strategia non fu tuttavia soddisfacente. Il 20 settembre del 1924, Ramsey scrisse a Wittgenstein: Sono andato a trovare Russell qualche settimana fa, e sto leggendo il manoscritto del nuovo materiale che sta mettendo nei Princidimostrazione
pia. Hai perfettamente ragione che non è per nulla importante; il tutto si riduce in effetti a un’ingegnosa dell’induzione matematica senza l’impiego dell’assioma di riducibilità.?°*
Ramsey si riferisce qui alla presunta dimostrazione, cui è dedicata l’appendice B dei Principia (*89) — aggiunta alla seconda edizione —, che il principio d’induzione matematica si può ancora dedurre senza ricorrere 0 Lada uooà È i . x 259 260 " all’assioma di riducibilità. La dimostrazione di Russell è complessa.” Ramsey la suppose corretta," ma in un 294 Russell [1925], $ V, p. xxxiv. 255 Nel resoconto dell’introduzione alla seconda edizione dei Principia, le lettere funzionali seguite da un punto esclamativo, come “@!”, sono variabili per funzioni proposizionali i cui “valori” — ossia ciò cui i predicati da cui possono essere sostituite danno origine, quando nei posti per lettere argomentali del predicato si pongono delle costanti — sono proposizioni elementari — dove una “proposizione elementare” è un enunciato che non contiene alcuna variabile vincolata; scrive Russell: «Poiché avremo occasione di considerare funzioni i cui va-
lori non sono proposizioni elementari, distingueremo quelle che hanno proposizioni elementari come valori con un punto esclamativo tra la lettera denotante la funzione e la lettera denotante l'argomento» (Russell [1925], $ IV, p. xxviii). Il resoconto dell’uso del segno “!” è dun-
que diverso da quello dell’introduzione alla prima edizione dei Principia e appare simile a quello di #12 (v. sopra, cap. 11, $ 2.2.3). Nell’introduzione alla seconda edizione dei Principia sono introdotte anche le seguenti variabili di funzione proposizionale, non in uso nella prima edizione: “@,” come variabile per funzioni proposizionali in cui possono essere presenti variabili individuali quantificate, ma non variabili quantificate di funzione proposizionale; ‘“@;” come variabile per funzioni proposizionali in cui compaiono variabili quantificate funzionali seguite dal punto esclamativo, oppure al massimo con “1” a pedice; ‘“@;” come variabile per funzioni proposizionali in cui compaiono variabili quantificate con “2° a pedice, ma nessuna variabile quantificata con un numerale designante un numero superiore a 2 a pedice ..., ecc. (v. Russell [1925], $ V, pp. xxxili-xxx1v).
2° Russell [1925], $ VI, p.xxxix. 27 V. Landini [1996b], p. 605, e Landini [2007a], cap. 6, p. 210. 258 In Wittgenstein [1973], appendice, p. 84; corsivi di Ramsey. 25° La dimostrazione si articola in una quarantina di teoremi, culminanti nel teorema *89.34. Per la dimostrazione di questo teorema, sono cruciali i teoremi #89.12, *89.17, e *89.21, che consentono di dimostrare il teorema *89.24, il quale, a sua volta, è il passo fondamentale
verso *89.34. Il teorema #89.12 (v. [PM], vol. I, p. 653) asserisce che se p è una classe induttiva (finita) di ordine 3 esiste una classe 4 di
ordine 2 tale che 0 = 0. Il teorema *89.17 asserisce che ogni sottoclasse di una classe di ordine 3 è essa stessa di ordine 3 (comunque sia definita, dunque). Per comprendere i teoremi seguenti, premettiamo la definizione russelliana di “xR,,y” (v [PM], vol. I, appendice B,
*89.01): XRimY=arX € CRA
(Gn) (XE Gn A (V)(W)(WRw AVE
GnDWE
GmnIVE
Gn)
“x è nella relazione R.,, (dove “R.,, si può leggere: “la relazione ancestrale di R di ordine nm’) con y, per definizione, se e solo se x è nel campo della relazione R, e y appartiene a tutte le classi ereditarie, rispetto alla relazione R (cioè a tutte le classi tali che tale che se vi appartiene un elemento qualsiasi v, vi appartiene anche ogni elemento w con cui v ha la relazione R), di ordine m cui appartiene x (per le relazioni ancestrali, v. sopra, cap. 2, $ 5.3.1). Si può ora comprendere il contenuto del teorema *89.21, il quale asserisce che se R è una relazione
molti-uno, l’intervallo tra x e y (estremi inclusi) rispetto a R3 — in altri termini (v. [PM], vol. II, #121.013), l'intersezione tra la classe degli
2 con cui x è nella relazione R,3 (cioè la classe degli z che appartengono a tutte le classi ereditarie, rispetto a R, di ordine 3, cui appartiene x) e la classe degli z che sono nella relazione R,3 con y — è una classe induttiva del terzo ordine. Il teorema *89.24 afferma che se R è una relazione molti-uno e 4 è una classe induttiva di ordine superiore al terzo cui appartiene x, allora tutti gli y con cui x ha la relazione R,3 appartengono a 4 — «Quindi», scrive Russell, «se 4 è una classe induttiva, può essere usata in un’induzione senza riguardo a quale sia il suo ordine, se R e Cls + 1» ([PM], vol. I, appendice B, p. 656, +89.24). Infine, il teorema *89.34 afferma che se xR,5y, cioè se y appartiene a tutte le classi ereditarie, rispetto a R, di ordine 5 cui appartiene x, allora, se 4 è una classe ereditaria, rispetto a R, di ordine qualsivoglia, cui appartiene x, allora anche y appartiene a 4. Il commento di Russell a quest’ultimo teorema è il seguente: «Quindi, per ciò che riguarda l’induzione matematica, tutte le dimostrazioni restano valide senza l’assioma di riducibilità purché “R,” s’intenda significare “R,”» ([PM], vol. I, appendice B, p. 658, *89.34). Per una discussione chiara del contenuto dell’appendice B dei Principia, v. B. Linsky [2011], $$ 6.2-
Alternative, critiche e proposte di emendamento al sistema dei Principia
827 262
passaggio di essa — la riga (3) della dimostrazione di *89.16°! — rilevò per primo un errore Géòdel," e trent'anni dopo John Myhill presentò una dimostrazione della sua impossibilità.”°* Più recentemente, Landini ha
però sostenuto che l’interpretazione del sistema della seconda edizione dei Principia sulla quale Myhill ha basato il suo lavoro non è storicamente corretta, e che invece — come pensava Russell — il principio d’induzione è derivabile sulla base del sistema della seconda edizione dei Principia, con assioma dell’infinito, ma senza assioma di riducibilità.?°* Come osserva Landini Myhill ha effettivamente mostrato che nel sistema della prima edizione dei Principia, privato degli schemi d’assiomi di riducibilità, e con l’aggiunta di un principio di estensionalità per le funzioni proposizionali, l’induzione matematica non è dimostrabile. Ma la grammatica del sistema della seconda edizione dei Principia — sostiene Landini — è diversa da quella del sistema della prima edizione. In particolare, secondo Landini: (1)
A differenza di ciò che accade nel sistema della prima edizione dei Principia, «il sistema del 1925 ammette
variabili predicato non predicative (vincolate e libere) [cioè il cui ordine non è quello immediatamente superiore a quello delle variabili argomentali]».?°° (Ciò è inevitabile se è vero che — come abbiamo già avuto modo di notare — nel sistema della seconda edizione dei Principia la circonflessione delle variabili libere di enunciati aperti è considerato un modo di formare termini.) (2) A differenza di ciò che accade nel sistema della prima edizione, nel sistema della seconda edizione dei Prin-
cipia «termini dello stesso tipo e di ordine diverso possono occupare la posizione-soggetto di un dato termine predicato»; non solo: «Il sistema del 1925 permette che un argomento di un’espressione predicato abbia un indice di ordine più alto di quello dell'espressione predicato in cui può essere in posizione di soggetto».?° Il vincolo sui termini argomentali di una funzione di tipo 7, è che essi devono essere di tipo t — 1, ma il loro ordine m può essere inferiore, uguale, o anche superiore all’ordine n della funzione.” 6.4, pp. 146-159.
260 V. Ramsey [1926a], $ II, p. 29, e Ramsey [1926b], p. 65. 2° Il teorema *89.16 è un lemma che conduce immediatamente alla dimostrazione del teorema *89.17: *89.16 afferma che se @ non è una classe induttiva di ordine 3, e yè una classe induttiva di ordine 3, il risultato di togliere da & tutti gli elementi che non sono anche in ynon è
la classe vuota (ossia c’è almeno un elemento dia che non è anche in 7). *#89.17 segue perché p A q > r equivale a -rD —(p A q), e dunque a -r2D —pV -g, che equivale a -r> (g > —p), che equivale a -r A q 2 —p, ovvero a q A —r > —p. Pertanto, da *89.16: se [p] @ non è una classe induttiva di ordine 3, e [g] Yè una classe induttiva di ordine 3, allora [r] c’è almeno un elemento dia che non è anche in % deriva che
se [g] Yè una classe induttiva di ordine 3, e [-r] il risultato di togliere da @ tutti gli elementi che non sono anche in yè la classe vuota (ossia non c'è alcun elemento di @ che non è anche in 7, allora [-p]
@ è una classe induttiva di ordine 3. Poiché se @ è una sottoclasse (non ne-
cessariamente propria) di Y sicuramente non c’è alcun elemento di @ che non è anche in y, il teorema *89.16 implica che se yè una classe induttiva di ordine 3, e @ è una sottoclasse (non necessariamente propria) di % allora @ è una classe induttiva di ordine 3 — in breve, che ogni sottoclasse di una classe di ordine 3 è essa stessa di ordine 3 — che è il teorema *89.17. La riga (3) della dimostrazione di *89.16 consiste nel seguente enunciato:
aloe
paéyaota=
6,
in parole: “Se il risultato di togliere da @ tutti gli elementi di @ che sono anche in f non è la classe vuota (ossia esiste almeno un elemento di @ che non è elemento anche di £), e @ è una sottoclasse (non necessariamente propria) della classe formata da tutti gli elementi di 8 più l’elemento y, allora @ è uguale alla classe formata da tutti gli elementi di f più l'elemento y”. Come osserva Bernard Linsky ([2011], $ 6.5. p. 155), a un primo sguardo l’enunciato può apparire vero (anche se Gòdel lo presenta come «evidentemente falso» (GGdel [1944], p. 463), e questo spiega probabilmente la svista di Russell nell’introdurlo (come enunciato ovvio, senza fornirne alcuna giustificazione) come passo essenziale della dimostrazione *89.16. Ma esso è vero solo nel caso particolare in cui 8 sia una sottoclasse di @— cosa che non è garantita solo dal fatto che esistano elementi di @ che non sono anche elementi di 8, ossia che @ non sia una sottoclasse di 2. Ecco infatti un semplice controesempio (v. B. Linsky [2011], $ 6.5. p. 156): se @ fosse la classe {b, 5), y}, e f fosse la classe {Db}, b), b3}, sarebbe vero che vi è almeno un elemento di @ che non è anche elemento di 8 (cioè y), e anche che @è una sottoclasse della classe formata da tutti gli elementi di B più l'elemento y, ma sarebbe falso che @ sia uguale alla classe formata da tutti gli elementi di / più l’elemento y (perché @ non avrebbe l'elemento b3 di BU Vy).
202 V. Godel [1944], p. 463. 263 Vv. Myhill [1974]. 264 V. Landini [1996b]. V. anche Landini [2013a], pp. 88-96. 265 V. Landini [1996b], p. 598, p. 600, e p. 614, e Landini [2007a], cap. 6, p. 211. Myhill conduce in effetti il suo esame della dimostrazione contenuta nell’appendice B dei Principia basandosi sulla formalizzazione della teoria ramificata dei tipi della prima edizione dei Principia fornita in Schiitte [1960], privando la teoria risultante dell’ assioma di riducibilità e aggiungendovi due assiomi di estensionalità.
2° 27 268 26°
Landini [1996b], p. V. Landini [1996b], Landini [1996b], p. Landini [1996b], p.
602. p. 605, e Landini [2007a], cap. 6, p. 210. 604. 601; v. anche Landini [2007a], cap. 6, p. 210.
270 V. Landini [1996b], pp. 603-604, e Landini [2007a], cap. 6, pp. 209-210. Come hanno rilevato Jennifer M. Davoren e Allen P. Hazen
828
(3)
capitolo 12
Porre due funzioni proposizionali di ordini diversi (ma dello stesso tipo) ai lati diun segno di identità dà luo(In effetti, nell’ appendice B go a una formula grammaticalmente corretta — e che può anche essere vera. z 3 REA 7 5 7 co Oa a 270. dei Principia troviamo identificate funzioni di ordini diversi.)
Queste differenze tra il sistema dei tipi della prima edizione e quello della seconda edizione dei Principia non sono esplicitate da Russell: Landini le ricava piuttosto dall’effettivo uso di formule nella dimostrazione del principio di induzione matematica nell’appendice B dei Principia, che Myhill vede invece come infarcita di errori superficiali nella notazione.?”* La prova di Landini del principio di induzione matematica nel contesto della teoria della seconda edizione dei Principia, consiste nel ripristinare la dimostrazione dell’appendice B dei Principia emendando la dimostrazione
del teorema *89.17 ivi contenuto,””* per il quale era originariamente utilizzato come lemma il teorema errato *89.16. La dimostrazione originale di Landini richiede tuttavia anche l’assunzione di un forte assioma di estensionalità, che garantisce l’intersostituibilità in qualsiasi contesto (e dunque l’identità) di due qualsiasi funzioni proposizionali aventi la medesima estensione, di qualsivoglia ordine esse siano.” Come è stato osservato successivamente da Hazen e Davoren, tale assioma implica l’assioma di riducibilità,””° e consente quindi non solo di renel 1990, nel 1944 Kurt Gédel aveva suggerito — a quanto pare, per primo (v. Hazen e Davoren [2000], p. 536) — che la teoria ramificata dei tipi della seconda edizione dei Principia sia diversa da quella della prima edizione (v. Gòdel [1944], p. 454), permettendo «alle funzioni
proposizionali di avere argomenti di tipo (semplice) appropriato ma di ordine arbitrario, pur conservando ancora restrizioni sugli ordini delle variabili quantificate nella definizione di una funzione proposizionale» (Davoren e Hazen [1991], p. 1109; in Hazen e Davoren [2000], p. 536, il merito originale dell’osservazione è ascritto alla Davoren). Davoren e Hazen concordano con Gédel su questa interpretazione della teoria della seconda edizione dei Principia, e offrono una formalizzazione di tale teoria molto simile a quella di Landini [1996b], ma senza il forte assioma di estensionalità di cui parleremo tra poco nel testo (v. Hazen e Davoren [2000], pp. 535-536 e pp. 546-548, e Hazen [2004], pp. 466-467). Su questi punti, v. anche B. Linsky ([2011], $ 6.6, pp. 159-160.
27! V. Landini [1996b], p. 602, e Landini [2007a], cap. 6, p. 210. Landini riconosce che ciò può apparire strano: «Ciò apparirà certamente strano. Per una semantica realista per il sistema ciò suggerisce che attributi (“funzioni proposizionali” come entità intensionali) con ordini diversi possono nondimeno essere “identici”. In una semantica realista, attributi con diversi ordini devono sicuramente essere distinti» (Landini [2007a], cap. 6, p. 210; v. anche Landini [1996b], p. 602). La spiegazione, continua Landini, è che «Russell intendeva una nuova
semantica nominalista per i termini predicato e le variabili di Principia” [Landini chiama così la seconda edizione dei Principia: “W” sta ovviamente per “Wittgenstein” — alcune tesi fondamentali del quale sono alla base del sistema indagato nella nuova edizione]» (Landini [2007a], cap. 6, p. 210; v. anche Landini [1996b], p. 602). 272 Per esempio, il teorema *89.12 dell’appendice B — un lemma dichiarato giustamente da Russell «fondamentale» ([PM], vol. I, p. 653, *89.12) per il complesso della dimostrazione condotta nell’appendice stessa —, asserisce che se p è una classe induttiva (finita) di ordine 3 esiste una classe 5 di ordine 2 tale che 0 = /£.
293 V. Myhill [1974], p. 25, nota. 224 V. Landini [1996b], $4, pp. 606-613. Il teorema *89.17 asserisce che ogni sottoclasse di una classe induttiva di ordine 3 è essa stessa di
ordine 3. 275 V. Landini [1996b], p. 604 (siglato «Extensionality;»), e Landini [2007a], cap. 6, p. 209 (siglato «EXT»). Possiamo scrivere l'assioma di estensionalità proposto da Landini come segue:
(x) (Fx = Gx) > (AH) > A(FIG)), dove “x? può essere una variabile individuale o per funzioni proposizionali, “F?? e “G” rappresentano predicati che possono essere anche di ordine diverso, ma i cui argomenti sono dello stesso tipo e ordine, e “A(F]G)” rappresenta il risultato di sostituire nella formula designata da “A”, la formula rappresentata da “G “ a quella rappresentata da “/?° in alcune (può essere anche in tutte, ma non necessariamente) delle sue occorrenze non vincolate nella formula rappresentata da “A”.
“7° V. Hazen e Davoren [2000], p. 549, Hazen [2004], p. 469, e Landini [2007a], cap. 6, pp. 212-213. In Hazen e Davoren [2000], p. 549, osservano che l’assioma di estensionalità proposto da Landini (v. nota precedente):
(2) (Fx = Gx) > (A(F) D A(FG)), implica che due funzioni proposizionali che sono coestensive rispetto ad argomenti di un certo ordine, sono coestensive rispetto ad argomenti di qualsiasi ordine. Dall’assioma di estensionalità di Landini segue infatti il corollario:
(x)(Fx = Gx) > (Fy > Gy), dove “y” sia una variabile dello stesso tipo di “x”, ma di ordine più elevato. (Per constatarlo basta prendere, nell’assioma di estensionalità di Landini, “A(F) come “Fy”.) Hazen e Davoren commentano:
«Questo dice, essenzialmente, che se F e G concordano su tutte le funzioni di
qualche livello [sc. “ordine”’] basso, concordano anche su tutte le funzioni di un livello più alto, ma questo seguirebbe solo se per ogni funzione di livello più alto esistesse già una funzione coestensiva al livello più basso. E questo è semplicemente 1’ Assioma di Riducibilità di Russell [...]» (Hazen e Davoren [2000], p. 549). Landini ha in seguito accettato che il suo assioma implichi l’assioma di riducibilità, producendone anche la seguente ‘dimostrazione (v. Landini [2007a], cap. 6, p. 212-213, e B. Linsky [2011], $ 6.8, p. 167): le due funzioni BWM(Y!x= 70) e(7x= 7) hanno la stessa estensione, per ogni @! che sia predicativa (nel senso stabilito nella prima edizione dei Principia); ne segue — come abbiamo appena visto — che esse sono coestensive rispetto a qualsiasi funzione @ di x che sia di un ordine m a piacere, anche superiore all’ordine di @! (cioè non predicativa: si rammenti che nel sistema della seconda edizione dei Principia sono ammesse variabili non predicative):
(PAVWVA (V!x=
= (=):
Alternative, critiche e proposte di emendamento al sistema dei Principia
829
cuperare il principio di induzione matematica (rendendo vacua l’intera dimostrazione dell’appendice B dei Principia), ma anche di ricavare l’analisi classica e il teorema di Cantor.?”” Ciò contrasta naturalmente con l’esistenza stessa dell’appendice B dei Principia, nonché con l'ammissione di Russell, nell’introduzione alla seconda edizione dei Principia,”"* che nel sistema colà investigato gli è impossibile, senza l’assioma di riducibilità, sviluppare l’aritmetica transfinita di Cantor e derivare la teoria dei numeri reali (attraverso le sezioni di Dedekind). Landini ha più tardi concesso che l’assioma di estensionalità sul quale egli aveva dapprima fondato la sua dimostrazione del principio di induzione matematica «è troppo forte per essere stato ciò che intendeva Russell»??? nella seconda edizione dei Principia, e ne ha proposto una versione più debole, che non implica l’assioma di riducibilità, ma non invalida il suo emendamento della dimostrazione dell’appendice B dei Principia.?
Sebbene l’assioma di estensionalità inizialmente proposto da Landini non sembri poter essere ciò che Russell intendeva, nella seconda edizione dei Principia, è difficile stabilire come lo intendesse. Se Russell non intendeva identificare tutte le funzioni proposizionali aventi la medesima estensione — come aveva supposto inizialmente Landini —, quale limitazione egli intendeva avesse il suo principio di estensionalità? Lo intendeva forse limitato alle sole funzioni dello stesso ordine?’*! o limitato alle sole funzioni di individui?”*” o alle sole funzioni che non esprimono nozioni puramente logiche?*? o soggetto a qualche altra limitazione? Il testo non offre una soluzione indiscutibile. In ogni caso, l’impossibilità di fondare l’analisi classica nel sistema inteso nella seconda edizione dei Principia
non è tollerabile, per chi si pone l’obiettivo di derivarne l’intera matematica classica.?** Nell’introduzione alla seconda edizione dei Principia, lo stesso Russell osserva: Sarebbe possibile sacrificare le serie infinite ben ordinate al rigore logico, ma la teoria dei numeri reali è una parte integrante della
matematica ordinaria, e difficilmente può essere oggetto di un dubbio ragionevole. Siamo dunque giustificati nel supporre che qualche assioma logico vero la giustificherà. L'assioma richiesto può essere più ristretto dell’assioma di riducibilità, ma, se è così, resta ancora da scoprire.”8°
Così, alla fine, la seconda edizione dei Principia torna a fare appello all’assioma di riducibilità, o a qualche as-
sioma più ristretto ma «ancora da scoprire».
2.5. LA TEORIA DI RAMSEY Nell'articolo “The foundations of mathematics”, scritto nel 1925, Ramsey manifesta la sua insoddisfazione per l’approdo finale dei Principia. Egli dice di ritenere inaccettabile l’assioma di riducibilità, ma altrettanto inaccettabile non poter legittimare la teoria ordinaria dei numeri reali che sta a fondamento dell’analisi matematica:
poiché il lato destro di quest’ultima formula è una tautologia, otteniamo come teorema il suo lato sinistro:
ANA (!x= 9), che è, naturalmente, una forma dell’assioma di riducibilità.
277 V. Landini [2007a], cap. 6, p. 213. 278 V. Russell [1925], $ VII, pp. xliv-xlv. 27° Landini [2007a], cap. 6, p. 214. 280 V_ ibid. La nuova versione dell’assioma che, scrive Landini «[f]orse [...] rappresenta meglio ciò che Russell aveva in mente» (ibid.), gaDETORSIC
ne, di qualsivoglia ordine esse siano, purché per ciascuna delle funzioni vi sia sempre qualcosa di cui la funzione è vera e qualcosa di cui è 72) 0-(M)(7x= #7) che consentono di dimo-
falsa: questa condizione esclude funzioni tautologiche o contraddittorie come (x)(7x=
strare l'assioma di riducibilità. 281 Così suppone Quine [1936c], p. 498. 22 Come suggeriscono Hazen e Davoren (v. Hazen e Davoren [2000], p. 549, e Hazen [2004], p. 469). 283 Come suggerito dallo stesso Landini in [2007a], cap. 6, p. 214. 284 Come suggeriscono Hazen e Davoren: «Si è tentati di pensare che la trascuraggine generale della nuova logica [sostenuta nella seconda edizione dei Principia] sia derivata da questa valutazione della sua forza matematica» (Hazen e Davoren [2000], p. 535). Poco più avanti, nello stesso articolo, gli autori proseguono: «In ogni caso, la nuova logica fu ignorata. Nessuna delle recensioni contemporanee della seconda edizione che abbiamo visto fa alcuna menzione del cambiamento alla teoria dei tipi. In effetti, non siamo a conoscenza di alcuna evidenza pubblicata che qualcuno abbia realmente letto 1’ Appendice B finché Gòdel non cominciò a lavorare al suo [1944]» (Hazen e Davoren [2000], p. 536).
285 Russell [1925], $ VII, p. xlv.
830
capitolo 12 3
vò
Ò
E
286
o
o RATE Ste % ” Pi 2% : [...] poiché io non posso né accettare l’assioma di riducibilità né rifiutare l’analisi ordinaria,[°'] non posso credere a una teoria che
non mi presenti una terza possibilità.?*”
Ramsey propone allora un emendamento della teoria dei Principia che è in grado, egli sostiene, di superare questa (e altre) difficoltà. i La premessa di Ramsey consiste nella ripresa del punto di vista, sostenuto per la prima volta da Wittgenstein nel Tractatus, secondo cui l’intera logica si riduce a logica proposizionale, la quale, a sua volta, è costituita di tautologie, cioè di enunciati che rimangono veri per qualsiasi assegnazione di valori di verità agli enunciati che li co-
stituiscono. Secondo Wittgenstein e Ramsey, le proposizioni (con questo termine entrambi si riferiscono a entità linguistiche) che non sono atomiche (nel Tractatus, Wittgenstein le chiama “elementari”)?85 sono tutte funzioni di verità delle proposizioni costituenti (le proposizioni atomiche possono, chiarisce Wittgenstein, considerarsi funzioni di se stesse).”*° Per converso, secondo questi autori, qualsiasi funzione di verità, di qualsiasi numero, finito o infinito, di argomenti è una proposizione.” È chiaro che questo dà un insieme di proposizioni ben più ampio di quello considerato dagli autori precedenti Wittgenstein, Russell incluso. Infatti, se abbiamo, per es., No proposizioni atomiche, non sarà possibile esprimere attraverso sequenze finite di segni tutte le possibili assegnazioni di valori di verità a ciascuna proposizione atomica; eppure, ciascuna di esse sarà una proposizione, secondo la concezione di Wittgenstein e Ramsey. Ci sono però casi semplici, in cui possiamo — secondo Wittgenstein e Ramsey — esprimere funzioni di verità di un numero infinito di argomenti. Questo è il caso delle proposizioni in cui compaiono variabili quantificate: le proposizioni in cui compaiono quantificatori universali esprimono il prodotto logico di tutte le esemplificazioni possibili delle proposizioni di partenza; quelle che contengono quantificatori esistenziali ne esprimono la somma logica.” Così, per esempio, ‘“(x)(@x)” dovrebbe essere interpretato come il prodotto lo-
gico: pa n gb A pe
N...,
mentre ‘“(4x)(@x)” dovrebbe interpretarsi come la somma logica:
pav gbv pe
v...,
dove a, b, c, ..., ecc., sono tutti gli individui esistenti. 220 Ramsey segue, in particolare, la modificazione russelliana della teoria dei numeri reali di Dedekind.
287 Ramsey [1926a], $ II, p. 29. LE Seguendo la terminologia della seconda edizione dei Principia (v. Russell [1925], $ I, p. xv), Ramsey chiama “proposizione atomica”
un enunciato in cui non sono presenti variabili, né connettivi. Sono quindi atomiche le proposizioni in cui si attribuisce una qualità a un 0ggetto, o si stabilisce una relazione tra più oggetti. Una funzione atomica di individui è per Ramsey «il risultato del rimpiazzamento con variabili di nomi qualsiasi di individui in una proposizione atomica espressa usando solo nomi [...]» (Ramsey [1926a], $ III, p. 38). Sempre seguendo la terminologia della seconda edizione dei Principia (v. Russell [1925], $ I, p. xvii), Ramsey riserva invece la qualifica di “ele-
mentare” a ogni proposizione che sia una funzione di verità di un numero finito (la clausola in corsivo, come vedremo, esclude le proposizioni contenenti variabili quantificate) di proposizioni atomiche, e a ogni funzione che può essere da essa ottenuta rimpiazzando, in una o più delle sue occorrenze, un nome con una variabile (detto altrimenti, una funzione elementare è una funzione i cui valori sono proposizioni elementari (v. Ramsey [1926a], $ II, p. 25)). Giusta il resoconto della teoria dei tipi offerto nell’introduzione alla seconda edizione dei
Principia (simile a quello di #12), Ramsey identifica le funzioni elementari di individui con le funzioni predicative di individui dei Principia. Come vedremo, Ramsey riserva la locuzione “funzione proposizionale predicativa” per un uso differente da quello dei Principia. 29, Wittgenstein [1921], propp. 5, 5.3, 5.54, e Ramsey [1926a], $ I, p. 9. Ramsey ammette che una proposizione come “A crede che p”
non sia una funzione di verità di “p”, ma osserva che può essere una funzione di verità di altre proposizioni atomiche (v. ibid., nota). In 0gni caso, egli non si sofferma sulla questione, perché si sta occupando di matematica, e il punto di vista si applica a «tutte le proposizioni dei Principia Mathematica; poiché esse sono costruite da proposizioni atomiche usando in primo luogo congiunzioni come “se”, “e”, “0”, e in secondo luogo vari generi di generalità (variabili apparenti). Ed entrambi questi metodi di costruzione si sono dimostrati produrre funzioni di verità» (Ramsey [1926a], $ I, p. 9). Wittgenstein affronta il problema di “A crede che p” nel Tractatus, propp. 5.541 e 5.542 (v. sopra, nota 229).
IVI Wittgenstein [1921], propp. 4.31, 4.43, 4.44, e Ramsey [1926a], $ III, p. 34. Wittgenstein non afferma esplicitamente di ammettere
funzioni di verità con infiniti argomenti, ma questo è implicito nel trattamento della quantificazione del Tractatus. 29! In generale, date n proposizioni atomiche, ci saranno 2" possibilità di assegnare a ciascuna di esse un valore di verità. Le possibili assegnazioni di valori di verità a X proposizioni atomiche saranno dunque 280, ossia la potenza del continuo. DV
Wittgenstein [1921], propp. 5.5, 5.502, 5.51, 5.52, e Ramsey [1926a], $ I, p. 8. V. anche Ramsey [1926b], p. 73, e Ramsey [1927a],
p. 168 (Ramsey [1931], pp. 152-153).
Alternative, critiche e proposte di emendamento al sistema dei Principia
831
Analogamente, “(@)(@a)”, si dovrebbe interpretare come:
VIA A WA AY31 N...,
dove Y1, Y2, Y3, sono tutte le possibili funzioni proposizionali di individui.” La teoria della quantificazione di Wittgenstein-Ramsey — che sarà fatta propria anche da Zermelo, negli anni Trenta del Novecento?” — implica che si ammetta la possibilità di proposizioni formate da un numero infinito di proposizioni atomiche, contenenti un numero infinito di nomi. Se non fosse così, il metodo di traduzione delle proposizioni con quantificatori in congiunzioni o disgiunzioni fallirebbe in ogni universo che contenesse più di un
numero finito di oggetti. Wittgenstein e Ramsey sono dunque obbligati a postulare un linguaggio ideale in cui sia presente un nome per ogni oggetto e siano ammissibili proposizioni costituite di infinite proposizioni atomiche.?” Ramsey precisa, infatti, che le proposizioni non devono intendersi come classi di occorrenze di simboli che siano stati realmente utilizzati, o che facciano parte del nostro linguaggio reale: Quando parliamo di proposizioni dovremo includere tipi [types] di cui potrebbero non esserci esempi. Questo è inevitabile, poiché non possiamo preoccuparci se qualcuno abbia effettivamente simbolizzato o asserito una proposizione, e dobbiamo considerare tutte le proposizioni nel senso di tutte le possibili asserzioni siano o no state asserite.??°
[...] dovremo considerare proposizioni che il nostro linguaggio è inadeguato a esprimere. In “(x) . px” asseriamo la verità di tutte le possibili proposizioni che sarebbero della forma “@x” sia che abbiamo sia che non abbiamo nomi per tutti i valori di x. Le proposi-
zioni generali si devono ovviamente intendere come applicantisi a qualsiasi cosa, non semplicemente a qualsiasi cosa per cui noi abbiamo un nome.???
Ramsey spiega d’intendere come una stessa proposizione tutti gli enunciati che hanno le stesse condizioni di verità di un enunciato dato: Abbiamo visto [...] che possiamo costruire simboli diversi che esprimano tutti accordo e disaccordo con gli stessi insiemi di possibilità. Per esempio, “p D
@P, “p
s yi.
Gi. dea
p
; -q’,
“eq
=»,
-p’,
sono un insieme siffatto, poiché concordano tutti con le tre possibilità
Dda
(13
”
“e
Di
99
i apard
”
ma non concordano con “p . 9g”. Due simboli di questo genere, che esprimono accordo e disaccordo con gli stessi insiemi di possibilità, si dicono esempi della stessa proposizione. Essi ne sono esempi proprio come tutti gli “il” su una pagina sono esempi della parola “il”. Ma mentre gli “il” sono esempi della stessa parola a causa della loro somiglianza fisica, simboli diversi sono esempi della stessa proposizione perché hanno lo stesso senso [sense], cioè, esprimono accordo con gli stessi insiemi di possibilità.”
Si osservi che, anche limitandosi alle proposizioni finite, il significato del termine “proposizione” non è il medesimo, in Ramsey e in Russell. Russell, infatti, avrebbe considerato “p > g”, “p vg”, “*(p Aq), “q>
—((w)(“Het’Ry % =(w%
= Hetx))
x -Het(“Het”)). (Da (3).)
(5) “Het”RHetx (Per (A).) (6) -((YM(‘Het’Ry
7 (M(HeRy
% = (w% = Het t)) A —-Het(“Het?)). (Da (4) e (5).)
È =(y£ = Het è) > Het (“Het”). Da (6).)
(8) (M(‘Het’Ry x =(w £% = Het *)). (Assunzione che “Het” sia univoco.
(9) Het(“Het”). (Da (7) e (8).)
329
)
Si ha quindi che —Het(“Het”)> Het(“Het”), che, unito al risultato precedente, secondo cui Het(“Het”) > -Het (“Het”), dà la contraddizione che Het (“Het”) = —-Het (“Het”). Possiamo ora vedere con precisione come si eviti questa contraddizione nei Principia. Nella prima parte della derivazione, il passaggio da (3) a (4) si ottiene prendendo “Het %” al posto di “w?°. Ma questo non si può fare, se-
condo la teoria dei Principia, perché “Het %” è d’ordine più alto dei simboli di funzione proposizionale che sono ammissibili come sostituendi di “w°, dato che “W°° compare come variabile quantificata in (B), cioè nella definizione di “Het”. Nella seconda parte della derivazione, abbiamo — secondo i Principia — un’analoga fallacia nel SS passaggio da (2) a (3): si prende “Het%” al posto di ‘“@”, ma, ancora una volta, “Het*” è d’ordine più alto dei simboli di funzione proposizionale che si possono sostituire a ‘“@”, poiché “@” compare come variabile quantificata nella definizione (B).3° Questa soluzione al paradosso non è più disponibile per Ramsey, il quale afferma che le funzioni proposizionali non sono gerarchizzate in ordini. La fallacia, secondo Ramsey, consiste piuttosto nel punto (5) di entrambe le parti della derivazione. Egli obietta, infatti, che il senso che ha il termine “R” in (5) non è il medesimo che il ter-
mine “R” ha quando compare nella definizione (B). Secondo Ramsey, la relazione di significazione è diversa a seconda dell’ordine del simbolo funzionale che compare come primo membro della relazione stessa: così se, per esempio, la relazione R vale tra un simbolo funzionale di ordine n e una funzione @ X, la stessa relazione R non può valere tra un simbolo funzionale di ordine n + 1 e la funzione @ %; dovremmo dire piuttosto che tra questi ultimi vale una relazione che potremmo chiamare “R;”. In breve, il paradosso di Grelling sarebbe imputabile a un errore di equivocazione, dovuto all’ambiguità del simbolo “R” che compare in (A). Ramsey offre una spiegazione dell’asserita ambiguità della relazione R. Riportiamo per intero il brano rilevante, perché in esso si fornisce anche una spiegazione del simbolo “‘@°R@ *”, che può apparire strano in una con-
°°° L'assunzione non è banale: se si suppone che “Het” non sia univoco, la dimostrazione del paradosso è bloccata. L'argomento del paradosso potrebbe dunque essere considerato come una dimostrazione che “Het” non può essere un segno univoco. Una soluzione del genere al paradosso di Grelling è prospettata in Sullivan [2003], p. 36. Questo punto illustra molto bene, credo, quanto possano essere importanti le considerazioni linguistiche in questo paradosso. 330 Per il resoconto di Ramsey, v. [1926a], $ II, p. 27.
331 V. Ramsey [1926a], $ III, p. 43.
Alternative, critiche e proposte di emendamento al sistema dei Principia
837
cezione, come quella di Ramsey, secondo cui non vi sono “funzioni proposizionali” in senso ontologico non linguistico. Scrive Ramsey: Prima di tutto, parlare di “/” [il simbolo che Ramsey usa al posto del nostro “Het”] come significante F% deve apparire molto strano in vista della nostra definizione di una funzione proposizionale come essa stessa un simbolo. Ma l’espressione è meramente ellittica. Il fatto che cerchiamo di descrivere in questi termini è che abbiamo scelto arbitrariamente la lettera “Y”° per un certo scopo, cosicché “Fx? debba avere un certo significato (dipendente da x). Come risultato di questa scelta “/”, prima non significante, diviene significante; ha significato. Ma è chiaramente una semplificazione impossibile supporre che ci sia un singolo oggetto F, che esso significa. Il suo significato è più complicato di questo, e dev'essere indagato ulteriormente. Prendiamo il caso più semplice, una proposizione atomica interamente scritta, “aSb”, dove “a”, “b” sono nomi di individui, e “S”
il nome di una relazione. Allora “a”, “”, “S” significano nel modo più semplice gli oggetti separati a, 6 e S.[°*°] Supponiamo ora di definire PNA-MASXMODI Dunque “” è sostituito a “aS” e non significa un singolo oggetto, ma ha significato in un modo più complicato in virtù di una relazione a tre termini con a e S. Dunque possiamo dire che “@?” significa aS % , intendendo con ciò che “@” ha questa relazione con a e S. Possiamo estendere questo resoconto per trattare qualsiasi funzione elementare[***], cioè, dire che “@!” significa @! & significa che “@!” è relato in un certo modo con gli oggetti a, b, ecc., implicati [involved] in g! * . Ma supponiamo ora di prendere un simbolo funzionale non elementare, per esempio, PiX:=:).yRx Df. Qui gli oggetti implicati in 91 X includono tutti gli individui come valori di y. Ed è chiaro che “@” non è relato con essi proprio nello stesso modo in cui lo è “@!” agli oggetti nel suo significato. Perché “@!” è relato con a, b, ecc. essendo un’abbreviazione di un’espressione che contiene nomi di a, b, ecc. Ma “@;” è un’abbreviazione di un’espressione non contenente “a”, “b”, ..., ma contenente solo una variabile apparente, di cui questi possono essere valori. Chiaramente “@;” significa ciò che significa in un modo più complicato da quello in cui significa “@!”. Naturalmente, proprio come l’elementarità non è realmente una caratteristica della proposizione, essa non è realmente una caratteristica di una funzione; vale a dire, @;j x e @ ! X possono essere la stessa funzione, perché @,x è sempre la stessa proposizione di @!x. Allora “@,”, “@!” avranno lo stesso significato, ma lo significheranno, come abbiamo visto sopra, in sensi affatto diversi di significare. Similmente “@,” che implica una variabile apparente funzionale significherà in un modo ancora diverso e più complicato.?*
La spiegazione di Ramsey può forse risultare più chiara se la si considera sullo sfondo della teoria wittgensteiniana delle proposizioni atomiche come fatti che sono immagini di fatti; vale a dire, la concezione secondo cui le relazioni tra oggetti, o le loro proprietà sono simbolizzate in una proposizione atomica da relazioni tra i nomi di questi oggetti 0, nel caso delle proprietà, da proprietà dei loro nomi. In questa prospettiva, l’ argomento di Ramsey sembra essere il seguente. Prendiamo, per es., il simbolo “(x)(@x)”; supponendo che a, b e c siano tutti gli individui esistenti, il simbolo “@a A @b A ge” è un'istanza della medesima proposizione. Il secondo simbolo è però correlato a tre fatti di cui “@a”, “@b” e “@c° sono immagini, mentre il primo simbolo non è correlato agli stessi tre fatti nello stesso modo, perché “(x)(@x)” non contiene direttamente le loro immagini, ma è un’abbreviazione di un simbolo (‘“@a A @b A pc”) che le contiene. Su questa base, Ramsey propone infine le seguenti gerarchie. Innanzi tutto quella dei tipi di funzioni: una funzione di individui è del tipo 1; una funzione di funzioni di individui è del tipo 2; una funzione di funzioni di funzioni di individui è del tipo 3, e così via.” Poi quella degli ordini, che assegna: l’ordine 0 ai simboli proposizionali e funzionali che non contengono variabili vincolate; l’ordine 1 ai simboli proposizionali e funzionali che contengono una variabile individuale vincolata; l’ordine 2 ai simboli proposizionali e funzionali che contengono una variabile vincolata i cui valori sono funzioni proposizionali di individui (cioè, funzioni proposizionali del tipo 1); in generale, l'ordine n ai simboli proposizionali e funzionali che contengono una variabile vincolata i cui valori sono funzioni del tipo n — 1.°°° 332 Ramsey non è un nominalista: egli ammette la realtà di relazioni e qualità, ma non ritiene che i simboli di funzione proposizionale designino qualità o relazioni. 333 Cioè ottenibile da proposizioni formate a partire da un numero finito di proposizioni atomiche, attraverso l’uso dei soli connettivi.
334 Ramsey [1926a], $ III, pp. 43-44. 335 V. Ramsey [1926a], $ III, p. 46. Naturalmente, poiché proposizioni e funzioni proposizionali sono, per Ramsey, entità simboliche, la gerarchia dei tipi è ipso facto una gerarchia di tutti i simboli che istanziano le proposizioni o le funzioni proposizionali. 336 Vv. Ramsey [1926a], $ III, p. 46-47. Si osservi che — contrariamente a quanto accade nei Principia — nella teoria di Ramsey la gerarchia degli ordini è indipendente da quella dei tipi. Vale a dire che un simbolo funzionale avente argomenti di un certo tipo, può avere un ordine superiore, ma anche inferiore al suo tipo. In altre parole, l'ordine di un simbolo funzionale non è elevato dal tipo delle sue variabili argomentali. Ramsey lo riconosce esplicitamente scrivendo: «Per questa classificazione [in ordini] i tipi delle funzioni sono irrilevanti [îmmaterial|» (Ramsey [1926a], $ III, p. 47).
838
capitolo 12
Ramsey argomenta che questa teoria risolve anche gli altri paradossi semantici: (a)
“Io mento”.
Dovremmo analizzare questo come “(‘p’, p) : io dico ‘p’ A ‘p’ significa p A —p”. Qui per ottenere un significato definito per significa* è necessario limitare in qualche modo l’ordine di “p”. Supponiamo che “p” debba essere dell’n-esimo ordine, o minore. Allora simbolizzando con @, una funzione di tipo n, “p’ può essere (A@n) . P1+1(@n)Dunque 3“p” involge 3@,+ 1, e “Io mento”, nel senso di “Sto asserendo una proposizione falsa di ordine n” è almeno di ordine n + 1 e non contraddice se stessa. (b)
(1) Il più piccolo numero non nominabile in meno di ventisei sillabe [the least integer not nameable in fewer than nineteen
syllables]. (2) Il più piccolo ordinale indefinibile. (3) Il paradosso di Richard.
Tutti questi risultano dall’ovvia ambiguità di “nominare” e “definire”. Il nome o definizione è in ciascun caso un simbolo funzionale che è un nome o una definizione solo significando qualcosa. Il senso in cui significa dev'essere reso preciso fissando il suo ordine; il nome o definizione che involge tutti questi nomi o definizioni sarà di un ordine superiore, e questo elimina la contraddizionessi
Ramsey conclude confrontando la sua soluzione di questi paradossi con quella offerta nei Principia: Le mie soluzioni di queste contraddizioni sono ovviamente molto simili a quelle di Whitehead e Russell, la differenza stando solamente nella nostra diversa concezione dell’ordine delle proposizioni e funzioni. Per me le proposizioni in se stesse non hanno ordini; esse sono solo funzioni di verità diverse delle proposizioni atomiche — una totalità definita, che dipende solo da quali proposizioni atomiche ci sono. Gli ordini e le totalità illegittime intervengono solo con i simboli che usiamo per simbolizzare i fatti in modi variamente complicati.*°
In qualche misura, la soluzione offerta da Ramsey per i paradossi semantici anticipa quella proposta pochi anni dopo da Tarski," che è oggi divenuta standard: si tratta, in entrambi i casi, di sostituire un termine considerato ambiguo, come “significa”, con una gerarchia di termini non ambigui “significa;”, “significa,”, “significa”, ecc. Ma c’è un’importante differenza: Ramsey concepisce l’ambiguità come una confusione tra sensi diversi all’interno di un unico linguaggio, mentre Tarski la concepisce come una confusione tra linguaggi diversi (linguaggio, metalinguaggio, meta-metalinguaggio, ecc.). Ciò consente un’obiezione alla teoria di Ramsey che non si applica a quella di Tarski. L’obiezione è che se si prende una relazione di significazione che sia costituita dall’unione (dalla somma logica) delle differenti relazioni di significazione postulate da Ramsey, il paradosso di Grelling riappare. Ramsey vede il punto, e afferma: Ciò che appare chiaramente dalle contraddizioni è che non possiamo ottenere una relazione di significato onnicomprensiva per le funzioni proposizionali. Qualunque prendiamo c’è ancora modo di costruire un simbolo per significare in un modo non incluso nella nostra relazione. I significati di significato formano una totalità illegittima [i/legitimate totality).!!
Il problema è, tuttavia, che la teoria dei tipi di Ramsey non esclude l’esistenza di una tale relazione onnicomprensiva. Tale esclusione rimane dunque un aggiustamento ad hoc.?* La soluzione di Ramsey non sembra dunque essere del tipo che Russell avrebbe potuto ritenere soddisfacente. 337
“ee
x
Quando dico “*p’ significa p”, non suppongo che ci sia un singolo oggetto p significato da “p”. Il significato di “p” è che una di un certo insieme di possibilità è realizzata, e questo significato risulta dalle relazioni di significato [meaning-relations] dei distinti segni in “p” con gli oggetti reali su cui verte [it is about]. Sono queste relazioni di significato che variano con l’ordine di “p”. E l’ordine di “p” è limitato non perché p in (Jp) sia limitato, ma da “significa” che varia in significato con l’ordine di “p”. [Nota di Ramsey.] 33 Ramsey [1926a], $ III, p. 48. La spiegazione di Ramsey è abbastanza chiara, anche se non si adatta pienamente alla descrizione che egli da nelle pagine precedenti degli ordini dei simboli proposizionali e di funzione proposizionale: infatti, secondo tale descrizione, se “p’ è “A@n). @n+1(@n), allora — contenendo la variabile funzionale quantificata “@,° — dovrebbe essere di ordine n + 1, e non di ordine n. Corrispondentemente, un simbolo proposizionale che contenga la variabile quantificata “@,, dovrebbe essere di ordine n + 2, e non n + Il,
33° Ramsey [1926a], $ III, pp. 48-49.
240 V. Tarski [1933].
34! Ramsey [1926a], $ III p. 46. 342 A questo proposito, Warren D. Goldfarb scrive: «Ramsey nota che il paradosso [di Grelling] dipende da una relazione di espressione tra una parola (un aggettivo) e una funzione proposizionale. Egli quindi insiste che “espressione” è ambiguo, e che c’è una gerarchia di relazioni espressione. Una volta che si tenga conto di questo, la definizione di “eterologico” non conduce a nessuna contraddizione. Ora Russell chiederebbe, penso, perché non ci sia nessuna relazione che sommi (sia l’unione di) le differenti relazioni espressione che Ramsey postula. (Tale unione reintrodurrebbe il paradosso.) Poi-
Alternative, critiche e proposte di emendamento al sistema dei Principia
839
Nel primo testo in cui menzionerà il paradosso di Grelling — An Inquiry into Meaning and Truth (1940) — Russell si dichiarerà d’accordo con la soluzione di Tarski, che asserirà addirittura essere «implicita [invo/ved] nella teoria dei tipi».°!’ «Per evitare tali antinomie», egli scrive, «la gerarchia di linguaggi è essenziale».** Questo farebbe pensare che, infine, Russell si fosse convinto di accettare la proposta di Ramsey di adottare una teoria semplice dei tipi — già sufficiente a bloccare tutti i paradossi estensionali — facendo a meno dell’assioma di riducibilità e lasciando alla gerarchia dei linguaggi di Tarski il compito di risolvere i paradossi oggi detti “semantici”. Come vedremo nel prossimo paragrafo, tuttavia, gli scritti russelliani successivi alla seconda edizione dei Principia mostrano una situazione di maggiore incertezza.
2.6.
RUSSELL DOPO LA SECONDA EDIZIONE DEI PRINCIPIA
Come sappiamo, dopo la seconda edizione dei Principia, Russell non svolse più attività di ricerca sui fondamenti della matematica. Sulla proposta di Ramsey che abbiamo esposto nel precedente paragrafo, Russell non espresse un parere definitivo. In un breve commento, pubblicato nel febbraio del 1928 sulla rivista americana The Forum, a un articolo non tecnico di Ramsey sui paradossi, che era stato pubblicato sulla stessa rivista nel settembre dell’anno precedente, Russell scrive: Sono stato cortesemente invitato dal Direttore di The Forum a fornire un’opinione riguardo all’articolo di Mr. Ramsey. Il solo punto che mi riguarda è nel suo ultimo capoverso, dove egli esprime l’opinione che le difficoltà della mia soluzione dei paradossi possano essere evitate per mezzo di un sottile emendamento.[°*°] Da ciò che conosco del lavoro di Mr. Ramsey — che ammiro grandemente — inclino all’opinione che egli abbia ragione su questo punto. [...] Il parere di Ramsey che “significato” è ambiguo mi sembra completamente valido.?4°
Molti anni dopo, in My Philosophical Development (1959) Russell scrive: «Ramsey abolisce questa gerarchia [generata dagli ordini delle funzioni proposizionali] [...], e così rimane solo con la gerarchia estensionale. Spero che le sue teorie siano valide»,”*” ma nello stesso libro esprime perplessità su alcune delle idee di Ramsey." Anche nella sua “Reply to criticisms”, del 1944, Russell manifesta incertezza, affermando di non essere sicuro che
«una gerarchia puramente estensionale sia sufficiente»; il contesto è però abbastanza ottimista: Non sono mai stato persuaso che la teoria dei tipi, così come l’ho presentata, sia conclusiva. Sono convinto che qualche genere di gerarchia sia necessario, e non sono sicuro che una gerarchia puramente estensionale sia sufficiente. Ma spero che, col tempo, si sviluppi qualche teoria che sarà semplice e adeguata, e allo stesso tempo soddisfacente dal punto di vista che si potrebbe chiamare senso comune logico.**°
Come traspare da questo passo, all’epoca Russell si era completamente disimpegnato dalle ricerche fondazionali cui aveva dedicato tanti anni, ma rimaneva ottimista sul fatto che, col tempo, si sarebbe scoperta una teoria
semplice, adeguata e intuitivamente plausibile. Adeguata, si deve intendere, per fondare la matematica sulla logica: Russell non abbandonò mai il logicismo; per esempio, nell’introduzione alla seconda edizione dei Principles
ché in assenza di ramificazione le funzioni proposizionali espresse sono tutte dello stesso tipo, nulla nella natura dei relata di queste relazioni precluderebbe una tale unione. In particolare data la sua accettazione di funzioni di verità infinitarie arbitrarie, Ramsey deve assumere che l’impossibilità di sommare le relazioni sia meramente fattuale, forse di una sorta naturale o empirica» (Goldfarb [1989], p. 237).
Il punto è: i simboli che rappresentano le funzioni proposizionali, in quanto concatenazioni di segni, sono tutti dello stesso tipo logico, e le funzioni proposizionali con un certo tipo di argomenti sono tutte dello stesso tipo; dunque la teoria semplice dei tipi non è in grado d’impedire la formazione di una relazione di significazione onnicomprensiva. 343 Russell [1940], cap. 4, p. 62.
34 Russell [1940], cap. 5, p. 79. 345 Nel suo articolo, Ramsey afferma che la teoria avanzata da Russell per risolvere i paradossi ha il difetto di invalidare una gran parte della matematica classica, ma non prova a esporre neppure a grandi linee la propria teoria. Egli accenna solo, nell’ultimo capoverso dell’articolo: «La teoria di Russell può essere emendata in un modo piuttosto sottile che evita completamente le difficoltà. La chiave del problema si scopre essere un’ambiguità nella nozione di significato a cui i logici dovranno prestare sempre più attenzione. Ma l’argomento è troppo intricato per una discussione non tecnica» (Ramsey [1927a], p. 591).
340 Russell [1928], p. 91. 347 Russell [1959], cap. 10, p. 126. 348 In particolare, Russell è scettico sul concetto ramseyano di “funzione proposizionale in estensione” di cui parleremo più avanti (v. sotto, $ 2.11; per la critica di Russell, in Russell [1959], v. sotto, nota 479).
34° Russell [1944b], p. 692.
840
capitolo 12
of Mathematics (1937) egli scrive: «La tesi fondamentale delle pagine seguenti, che la matematica e la logica sono identiche è una tesi che finora non ho mai avuto nessuna ragione di modificare». Nel brano riportato della sua “Reply to criticisms” Russell non lo dice esplicitamente ma, come adesso vedremo, l’insoddisfazione che esprime
verso la sua teoria dei tipi derivava proprio dalla necessità di assumere l’assioma di riducibilità, per fondare in essa l’analisi matematica nel modo usuale. 351 Questo emerge con chiarezza da un brano del manoscritto della History of Western Philosophy di Russel L che è anche interessante esaminare perché ci fornisce un quadro complessivo della percezione che Russell aveva, negli anni Quaranta del Novecento, di diversi secoli di sviluppo del pensiero matematico, incluso il suo stesso lavoro fondazionale. Il brano in questione — pubblicato per la prima volta da Giovanni Vianelli nel Q00 = compare sotto il titolo “Influence of geometry on philosophy”, si trova alla fine del terzo capitolo del primo libro —
dedicato a Pitagora —,
ed è costituito di sei capoversi distribuiti in sei facciate manoscritte, poi sostituiti,
nell’edizione a stampa della History, da un solo capoverso, di contenuto diverso. La sua datazione è incerta, ma vi sono buone ragioni, indicate da Vianelli nel suo articolo,’ per ritenere che esso facesse parte della dodicesima lezione del corso intitolato “Problems of Philosophy” tenuto da Russell all’Università di Chicago durante l’anno accademico 1938-39.?°* Nel capitolo su Pitagora, Russell ascrive alla scoperta degli incommensurabili, e all’incapacità dell’aritmetica greca di renderne conto, la partizione della matematica nei due campi distinti dell’aritmetica e della geometria. Russell esemplifica il punto prendendo gli Elementi di Euclide: Euclide, nel Libro II, dimostra geometricamente molte cose che noi dimostreremmo naturalmente con l’algebra, come (a+ db) = a° + 2ab + b?. Fu a causa della difficoltà circa gli incommensurabili che egli considerò necessario questo procedimento. Lo stesso si applica al suo trattamento delle proporzioni nei Libri V e VI.®°
In questo contesto s’inserisce il brano menzionato. In esso, dopo aver parlato del processo di separazione della geometria — considerata un tempo come «a priori e applicabile allo spazio reale»? — in due parti, una che fa parte della matematica pura e l’altra della fisica, il cui inizio Russell attribuisce alla scoperta, con LobaCevski], delle geometrie non euclidee,””” e dopo aver accennato al progresso costituito per la scienza fisica dall’avvento, con Galileo, del metodo sperimentale, Russell torna alla separazione dell’aritmetica dalla geometria risalente ai tempi di Pitagora: Il rompicapo circa gli incommensurabili, che condusse alla separazione dell’aritmetica dalla geometria nella matematica greca, era parte di un problema più vasto, quello del trattamento aritmetico della continuità. Gli interi sono essenzialmente discreti, e il conteggio richiede unità discrete; anche la serie delle frazioni razionali, come scoprì Pitagora, non è sufficiente per la misurazione accurata delle lunghezze in termini di un’unità fissata. Sembrava impossibile che l’aritmetica si sarebbe mai dimostrata adeguata al trattamento della continuità. [...].5°
Ma l’ingegnosità dei matematici, continua Russell nella pagina successiva, si dimostrò maggiore di quella che le varie scuole filosofiche avevano ritenuto possibile: La conquista della continuità cominciò con il calcolo infinitesimale, inventato indipendentemente da Leibniz e da Newton. In un primo tempo, tuttavia, questo metodo, a dispetto dei suoi successi pratici, non era logicamente ineccepibile; fu solo nella seconda metà del diciannovesimo secolo che Weierstrass mostrò che, con il metodo dei limiti, tutti i suoi teoremi si possono stabilire senza
assumere infinitesimali. Si scoperse che i numeri irrazionali come v2 si potevano definire aritmeticamente, e Georg Cantor otten-
350 Russell [1937a], p. viii. 331 Ora presso i Bertrand Russell Archives della McMaster University, Hamilton, ON, Canada.
292 In Vianelli [2001], pp. 7-10. 393 V. Vianelli [2001], pp. 21-22. °° Il testo della History of Western Philosophy prese origine da una rielaborazione avvenuta tra il 1943 e il 1944 delle lezioni sulla storia della filosofia che Russell tenne alla Barnes Foundation (Merion, PA) negli anni 1941 e 1942. Nel manoscritto furono interpolati anche
brani scritti in precedenza.
3° Russell [1945], libro I, cap. 3, p. 55 (ediz. americana, p. 36). 39° Ms., f. 54; in Vianelli [2001], p. 7. 397 V_ ms., ff. 54-55; in Vianelli [2001], pp. 7-8. Per la concezione russelliana della geometria, v. sopra, cap. 3, $ 13.
358 V. ms., f. 56; in Vianelli [2001], pp. 8-9. 3° Ms., f. 57; in Vianelli [2001], p. 9.
Alternative, critiche e proposte di emendamento al sistema dei Principia
841
ne una definizione puramente aritmetica della continuità, che si dimostrò adeguata per tutti gli scopi della geometria e della fisica. 360
Russell si riferisce qui, naturalmente, alle note obiezioni di Berkeley al calcolo infinitesimale e al loro superamenDt Cis. I a so n: ‘ 5 i MAE to tramite il concetto di limite,*' alle definizioni dei numeri irrazionali date da Weierstrass, Cantor e Dedekind, e alla definizione cantoriana del continuo lineare. Ma a questo punto, osserva Russell, entrò in scena una nuova difficoltà: Ma a questo punto la storia si ripeté in modo sorprendente. I nuovi pitagorici si trovarono improvvisamente di fronte a una nuova difficoltà, così formidabile, ai nostri giorni, quanto erano gli incommensurabili ai tempi di Pitagora.?*
Russell spiega di quale difficoltà si tratti facendo un passo indietro nel tempo: Nello stesso tempo in cui il resto della matematica tradizionale si riduceva all’aritmetica, l’aritmetica stessa si riduceva a logica, e si inventavano nuove branche della matematica, più o meno indipendenti dal numero, come la topologia, la logica matematica, e la teoria dei gruppi. Si mostrò così che il numero non è essenziale alla matematica, ma è solo uno dei molti possibili sviluppi matematici della logica. E la logica stessa, nella forma di cui i matematici sembravano aver bisogno, si scoprì che conduceva a paradossi che la mostravano tanto imperfetta quanto l’aritmetica di Pitagora.?9°
Qui Russell introduce un commento il cui contenuto non è ripreso in nessuna parte pubblicata della History: I paradossi si possono risolvere, ma sfortunatamente solo con metodi che gettano dubbi su cose che sono state accettate in matematica fin dal sedicesimo secolo. E tra le cose su cui essi gettano dubbi ci sono quelle che sembravano superare le difficoltà di Pitagora. 366
Appare qui evidente il riferimento alla teoria ramificata dei tipi dei Principia senza assioma di riducibilità: essa risolve sì 1 paradossi, ma rende impossibile fondare la teoria dei numeri reali con i metodi indicati da Weierstrass, Cantor, 0 Dedekind.5°”
La conclusione del manoscritto esaminato concorda perfettamente con ciò che Russell dice in una sintesi del suo lavoro filosofico scritta nel 1946: «Per me il risultato netto degli anni che ho dedicato ai principi della matematica fu che la soluzione di vecchi problemi consiste nel sollevarne di nuovi». Possiamo concluderne che, dopo la seconda edizione dei Principia, Russell considerava incompleto il suo lavoro sui fondamenti della matematica. Egli era ancora convinto della correttezza della tesi logicista, e anche della correttezza della soluzione dei paradossi attraverso una teoria dei tipi, ma non era più disposto, come lo era stato nel 1910, a difendere l’assioma di riducibilità. In un articolo del 1984, Ivor Grattan-Guinness scrive: Quando Russell, nel 1937, scrisse la prefazione alla ristampa di 7he Principles e proclamò che «La tesi fondamentale delle pagine seguenti, che la matematica e la logica sono identiche [sic!][®9°] è una tesi che finora non ho mai avuto nessuna ragione di modifica? < 370 re» [...], egli mostrava, temo, la sua età. i
Qui Grattan-Guinness sembra trascurare ciò che abbiamo visto in questo paragrafo: l’ultimo Russell non rivendicava la correttezza del logicismo perché fosse ottusamente convinto di aver fornito risposte definitive a tutti i problemi. Il suo atteggiamento era piuttosto quello dello scienziato che trae un bilancio, cosciente di non aver fornito 300 Ms., f. 58; in Vianelli [2001], p. 9-10. A
sopra, cap. 1, $ 1.2.
362 V. sopra, cap. 3, $$ 6-8.
363 V. sopra, cap. 3, $ 10. 304 Ms., f. 58; in Vianelli [2001], p. 10. 365 Ms., f. 59; in Vianelli [2001], p. 10.
3° Ibid.
3°? Il capoverso che, nell’edizione a stampa della History, sostituisce i sei capoversi esaminati si limita a ribadire l’influsso di Pitagora sulla metafisica e sulla religione successive, e ad accennare, senza ulteriori spiegazioni: «Solo in tempi molto recenti è stato possibile dire chiaramente dove Pitagora aveva sbagliato» (Russell [1945], libro I, cap. 3, p. 56; ediz. americana, p. 37). Il confronto tra i contenuti dei brani mi fa propendere per l’ipotesi che Russell abbia espunto il più lungo perché non lo considerava appropriato al contesto.
368 Russell [1946c], p. 72. 3°9 Interpolazione di Grattan-Guinness. 37° Grattan-Guinness [1984], pee/.o:
842
capitolo 12
risposte definitive, ma anche consapevole del valore del proprio lavoro nell’avanzamento di una scienza e fiducioso che altri, dopo di lui, avrebbero portato il suo programma a compimento. Può darsi che sbagliasse, ma ancora oggi, a più di quarant'anni dalla sua scomparsa, la sicurezza che egli avesse torto può derivare solo da un dogma-
tismo che rischia sempre di essere smentito da nuove acquisizioni.?!
2.7. SVILUPPI DELLA TEORIA DEI TIPI 2.7.1. LA TEORIA SEMPLICE DEI TIPI 2.7.1.1. Sebbene la soluzione dei paradossi semantici proposta da Ramsey non sia del tutto soddisfacente, la sua partizione tra paradossi logici e paradossi non formulabili in termini puramente logici fu largamente accettata, con il risultato che la teoria semplice dei tipi fu considerata più soddisfacente di quella ramificata (con assioma di riducibilità), per la stessa ragione addotta da Ramsey — cioè che la teoria semplice dei tipi non richiede nessun assioma di riducibilità.?”? La possibilità di risolvere i paradossi non logici secondo le linee indicate negli anni Trenta del MOren gno da Tarski confermò questa tendenza, per cui la teoria semplice dei tipi soppiantò quella originaria di Russell. La teoria semplice dei tipi, ST, è oggi abitualmente formulata in un linguaggio contenente infiniti stili di variabili, uno per ogni tipo n, ciascuno dei quali si può rappresentare con:
“wi”, no,
co
“x°?°,
co_Jlor
©“y 0, “20,
co_Noo
co_mMoo
co,
W°, Mor
cc
x
no,
«6
MV» nor
co
Z1
_M
0
“x3”, ..., dove “n” è una lettera schematica che sta al posto di un numerale per numeri naturali. Il linguag_ N
ES
gio di ST ha come unico simbolo primitivo il predicato diadico “e”; dunque tutte le sue formule atomiche sono «n PEION della forma “x° e y””, e sono ben formate se e solo se m = n + 1. Così, per esempio, “rl e y” è una formula ben formata, ma ‘oe y? non lo è. Le formule molecolari di ST sono costruite a partire dalle formule atomiche trami-
te l’uso di connettivi e quantificatori. n+1 = L’identità “x = y”, per ogni tipo n, si definisce in ST come “(2"*’)(x° e 2°*'>y'e z ab ; pertanto, in una formula ben formata del linguaggio di ST, ai lati del simbolo “=” possono comparire solo variabili che hanno lo
stesso indice di tipo. In ST le relazioni sono usualmente ridotte a classi di n-uple ordinate, e le n-uple ordinate sono ridotte a classi di classi con il seguente metodo, già indicato con chiarezza in Tarski [1933], $ 5, p. 242, nota.
Le coppie ordinate si definiscono come classi di classi con il metodo di Kuratowski, che identifica una coppia or-
dinata (x", y”) con la classe {{x"}, {x", y”}} — una definizione che assicura che una coppia ordinata (x", y”) sia uguale a una coppia ordinata (x;", y1”) se e solo se x° = xi" A y" = y1”.Î7* Una volta che siamo in possesso della definizione di coppia ordinata, le n-uple ordinate si possono definire ricorsivamente, ponendo: 00) =
27! Discuteremo ancora la tesi di Grattan-Guinness — che, nel contesto, si riferisce a un presunto scacco matto dato al logicismo russelliano dal primo teorema d’incompletezza di Gòdel — nel cap. 14, $ 2.2. Sia V., per es., Carnap [1931a]. 373 V. Fraenkel [1928], $ 15, 4, pp. 260-263; Carnap [1929], $ 9, pp. 19-22; Carnap [1931a], pp. 45-52; Tarski [1931], $ 1, pp. 113-116. In
Godel [1931] — il celebre articolo in cui è dimostrato per la prima volta il primo teorema d’incompletezza di Gòdel — è utilizzato un sistema chiamato “P”, che consiste in una teoria semplice dei tipi estensionale, con gli schemi di assiomi di comprensione e di estensionalità, ma senza assioma dell’infinito, dove gli individui sono i numeri naturali, le cui proprietà sono fissate dagli assiomi di Peano. Una teoria semplice dei tipi, con schemi d’assiomi di comprensione e di estensionalità e un assioma dell’infinito, è presentata nell’altrettanto celebre Tarski [1933], $ 5, pp. 241-243. Del periodo in cui avvenne il passaggio generale da una teoria dei tipi ramificata a una teoria dei tipi semplice offre una testimonianza il libro di Hilbert e Ackermann Grundziige der theoretischen Logik: nella prima edizione, del 1928, è presentato un “calcolo dei livelli” (Stufenkalciil) che non è altro che la teoria ramificata dei tipi dei Principia (v. Hilbert e Ackermann [1928], cap. 4, $$ 5-9), mentre nella seconda edizione, uscita nel 1938, è presentata una teoria semplice dei tipi (v. Hilbert e Ackermann [1938], cap. 4, $$ 5-6). Nella prefazione alla seconda edizione del libro, datata 1937 e firmata da Ackermann, si legge: «È stato possibile abbreviare il quarto capitolo in quanto non era più necessario addentrarsi nella teoria ramificata dei tipi di Whitehead e Russell, poiché essa sembra essere stata generalmente abbandonata» (Hilbert
e Ackermann
[1938], “Preface to the second (German) edition”, p. ix). Un passo di Alonzo
Church del 1939 conferma che, all’epoca, la teoria ramificata dei tipi era stata generalmente abbandonata: «Il sistema dei Principia ha anch'esso subito modificazioni dall’epoca della sua proposizione — la più importante delle quali è il rimpiazzamento, ora generalmente accettato, dell’originale teoria ramificata dei tipi con la cosiddetta teoria semplice dei tipi, con la conseguente eliminazione della necessità del molto contestato (e chiaramente inelegante) assioma di riducibilità» (Church [1941], $ 2, p. 69). VARE sopra, introduzione, nota 73.
Alternative, critiche e proposte di emendamento al sistema dei Principia
(IO
843
RT
Una coppia ordinata, definita come sopra, avrà un tipo di due volte più elevato dei suoi membri, cosicché, per es., una coppia ordinata di individui (entità di tipo 0) sarà di tipo 2, e una relazione tra individui (una classe di coppie ordinate di individui) sarà di tipo 3. Si osservi che, secondo questa definizione, in una coppia ordinata (x”, y”) il tipo di x, n, deve essere uguale al tipo di y, m. Infatti, x" e y” possono appartenere alla classe {x", y”} solo se n= m. Ne deriva che non possono esserci coppie ordinate di elementi di tipo diverso, e dunque non possono esserci relazioni tra elementi di tipi diversi (che invece sono possibili nella teoria dei Principia). A quest’inconveniente di ST, si pone riparo prendendo, al posto di una coppia ordinata (x°, y"''), la coppia ({x"}, y"*!, e, in generale, elevando il tipo dell’elemento della coppia con il tipo più basso, prendendo al suo posto la sua classe unità un numero di volte sufficiente a uguagliare il tipo dell’altro elemento. Gli assiomi non logici di ST sono: un assioma di estensionalità per ogni tipo, e un assioma di comprensione per ogni tipo, che si possono sussumere nei seguenti schemi di assiomi: STA)
(CADI
CAM
I(CAI CA e
STO
rey
ii
=
z" e
VE)
>
xt!
yy
00
= FA),
dove “F(x")” sta al posto di una formula ben formata di ST contenente la variabile rappresentata da “x” libera e non contenente la variabile rappresentata da “y"*!” libera. Il fatto che l’unica limitazione imposta alla formula ben formata rappresentata da “F(x")” dello schema ST(II) sia che essa non contenga la variabile “y"*! libera configura ST come una teoria impredicativa dei tipi. In ST è cioè possibile definire una classe x"*' attraverso una formula in cui compaiono variabili quantificate recanti indici di tipo maggiori di n, o variabili libere recanti indici di tipo maggiori di n + 1. Per avere una teoria predicativa dei tipi, si devono imporre alla formula rappresentata da “F(x°)” in ST(II) le ulteriori condizioni che essa non contenga nessuna variabile quantificata di tipo maggiore di n, né alcuna variabile libera di tipo maggiore di n + 1. Si osservi che ogni tipo n di ST contiene tutte le classi di elementi di tipo n — 1, e nessun’altra classe. Ciò è come dire che ogni tipo contiene esattamente l’insieme potenza della classe degli elementi del tipo precedente. Siccome l’insieme potenza di un insieme finito è a sua volta finito, ne deriva che, se il tipo 0 — quello degli individui —
ha un numero di elementi finito, in nessun tipo avremo un numero di elementi infinito. Ma, per derivare
l’aritmetica, è necessario avere, in qualche tipo, una progressione (infinita). Dunque si rende necessario in ST un assioma che garantisca che esistono infiniti individui. Ci sono diversi modi di formulare tale assioma. Nei Princi103
Ax!)(x' e x).
Più spesso, si formula l’assioma dell’infinito così:
SIR
da)
EEA
5
VE
NAEVARI)
Vv AZENDO)Ì
Questa formula dice che esiste una classe di classi di individui x, non vuota, tale che ogni suo membro, xl, è una
sottoclasse di un altro suo membro che ha almeno un elemento che non appartiene a x'. Altre volte, si trova formulato l’assioma dell’infinito in ST con la postulazione dell’esistenza di una relazione tra individui che non può avere un campo finito.
STAI”
(Ax) (A) By a 9 ea AMA)
€) A
EIA)
e
(ZA
MEV)
+).
375 Nei Principia non c’è bisogno di questo schema d’assiomi, perché — grazie alla riduzione delle classi a funzioni proposizionali — si dimostra il teorema *20.31:
2 (92)=î(y2)= (xe 2(p)=xe 2(v2)),
“Due classi sono identiche se e solo se hanno gli stessi elementi” (v. sopra, cap. 11, nota 347).
376 V. [PM], vol. II, *120.03.
844
capitolo 12
Questa formula dice che esiste una relazione, x, non vuota, tra individui (entità di tipo 0), che è irriflessiva (2° clausola) e transitiva (3° clausola), e dunque asimmetrica; in queste condizioni, la 4* clausola, affermante che per
ogni individuo ce ne dev'essere uno con cui il primo è nella relazione x° (cioè che ogni individuo è membro del dominio della relazione x) richiede che x° abbia un campo infinito. In ST i numeri non si definiscono come in ZF o
NBG, ma alla maniera di Russell, come classi di classi. Questo
perché un'espressione della forma “x e y°*! v x°= y"*!. che definirebbe la classe y°*' U {y"*!}, non è una formula ben formata di ST. 2.7.1.2. Come ha mostrato Quine,?”” è possibile tradurre (parzialmente) la precedente teoria in una teoria del primo ordine, ST‘, con un solo stile di variabile e l’unico predicato diadico primitivo “e”. Questo consente, come vedremo nel prossimo sottoparagrafo, di confrontare più agevolmente la teoria semplice dei tipi con la teoria di Zermelo. Per la traduzione si usa una tecnica ben nota, simile a quella che abbiamo già adoperato per esprimere NBG come teoria del primo ordine con un solo stile di variabile (v. sopra, alla fine del $ 1.1.3). Supponiamo di avere un’infinità di predicati “T,”, uno per ogni tipo n, cosicché “T,(x)” significhi “x è di tipo n°. Possiamo allora tradurre in ST' le espressioni di ST della forma “(x"*)(F(x°))”? con “)(T,() > F()”, e le espressioni della forma “(x°)(F(x°))? con “(4x)(T,(x) A Fx)”. Più precisamente, data un’espressione di ST, procederemo a tradurre le
sue sottoformule con quantificatori nell’ordine dalla più piccola alla più grande e da sinistra a destra (per cui se due sottoformule con quantificatori hanno la stessa lunghezza si prenderà per prima quella più a sinistra), e utilizzando a ogni passo variabili quantificate non utilizzate in precedenza. Si tratta dunque di mostrare che gli infiniti predicati T, si possono definire facendo uso solo di simboli logici e di “e” .??* Cominciamo con l’osservare che in ST, se x" e y” appartengono a una stessa classe, allora m = n e viceversa, se m= n, allora x* e y” appartengono a una stessa classe (per es., la classe universale di tipo n+1, V”* D, possiamo imporre questa condizione in ST' attraverso la definizione:
T,®)=Tn0)=a (92)
zAye 2).
Inoltre, in ST, se x" appartiene a una classe che ha lo stesso tipo di y”, allora x” e y” hanno tipi consecutivi, cioè m=n+
1; e inversamente, se x” e y” hanno tipi consecutivi, allora x” appartiene a una classe (la classe universale
V"*‘) che ha lo stesso tipo di y”. Possiamo imporre questa condizione in ST' con la definizione:
xTPy=ur (92)x e 2
AT,(2)=Tn0)),
dove “xTPy” significa “x è di tipo immediatamente precedente a quello di y”. Possiamo ora definire i predicati T, induttivamente, ponendo:
To) =a OM) -OTPx) T4100) sa WM(T,0) > yTPa). Gli assiomi ST(I) e ST(II) si possono ora tradurre in ST’ come segue:
STD
MOT)
AT,410) AT42(2)
A(W)(T,(M) 3 (we x=we y)po (xe zaye 2)”
377 V. Quine [1956], $ 3, e Quine [1969a], $ 37. 175 Per quanto segue, fino alla fine del sottoparagrafo, v. Quine [1956], $$ 3 e 4, pp. 271-274, e Quine [1969a], $ 37, pp. 268-270. 37° Per tradurre l’assioma di estensionalità di ST in ST'è necessario eliminare in esso l’identità, servendosi della definizione: x =y" Zar (3. Di
€
z+ Il> y: €
gt
Si
L’assioma ST(I) prende allora la forma: (du DICA
(49164 e et!
="
€
vb
>
("* Lal €
gt
ay
È
Pi DI.
cui si possono applicare le regole di traduzione, ottenendo:
(DO) (T+10) ATn+10) D(M(T,(MD> (we x=we )) 3 (2)(T,+:() > (xe zD ye 2), che equivale a:
0) A) (Tn4+ 10) ATn4 1) ATh42() che è la formula data nel testo.
A(W(T,(W)> (We x=we
yo re zdye
2),
Alternative, critiche e proposte di emendamento al sistema dei Principia
STD
E),
)AMTMp> Xe y=F)).
Con la stessa strategia si può tradurre dell’infinito di ST‘; per esempio:
STI)
845
una delle versioni
dell’assioma
dell’infinito
di ST
in un assioma
(A) (TX) A (Ay)(T,0) A y € x) A (Ti)
Aye
x 2 (42)(T;(z)
Aze
xAyCZA(AW)(To(MAwE
zAWE
y)))).
Si osservi che questa traduzione di ST in una teoria del primo ordine con un solo stile di variabile non rispetta una caratteristica di ST che era propria anche della teoria dei Principia: mentre in ST un’espressione come, per es., “(Ax*)(4y”)(x° e y”)” è priva di senso (malformata) se m # n + 1, la sua traduzione in ST": “(3x) (3y)(T,(®) A T,(y) Ax € y)” è semplicemente falsa, nelle stesse circostanze. Ciò non comporta però una reintroduzione del paradosso di Russell in ST‘, infatti, la seguente istanza di ST'(II):
Ti
M)AMTMpire
ar»),
consente di formare solo la classe di tutte le classi di tipo n che non appartengono a se stesse, ma questa classe non è, a sua volta, di tipo n e dunque, semplicemente, non appartiene a se stessa. Questo è interessante, perché ì MO RIE RAI : E 9 RA, mostra come, in ST (e nei Principia), il paradosso di Russell sia in realtà bloccato da due meccanismi distinti:
(1) L’espressione “x” € x” non è ben formata. (2) Anche se “x° € x” fosse ben formata, non potemmo sostituire
Il
°°,
quindi syy°*! non è uno degli x” su cui varia la variabile
quantifica-
(3
2
erché non sono termini dello stesso tipo, e
a
“y"*'
(43
li
a “x” in (13
1A}
RE
(43
“a
e y°° ax
ta.
In ST’, il paradosso di Russell rimane bloccato solo dal meccanismo (2). Sebbene si possa dimostrare che i teoremi di ST sono tradotti in corrispondenti teoremi di ST, ci sono in ST'
formule che non sono la traduzione di formule di ST. Una di esse esprime, in parte, una caratteristica di ST che, finora, non è rispecchiata in ST‘. Si tratta della formula: “)(Y)(x € y > (T,(0) = T,41)))”. Essa non è dimostra«ll bile in ST‘, ma esprime (in parte) ciò che in ST è rappresentato dal fatto che in una formula ben formata “x" e y”” si deve avere m= n + 1. E dunque naturale assumerla come ulteriore assioma di ST":
STIV*
MO0Ge yo (T.@)=T10)
Dicevamo che ST'(IV)* esprime in parte una caratteristica di ST, perché non afferma realmente che se x € y, allora x deve avere un tipo immediatamente precedente quello di y, ma afferma che, se uno dei due termini della relazione di appartenenza x e y ha un tipo, allora x deve avere un tipo immediatamente precedente quello di y. Non si può fare di meglio, in ST', perché non si può formulare la condizione secondo cui ogni oggetto su cui variano le variabili di ST' appartenga a un tipo o a un altro: il problema è che non possiamo usare formule del tipo “An)T,(x)”, perché qui la “n° non è una variabile (vincolabile), ma una lettera schematica (metalinguistica).**° Quine mostra come, assumendo ST'(IV)*, si possono semplificare gli assiomi ST (1) e ST'(II), riducendoli a: SRT'O)*
MODA
STAD*
Tai
AT)
AW)(W e x=we
yo xe zIye
Z2)),
By)(T, 10) AMre y=T,() A FM).
380 L’osservazione si deve a Quine ([1969a], $ 34, p. 249, e $ 37, p. 269). 381 v_ Quine [1956], $ 3, p. 272, e Quine [1969a], $ 37, p. 271. 382 v. Quine [1969a], $ 37, p. 271. 383 v. Quine [1956], $ 3, p. 272, e Quine [1969a], $ 37, p. 271. (Le dimostrazioni sono delineate solo in Quine [1956], $ 3, p. 272.) ST'(D* si dimostra da ST'(1) e ST'(IV)* come segue. L’assioma
ST'D
MM
(Tn410) ATn410)
ATn+2(2)
AW)(T,(M)D>(Wex=we
ox
zIye z))
equivale a
(0)
(A) (Tn4 10) AT,410) AMW(T,(M > (We x=WwE y)) > (Ty 4.(2) > (xe zDy e 2))),
e quindi, a
846
capitolo 12
Le condizioni “T,, (x) e “T,4 1(y)”, in ST'D)* e ST'A1)*, impediscono l’identificazione degli insiemi vuoti di tutti i tipi e la fusione di tutti gli individui che non sono insiemi in un’unica entità. In una teoria dei tipi, non si può consentire l’identificazione di tutti gli Urelemente, perché questo renderebbe impossibile l'assioma dell’infinito, e quindi lo sviluppo dell’aritmetica e dell’analisi. Quine osserva che si può invece liberalizzare la teoria dei tipi identificando tutti gli insiemi vuoti di tutti i tipi, cioè non distinguendo tra insiemi vuoti di tipi diversi. In quest’ultimo caso, gli assiomi ST‘) e ST'II)* si possono riformulare così:
STO STD
@MO0)A-T0 A-T0) A (Wwe awe Ey)(-T0) A Me y= Ty) A FM).
In ST"),
le condizioni
“Ty”
e “Tyy)”
assolvono
Ge
zIye 2),
una delle due funzioni
che le clausole “T,, (x) e
“T,41(y)” hanno in ST'(1)*, cioè quella di impedire che l’assioma di estensionalità identifichi gli individui con
l’insieme vuoto — ma non distinguono tra insiemi vuoti di tipi diversi. In ST"(I1), la condizione “-Ty(y)” assolve una delle funzioni della condizione “T,, ;(y)” di ST'(I)*: permette di dimostrare l’esistenza di una classe vuota — ma non di una classe vuota distinta per ogni tipo. ST'(I) e ST"(IT) configurano dunque un sistema ST" che semplifica ST”.
2.7.1.3. Possiamo ora seguire Quine nel rilevare alcuni rapporti tra la teoria dei tipi e la teoria di Zermelo. Quine osserva che gli assiomi di Zermelo si possono riformulare, in una teoria del primo ordine con un solo stile di variabile, assumendo, oltre al predicato “e”, un altro predicato primitivo “7”, tale che “7(x)” significhi “x è
un individuo (è di tipo 0)”. Ciò che ne risulta è il sistema che chiameremo Z'. Z' è come il sistema Z che abbiamo descritto nel $ 1.1.3, con la differenza che, come nei sistemi originali di Zermelo, in Z' si ammette la possibilità dell’esistenza di Urelemente, cioè di individui che non sono insiemi.
L’assioma di estensionalità di Z' è formulato da Quine così: (i) MO (A (TM
AT
MAMT(W) 3 (We x=we y)) 3 (Ta) Axe ze
2).
Poiché
(i @>(4=N)=Ag=pr7)
è una tautologia (v. [PM], vol. I, #5.32), (i) equivale a
Gi) MO (ATM
ATM
AMAT)
WE x=T,(w) Aw E Y)) 3 (Tr4a(2)
Axe zDyE 2).
Dall’assioma
ST (IMt@Mey>o
(AK, =T,:10),
e da (ii) si ottiene:
(iv). Mery
AT,A)=xeyATr+10).
Sostituendo ora in (iii), a “T,(w)
MV) MOT)
Aw e x? e “T,(W)
ATn41M) AMT
MAwe
Aw e y” le loro equivalenti secondo (iv), si ha:
x=T, 4) AWwE y)) 2 (Tu+2(2) Axe zDye
z)),
che, poiché
(vi)
PAg)A(pAr=qns)=(pAq)A(r=s)
è una tautologia, equivale a
(vi)
DO (AT)
ATn41M)
AMW)(Wwe x=we y) 2 (Tu4o() Axe z>y e 2),
che, ancora per (iv) equivale a
(vii) MOT
1A Ta41MAMWwex=we
y))3 (Tsi Axe z>ye 2),
che implica direttamente ST' (1)*, perché la condizione “T,,, j(x)” che compare nel conseguente è già garantita dalla medesima condizione dell’ antecedente. La dimostrazione di ST' (I1)* da ST'(II) e ST'(IV)* è simile. L’assioma
STD
AT,
MAMT,M>
Ae y= Fa),
in virtù della tautologicità di (ii), equivale a
(ix) E) (Thai) A MAT, Axe y=T,) AF). Sostituendo in (ix) a “T,.(x) A x e y” la sua equivalente secondo (iv), si ha:
(A) AT
MATA
xe
y=T,) AF).
Poiché
(xi) pafpAg=r=pA(qg=1) è una tautologia, (x) equivale a
(xii) (A) (T,41M) AMxe
y= T,() A FM),
che è la formula ST'(I)*.
384 V. Quine [1956], $ 4, p. 274. 285 Per quanto segue, fino alla fine del paragrafo, v. Quine [1956], $ 5, pp. 274-277.
Alternative, critiche e proposte di emendamento al sistema dei Principia
ZD
MAT
A -T0) A (MWwe x=we y)> (xe z>ye
847
2),
dove le condizioni “-Ty(x)” e ‘“—Ty(Y)” servono per impedire che l’assioma di estensionalità identifichi gli individui con l’insieme vuoto. Z'(1) equivale evidentemente all’assioma di estensionalità di ST", cioè di una teoria dei
tipi in cui non si distingue tra insiemi vuoti di tipi diversi. L’assioma dell’insieme coppia di Z' è identificato da Quine con il corrispondente assioma di Z, cioè: ZI)
MMAZ)MWwe
z=w=xvw=y.
Quest’assioma non vale in ST perché se x e y sono di tipi diversi non è possibile formare la coppia {x, y}. L’assioma di separazione di Z' è così formulato da Quine:
ZI)
Mayo)
1 (ze y=ze x A F(2))).
La condizione ‘“-Ty(y)” ha qui la funzione di permettere di dimostrare l’esistenza di una classe vuota. Z'(III) è vero anche nell’ontologia della teoria dei tipi di ST”. Infatti, l’enunciato
ME (-T0) A (ze y= T,(2)
AZE x A F(2)))
è un’istanza di ST"(II), da cui si può eliminare la condizione “T,(z)”, se si assume che ogni membro della relazio-
ne di appartenenza di ST" appartenga a un tipo (cosa che è vera in ST, e dunque rimane vera nell’ontologia intesa di ST' e ST", sebbene, come abbiamo già osservato, non possa essere postulata in ST' e, ovviamente, neppure in
STO) Quine formula l’ assioma dell’insieme potenza di Z' così:
Z'IV)
MEpaze
y=-To(2) Am)
e zD A E»).
Qui la condizione ‘“—Ty(z)” assolve la funzione di impedire che tutti gli individui si trovino ad essere sottoinsiemi di ogni insieme dato x. Z'(IV) è vero anche nell’ontologia di ST"; infatti, l’enunciato
MAay)aZe y=T.()
A)
e
IA e 1)
è implicato da un’istanza di ST"(II). Qui, la condizione “T,(z)”, assicurando che i membri di y siano di tipo omo-
geneo, ha la funzione di impedire che tutti gli individui divengano membri dell’insieme dei sottoinsiemi di qualsiasi insieme x. Inoltre, prendendo n= 0, dimostra l’esistenza di un insieme di tutti gli Urelemente.
In ST", la
clausola “T,(z)” della formula precedente si può sostituire con ‘“-To(z)”, perché, comunque, l’esistenza dell’insieme di tutti gli individui è assicurata, in ST" dall’istanza di ST'(II) consistente nel prendere n = 0 e F(x) = Ty(x), cioè:
(A) (-To0) A (Mx e y= To). Anzi, come mostra Quine,*° da quest’ultima formula in unione con Z'(III) e Z'(IV), si ricava ST"(I1). Infatti, avendo dimostrato l’esistenza dell’insieme di tutti gli Urelemente, attraverso Z'(IV) si dimostra l’esistenza dell’insieme di tutti i suoi sottoinsiemi, e poi ancora dell’insieme di tutti i sottoinsiemi di quest’ultimo insieme, e
così via. Ciò garantisce l’esistenza, per ogni tipo n di un insieme che raccoglie tutti gli insiemi di tipo n. Ma allora, prendendo l’insieme x dell’assioma Z'(III) come l’insieme di tutti gli oggetti di tipo n, si ottiene ST"(II). L’assioma dell’insieme unione di Z' è identificato da Quine con il corrispondente assioma di Z, cioè:
Z'IV) MApaze
y= (Am) € x Ax € 2).
386 Vv. Quine [1956], $ 5, p. 277.
848
capitolo 12
Quest’enunciato è vero anche nell’ontologia della teoria dei tipi di ST". Infatti, l’enunciato
My
e y= T,(2) A (Am) (ze x Ax € 1),
è implicato da un’istanza di ST'(II), e la condizione “T,(z)” si può eliminare da questa formula, se si assume che ogni membro della relazione di appartenenza di ST" appartenga a un tipo.
L'assioma dell’infinito di Z' è identico al corrispondente assioma di Z, e non vale nella teoria semplice dei tipi per lo stesso motivo per cui non vale incondizionatamente l'assioma della coppia: insiemi di tipi diversi non possono far parte dello stesso insieme. L'assioma dell’infinito e l'assioma della coppia di Zermelo valgono però anche nella teoria dei tipi, se si passa dalla teoria appena descritta alla teoria cumulativa dei tipi, che descriveremo
nel prossimo paragrafo.
2.7.2. LA TEORIA CUMULATIVA DEI TIPI Abbiamo visto che in ST le espressioni della forma “x" e y””” devono essere tali che m = n + 1. La teoria cumulativa dei tipi liberalizza questa condizione, richiedendo solo che m > n. Il modello intuitivo che sta sotto la teoria cumulativa dei tipi è molto simile a quella concezione iterativa che Boolos descrive come base per la sua teoria degli stadi (v. sopra, $ 1.1.4): in ogni tipo (stadio) esistono (si formano) non solo tutte le classi di oggetti del tipo immediatamente precedente, ma tutte le classi di oggetti di tutti i tipi precedenti. Questo significa che una medesima classe è presente in tutti i tipi successivi a quello in cui appare per la prima volta. Per esempio, una classe costituita da due individui sarà presente per la prima volta nel tipo 1, e si riformerà ancora in tutti i tipi, 2, 3, 4, ...
successivi al primo; una classe costituita da un individuo e una classe di individui comparirà la prima volta nel tipo 2, e sarà ancora presente in tutti i tipi successivi al secondo. La differenza, rispetto alla teoria descritta da Boolos, è che nella teoria cumulativa dei tipi non si assume necessariamente che esistano tipi transfiniti.**” Si può formulare la teoria cumulativa dei tipi, come ST, in un linguaggio contenente il solo simbolo primitivo €”, e infiniti stili di variabili, uno per ogni tipo n, ciascuno dei quali si può rappresentare con: “x”, “y?”?, “2°”, (13
ce,
Mor
W°,
cc
Nor
x”,
cc
TSI
“yi,
(6_Mor
217,
6
nor
“W°”,
cc
N99
BS
“x”, ..., dove “n°” è una lettera schematica che sta al posto di un numerale per
numeri naturali. Chiamiamo “CST” questa teoria, che adesso descriveremo. Poiché l’unico simbolo primitivo del linguaggio di CST è il predicato diadico “e”, le sue formule atomiche sono della forma “x° e y””, e sono ben formate — come abbiamo già osservato — se e solo se m > n. Gli assiomi non logici di CST sono rappresentati dagli schemi di estensionalità e di comprensione e da un assioma dell’infinito. Lo schema d’assiomi di estensionalità è:
UOC
A
A CA
ADLI
dove n > 0 e l’identità è definita così:
ryan)
e 2Dy'e 2°),
conn» 5)
In ST (come nella teoria dei tipi dei Principia), inoltre, l’ aritmetica non è più unica, ma si riproduce in tutti i tipi superiori al secondo: in ciascuno di essi vi sarà una nuova serie 0, 1, 2, 3, ..., ecc. Scrive Quine: Un effetto particolarmente innaturale e scomodo della teoria dei tipi è l’infinita reduplicazione di ciascuna classe definibile logicamente. Non vi è più una classe universale V a cui appartiene ogni cosa, perché la teoria dei tipi richiede che i membri di una classe siano simili riguardo al tipo. La stessa reduplicazione interessa tutte le altre classi definibili in termini logici; anche i numeri 0, 1, ecc. perdono la loro unicità, dando adito a un duplicato per ogni tipo. Questa reduplicazione è particolarmente strana nel caso della classe nulla. Si ha la sensazione che le classi dovrebbero differire solo riguardo ai loro membri, e questo ovviamente non è vero delle varie classi nulle. Un’unica classe nulla sembrerebbe infatti an-
388 Chihara [1980], p. 27.
850
capitolo 12 cora possibile, in modo vacuo, se pensiamo solo al requisito che i membri siano simili riguardo al tipo. Tuttavia, sarebbero violati altri requisiti della teoria dei tipi. Per esempio, vogliamo che la classe nulla sia inclusa in ogni classe; quindi, poiché si considera come privo di significato correlare classi di tipo diverso mediante l’inclusione, abbiamo bisogno di una nuova classe nulla che dev’essere inclusa in ciascuna classe di nuovo tipo. 389 Le costanti “V”, “A”, “0”, “1”, ecc. sono così “tipicamente ambigue”, proprio come nel caso delle variabili.
Fra il 1937 e il 1940, Quine propose due sistemi fondazionali che, pur prendendo le mosse da una teoria semplice dei tipi, risultano immuni da queste critiche. In questo paragrafo, esamineremo tali sistemi. Il primo dei menzionati sistemi fondazionali è oggi noto con la sigla “NF” — dalle iniziali delle prime due parole dell’articolo di Quine “New foundations for Mathematicai logic” (1937), in cui fu esposto per la prima volta. NF è una teoria del primo ordine con identità, nel cui linguaggio è presente il solo predicato primitivo “e”. Oltre agli assiomi logici, che consentono di derivare la logica proposizionale e predicativa del primo ordine, NF contiene: un assioma di estensionalità, secondo cui una classe è determinata dai suoi membri:
NFI)
MM)
x=ze )Dx=)),
dove “x = y” è definito come ‘(z)(x € z= y € 2)”; e uno schema d’assiomi di comprensione:
NF
Ay)@mMe y= F0),
dove “F(x)” sta al posto di una formula ben formata del linguaggio di NF che non contiene la variabile ‘y” libera. Questa non è però l’unica restrizione posta sulla formula rappresentata da “F(x)”, perché se lo fosse NF(II) darebbe immediatamente luogo al paradosso di Russell. Per spiegare quale restrizione ulteriore intende porre su NF(II), Quine prende le mosse da un esame del modo in cui il paradosso di Russell è evitato nella teoria (semplice) dei ti-
pi: La difficoltà, nota come paradosso di Russell, era superata nei Principia dalla teoria dei tipi di Russell. Semplificata per l’applicazione al presente sistema, la teoria funziona come segue. Dobbiamo pensare tutti gli oggetti come stratificati in cosiddetti tipi, tali che il tipo più basso comprende gli individui, il successivo comprende classi di individui, il successivo comprende classi di tali classi, e così via. In ogni contesto, ciascuna variabile si deve pensare tale da ammettere valori solo di un singolo tipo. Si impone la regola, infine, che (ae 8) [Quine usa qui “@?° e “8” come variabili metalinguistiche su variabili del linguaggio oggetto, e non, secondo l’uso di Russell, come variabili del linguaggio oggetto per classi; “@ e f” è inteso denotare la formula ottenuta concatenando la variabile & il segno di appartenenza e la variabile 8] debba essere una formula solo se i valori di f sono del tipo immediatamente successivo a quello di @ altrimenti (@ € /) è reputata né vera né falsa, ma priva di senso. [...]
In tutti i contesti i tipi appropriati alle diverse variabili si lasciano in realtà non specificati; il contesto rimane sistematicamente ambiguo, nel senso che i tipi delle sue variabili possono essere costruiti in qualsiasi modo conforme al requisito che “e” connetta variabili solo di tipi consecutivamente ascendenti. [...] Così una formula nel nostro senso originale sopravvivrà nella teoria dei tipi se è possibile porre numerali al posto delle variabili in modo tale che “€” venga a comparire solo in contesti della forma “n e n+ 1”. Le formule che passano questo test si chiameranno stratificate.?°
L’idea di Quine è di considerare, invece, come formule ben formate di NF, anche le formule non stratificate,
limitando però NF(II) in modo che la formula rappresentata da “(x)” in quello schema d’assiomi, possa essere solo una formula stratificata. Più precisamente, una formula di NF è stratificata se e solo se, una volta eliminate, in essa, tutte le notazioni definite, è possibile assegnare a ogni variabile che vi compare un numerale, attribuendo alla stessa variabile uno stesso numerale ogni volta che si trova libera, e uno stesso numerale ogni volta che si trova vincolata dal medesimo quantificatore — ma con la possibilità di assegnare a più variabili lo stesso numerale — in modo che, per ogni occorrenza nella formula del predicato “e”, il numerale assegnato alla variabile che segue immediatamente “e” sia il successore immediato di quello assegnato alla variabile che precede “e”.?! Così,
38° Quine [1938], $ 3, p. 131. Le medesime osservazioni si trovano in Quine [1937a], pp. 91-92, e in Quine [1940] e [1951a], $ 29, p. 164.
3°0 Quine [1937a], pp. 90-91. 3°! Per stabilire se una formula di NF è stratificata, si può procedere attraverso l’algoritmo seguente (v. Hatcher [1968], $ 39, pp. 338-339): si eliminano da essa tutti i termini definiti, restando con la notazione primitiva; si riscrivono poi le variabili della formula in modo che la
stessa variabile non compaia sia come variabile libera sia come variabile vincolata, né compaia in più quantificatori; si prende poi una variabile qualsiasi e le si sostituisce uniformemente (cioè in tutte le sue occorrenze) il numerale “0”. Poi si applicano ricorsivamente, finché è possibile, le regole: (1) se la formula restante contiene una sottoformula del tipo “n e y”, dove “n° è un numerale, si sostituisce uniformemente a y il numerale “n + 1”; (2) se la formula restante contiene una sottoformula del tipo ‘x € n” si sostituisce uniformemente a x il nu-
Alternative, critiche e proposte di emendamento al sistema dei Principia
851
per esempio, “x e y”, “(x e y)”, “(An (A))x e y) A (Ax) (ay) € x)” sono formule stratificate, mentre “x € x°, “Ax e x) e “(Av)(Ay)((x € y) A (y € x))” non sono stratificate. Si osservi che una concatenazione, mediante connettivi, di formule stratificate non è sempre, a sua volta, una formula stratificata: per es., “x € y” e “y e x° sono stratificate, mentre “x € yA ye x” non lo è. Poiché “x= y” è definito in NF come “(2)(xe 22 ye 2)”, un'espressione del tipo “x = y” sarà stratificata se e solo se è possibile assegnare lo stesso numerale a “x” e a “y”, cosa che si verifica, per es., in “x= y”, o “x= yA ze x”, ma non, per es., in “x=yAx€ y” — una formula, quest’ultima, che pure e composta di formule stratificate. Gli enunciati atomici di NF sono tutti della forma “x € Y”, perché in NF le relazioni sono ridotte a classi di n-uple ordinate, e queste sono definite sulla base della riduzione delle coppie ordinate a classi di classi con il metodo di Kuratowski. La condizione di stratificazione blocca la derivazione del paradosso di Russell perché la formula “-(x € x)” non è stratificata. Più in generale, essa impedisce la derivazione di un numero infinito di paradossi dello stesso genere di quello di Russell ciascuno dei quali si ottiene definendo una classe attraverso un’espressione contenente 66.39
6,9?
quello che Quine ([1938], $ 2, pp. 127-128) chiama un “e -ciclo”, cioè attraverso definizioni della forma:
Me
w) =)... Me
yi A... Aya e
E infatti evidente che nessuna formula contenente un e -ciclo può essere stratificata. Questa teoria, osserva Quine, elimina le reduplicazioni della classe nulla, della classe universale e degli stessi
numeri all’interno di ciascun tipo successivo a quello in cui sono definibili per la prima volta: Nel nuovo sistema c’è solo un’algebra booleana delle classi; la negazione —x abbraccia qualsiasi cosa non appartenga a x; la classe
nulla A è unica; e così è la classe universale V, a cui appartiene assolutamente ogni cosa, inclusa V stessa. [...] Il calcolo delle relazioni riappare come un singolo calcolo generale che tratta di relazioni senza restrizione. Similmente i numeri riprendono la loro unicità, e l’aritmetica la sua applicabilità generale come singolo calcolo.
Il complemento di una classe x è una classe perché l’espressione —(y € x) è stratificata, cosicché la sua esistenza è garantita dall’assioma NF(II). Analogamente,
la classe vuota, A, e la classe universale, V, esistono in virtù di
NF(II), perché le espressioni “-(x = x)” e “x = x” sono stratificate. Una caratteristica positiva di NF è che, non essendoci limiti alla grandezza di una classe, i numeri cardinali e i numeri ordinali si possono definire alla maniera di Russell, rispettivamente, come classi di classi e classi di relazioni seriali ben ordinanti, così da concepire i nu-
meri ordinali come particolari tipi d'ordine, e i tipi d'ordine come particolari numeri-relazione. Questo è il metodo effettivamente seguito da Quine.?°* merale “n — 1”. Se, applicando questo procedimento, si giunge infine a una formula in cui restano variabili, si prende ancora una qualsiasi delle variabili rimaste e le sostituisce ancora uniformemente il numerale “0”, ripetendo l’intero procedimento, finché si verrà a violare il
criterio della stratificazione, oppure si troverà un’assegnazione di numerali alle variabili che provi che la formula iniziale è effettivamente stratificata. 392 V. sopra, cap. 4, $ 2.2.
393 Quine [1937a], pp. 92-93. 3% Hatcher ([1968], $ 39, p. 343 e p. 347, e [1982], $ 7.1, p. 217 e p. 220) sembra affermare che in NF non sia possibile definire i numeri con il metodo di von Neumann perché l’esistenza di una classe y U {y} non sarebbe garantita, in NF, in quanto definita da una condizione
non stratificata. In realtà, questa difficoltà si può superare perché, sebbene effettivamente l’esistenza di una tale classe non si possa ricavare direttamente attraverso NF(II) — poiché richiederebbe l’uso di una formula non stratificata come “x € yV x=y° — si può ricavare per via indiretta. Infatti, una formula del tipo “x € y v x = 2” è stratificata, e consente di dimostrare, via NF(II), l’esistenza di una classe y U {z}
per ogni y e ogni z. Ma allora, sostituendo y a z, otteniamo la dimostrazione dell’esistenza della classe y U {y}. (Quine chiarisce questo punto in [1969a], $ 40, pp. 289-290.) Ciò mostra, in generale, che la stratificazione della formula definente una classe non è necessaria per dimostrare in NF l’esistenza della classe stessa. In realtà, come notano Fraenkel e Bar-Hillel in Foundations of Set Theory, il requisito di
stratificazione della formula rappresentata da “(x)” in NF(II) si può intendere come limitato alla variabile “x” e alle variabili vincolate che
compaiono nella formula rappresentata da “F(x)”, nel senso che ogni istanza dello schema d’assiomi NF(II) ottenuta per mezzo di una formula rappresentata da “F(x)”con il requisito di stratificazione così limitato sarà un teorema di NF (v. Fraenkel, Bar-Hillel e Lévy [1973], cap. 3, $ 3, pp. 162-163, nota 2).
Le difficoltà nel definire in NF i numeri con il metodo di von Neumann stanno piuttosto nel formare, in NF, classi di numeri di von Neumann e nel fatto che in NF ciascuna delle classi @ che in ZF, o NBG, sarebbe un numero ordinale di von Neumann non è ben ordinata dalla
relazione di appartenenza: infatti, dato un @ siffatto, la relazione che gli assegna un buon ordine dovrebbe essere € ristretta ad & cioè la classe delle coppie ordinate (y, z) tali che (ye
z Ay€ @Az€ 0); mala condizione per x: x=(y,z) AVE ZAYE QANZE 0) non è stratificata, e quindi NF(II) non garantisce l’esistenza della classe di coppie ordinate definita da tale formula. La cosa non ha impor-
852
capitolo 12
Come il sistema NBG, anche NF può essere assiomatizzato in modo finito: vale a dire, si può sostituire lo schema d’assiomi NF(II) con un numero finito di assiomi che consentono di formare particolari classi. Il sistema NF si può considerare come una realizzazione di quella “teoria dello zigzag” che era stata indicata da Russell, in “On some difficulties in the theory of transfinite numbers and order types” (1905), come possibile soluzione ai paradossi. Si può considerare tale, perché ha le caratteristiche che Russell aveva indicato come distinti-
ve di questo tipo di teoria rispetto a una teoria della limitazione di grandezza: l’esistenza del complemento di una classe che include tutto ciò che non è in essa compreso; la possibilità di definire i numeri come classi di classi, 0 classi di relazioni; l’esistenza di una classe universale comprendente assolutamente ogni cosa, e quindi di un numero cardinale massimo.?° Le condizioni che Russell descriveva nel 1905 come «complicate e oscure»,” che non si assume determinino classi, sono in NF precisamente /e formule non stratificate. Ma l’esistenza di una classe universale non porta a una contraddizione con il teorema di Cantor? Quine dà una risposta in una nota che abbiamo omesso all’ultimo brano riportato: Poiché tutto appartiene a V, tutte le sottoclassi di V si possono correlare con membri di V, cioè, con se stesse. In vista della dimostrazione di Cantor che le sottoclassi di una classe £ non possono essere tutte correlate con membri di &, ci si potrebbe aspettare di derivare una contraddizione. Non è chiaro, tuttavia, che ciò si possa fare. La reductio ad absurdum di Cantor di tale correlazione consiste nel formare la classe 4 di quei membri della classe originale X che non appartengono alle sottoclassi cui sono correlati, e quindi nell’osservare che la sottoclasse 4 di non ha correlato. Poiché nel caso presente % è V e il correlato di una sottoclasse è quella sottoclasse stessa, la classe A diviene la classe di tutte quelle sottoclassi di V che non appartengono a se stesse. Ma R3” [l'assioma che noi abbiamo chiamato NF(II)] non provvede una tale classe A. In effetti, 4 sarebbe $ —(y € y), la cui esistenza è confutata dal paradosso di Russell.3°8
Anche questo, Russell l'aveva previsto in “On some difficulties...”’, laddove si legge che, nel contesto della teoria dello zigzag, «la difficoltà del più grande cardinale si affronta negando che le funzioni definenti le classi 0messe di Cantor siano predicative in certi casi».’”’? In NF la caratteristica della predicatività è tradotta in quella della stratificazione. Cerchiamo di approfondire la questione del teorema di Cantor in NF. 400 Abbiamo visto che in NF si dimostra l’esistenza di una classe universale V, includente tutte le classi; a partire da ciò, è facile dimostrare che V = CINE cioè che V è cardinalmente simile al suo insieme potenza. Infatti, poiché ogni elemento di V è una sotto-
classe di V (Quine ammette l’esistenza di individui, ma li identifica con particolari classi: v. sopra, nota 33), e 0gni sottoclasse di V appartiene a V, si ha che (x)(xe V= xC V), ma poiché si ha anche, per definizione di “CIV”, Mx e CIV = xC V) (una definizione consentita da NF(II)), si ottiene (x) (x e V= x e CI°V), e quindi, per NF(1), V = CI°V. Ciò non sfocia in una contraddizione perché la dimostrazione del teorema di Cantor in NF è bloccata. Vediamo come. L'argomento cantoriano secondo cui un insieme & deve sempre avere un numero cardinale diverso dal suo insieme potenza, Cl‘°k, procede supponendo che vi sia una relazione uno-uno f che correla 0gni elemento x di una classe £ con una sottoclasse di £, e definendo poi la classe 4 degli elementi di £ che non appartengono alle sottoclassi di £ cui sono correlati: (I) xe h=xekAM)(x ye f>xey) infine si osserva che, contro la supposizione iniziale, la sottoclasse A di X non ha nessun correlato in k. Vediamo perché. Se 4 avesse un correlato w in k, avremmo:
tanza per i numeri ordinali di von Neumann finiti, perché essi sono classi che hanno comunque un tipo d’ordine fissato dal numero dei loro elementi, ma ha importanza per inumeri ordinali di von Neumann transfiniti, perché in NF non vi sarà nessuna garanzia che i numeri ordinali di von Neumann transfiniti siano effettivamente numeri ordinali del sistema NF — cioè insiemi di NF per cui è fissato un buon ordinamento definito. 39 Gli assiomi sono del tutto simili a quelli menzionati sopra, nella nota 85 di questo capitolo, a proposito del sistema NBG.
39 397 298 29 400
V. Russell [1906a], $ II, pp. 146-148. Russell [1906a], $ II, p. 146. Quine [1937a], pp. 92-93, nota. Russell [1906a], $ II, p. 148. Sull'argomento si vedano Quine [1937b] e Hatcher [1968], $ 40, e [1982], $ 7.2.
40! Per le definizioni di [PM] (vol. I, *60.01 e +30.01), Cl'a= vol. I, #22.01).
%(xc 0. Dove “ac p” è definito come “(xe
a> xe 6)” (v. [PM],
Alternative, critiche e proposte di emendamento al sistema dei Principia
853
(ii) we KA((w, h)e fl. Chiediamoci, w appartiene a 4? Dalla definizione di A, (i), otteniamo:
(iii)
we
h=we
kKAM((Mm,y)e
faowe
y);
prendendo nella (iii) 4 come y, si ha: (iv)
we
h=swekA((W,h)e
f>we
h),
una formula che, insieme alla (ii), implica la contraddizione “w e h= w & A”. Pertanto, la sottoclasse 4 di £ non può avere nessun correlato in £. In NF questa dimostrazione è bloccata, perché la condizione (i) che definisce la classe 4 non è stratificata," e poiché l’assioma NF(II) ci garantisce solo l’esistenza di classi definite da formule stratificate, esso non ci garantisce che la classe A esista.
Poiché nella teoria semplice dei tipi ST tutte le formule ben formate devono essere stratificate, e poiché anche in ST le coppie ordinate sono ridotte a classi secondo il metodo di Kuratowski, si ha che nemmeno in ST il teorema di Cantor è dimostrabile, nella forma illustrata sopra. Tuttavia, in ST è dimostrabile una forma del teorema di
Cantor che asserisce che l’insieme potenza di un insieme deve avere un numero cardinale diverso dall’insieme formato da tutti gli insiemi unità degli elementi dell’insieme di partenza (per esempio, se l’insieme di partenza è {a, b}, l'insieme formato da tutti gli insiemi unità dei suoi elementi è {{a}, {b}}). Questo teorema è dimostrabile anche in NF. Infatti, la condizione seguente:
(i) xe h=xce KAM({x},y)e fo xe y), diversamente da (1), è stratificata, e consente di replicare il ragionamento precedente dimostrando in NF che la classe di tutte le sottoclassi unità (cioè di un solo elemento) di una classe £ — nella simbologia dei Principia, È 3 3 È E fc: È È SEECE 1 5 1‘‘k'9 — non è cardinalmente simile alla classe potenza di k, CI‘k, cioè in simboli:
(1) (M-(°% sm CI‘k).î* Dato che 1°‘ è un sottoinsieme di C1‘k, ma non è cardinalmente simile a C1‘k, se ne conclude che in numero car-
dinale di 1‘‘X dev'essere minore di quello di CI‘K. 402 Infatti, in NF le coppie ordinate sono ridotte a classi di classi con il metodo di Kuratowski; dunque, asserire che (x, y) € f(la coppia ordinata (x, y) appartiene alla classe di coppie ordinate f) equivale a dire che la classe di classi {{x}, {x, y}} appartiene a f. La classe {{x}, {x, y}} si può definire come la classe degli x; tali che:
(x) (Xx, E x1=X2=x) V (X3) (13€ x1=(3=xVx3=))). Poiché, data la definizione di identità di NF, un’espressione del tipo “a = b” è stratificata solo se ad “a” e a “b” si assegna lo stesso numerale, è facile vedere che la formula precedente è stratificata solo se a “x? e a “y” si assegna lo stesso numerale. Così, una coppia ordinata è stratificata solo quando è possibile assegnare il medesimo numerale a entrambi i membri della coppia, ma questo non si può fare, nel caso della sottoformula ‘x, y)” che compare nella definizione della classe A, (i), perché (i) contiene anche la sottoformula “x £ y”, cioè “-(x € y)”, che è stratificata solo se a “x” si assegna un numerale minore di “Y”. 403 Secondo la definizione *37.01 dei Principia, R‘‘B=4r % (Gy) € f A xRy). Quindi, se 1 è la relazione tra la classe che contiene solo x, {x}, e x stesso (v. [PM], vol. I, #50.01; v. anche sopra, cap. 2, nota 283), “1°? significa lo stesso di “ % (4y)(y € k A xy)”. Identificando le relazioni con classi di coppie ordinate, il significato di ‘“1°‘X” diviene lo stesso di “ % (Ay)(y € K A ({x}, x) € 0”.
404 Infatti, si supponga, per assurdo, che ogni elemento di 1‘ sia correlato con uno e un solo elemento di C1‘% dalla relazione (in estensione)f cosicché si abbia 1°°% sm Cl‘k. Formiamo la classe A tale che:
(i) xe h=x ceKAO)(({x},y)e fox
y).
La classe A è una sottoclasse di X, e dunque, per la nostra ipotesi, deve esistere un w e K tale che {w} sia correlato a A: (ii) weKA({w}h)e f.
Chiediamoci, w appartiene a 4? Dalla definizione (i’) si ottiene: (iii) we A=wekA0)({x},y)efaoweée y), da cui: (iv)
we A=wekA({{x},h)e
fawe
N),
da cui, per la (ii’), si ricava infine la contraddizione “w e 4= w & A”. Tale contraddizione mostra come la supposizione che 1°°k sm Cl‘k sia falsa per ogni k; si ha dunque il teorema “(K)—(1°°% sm CI°%)”.
854
capitolo 12
Il teorema (1) sembra introdurre in NF una contraddizione. Infatti, appare ovvio che, per ogni classe k, possia-
mo sempre associare ogni elemento x di £ con l’elemento {x} di 1°‘, ottenendo £ sm 1‘‘4. Applicando questo alla
classe universale si ottiene che V sm 1‘“V, e poiché si ha anche V sm CI°V, si ottiene 1‘°V sm CI°V, che contraddice il teorema (1). Sebbene sia intuitivamente ovvio, questo ragionamento non si può condurre formalmente in NF, perché la supposta corrispondenza uno-uno f tra gli elementi di X e quelli di 1°°% non è una classe (di coppie ordinate) definita da una formula stratificata; infatti, f sarebbe la classe degli x tali che:
ye
KA O, {y}} =>),
e questa formula non è stratificata, perché non lo è la sua sottoformula “(y, {y})”. Dunque, in NF, non si ha alcuna garanzia che f' esista sempre. (Si osservi che in ST l’asserzione che esista una correlazione uno-uno tra gli elementi di una classe e gli elementi dell’insieme delle sue sottoclassi unità non sarebbe formulabile, ma con il mec-
canismo dell’elevazione del tipo che abbiamo descritto nel $ 2.7.1.1, la formula “(y, {y})” è rimpiazzata in ST da “{y}, {y})”, cosicché l’asserzione che esiste una correlazione uno-uno tra gli elementi di una classe e gli elementi dell’insieme delle sue sottoclassi unità è rimpiazzata dall’asserzione (indubbiamente vera) che gli elementi dell’insieme delle sottoclassi unità di un insieme si possono porre in correlazione uno-uno con se stessi.)
Chiamiamo — com’è divenuto consuetudine — cantoriane le classi K per cui vale k sm 1‘°k, e non cantoriane le classi per cui vale —(k sm Oi una classe cantoriana; abbiamo cioè:
ragionamento precedente ci mostra che la classe universale V non è, in NF,
(QtaVismivo. La conclusione è questa: V è una classe che ha la stessa potenza dell’insieme di tutte le sue sottoclassi, ma non dell’insieme di tutte le sue sottoclassi unitarie; l'insieme di tutte le sottoclassi unitarie di V ha un numero cardina-
le minore di quello di V stessa. Ernst Specker ([1953]) ha dimostrato che l’assioma di scelta non vale in NF. La sua dimostrazione consiste nel
mostrare che i numeri cardinali di NF non sono ben ordinati dalla relazione tra un numero minore e uno maggiore — cosa che implica la non validità generale dell’assioma di scelta.'°° Come osserva lo stesso Specker all’inizio del suo articolo,” un corollario dell’invalidità dell’assioma di scelta in NF è l’esistenza di insiemi infiniti in NF. Infatti, poiché l’ assioma di scelta vale per tutte le classi finite (v. sopra, cap. 4, $ 4.3), è ovvio che se esso non vale
in generale deve esistere almeno una classe infinita. In NF non è dunque necessario un assioma dell’infinito: un risultato che non era noto fino al 1953. 408 Come osserva Specker al termine dell’articolo menzionato, poiché la validità dell’ipotesi generalizzata del continuo implica la validità dell’assioma di scelta, dal fatto che in NF l’assioma di scelta non vale deriva che in NF non vale neppure l’ipotesi generalizzata del continuo. La causa della non validità dell’assioma di scelta in NF sono ancora una volta gli insiemi non cantoriani. (Non esiste nessuna dimostrazione che l’assioma di scelta non possa valere, in NF, per gli insiemi “normali”, per cui
sembra possibile aggiungere agli assiomi di NF un assioma di scelta che valga solo per questi insiemi.) Senza entrare nel dettaglio dell’ingegnosa dimostrazione di Specker, che è piuttosto complessa, possiamo rendercene conto
405 L'aggettivo “cantoriana” — che fu usato per la prima volta da Rosser all’inizio degli anni Cinquanta del Novecento — deriva dal fatto che per le classi cantoriane è dimostrabile in NF il teorema di Cantor. Infatti, se k è una classe cantoriana, si ha sia che % sm 1‘‘%, sia (per il teorema (1)) che —(1°“4 sm CI‘%), da cui è immediato derivare che —(k sm CI‘%). 400 Come abbiamo già avuto modo di osservare, i numeri cardinali e i numeri ordinali sono definiti in NF alla maniera di Russell, rispetti-
vamente, come classi di classi e come
classi di relazioni seriali ben ordinanti. Si ricorderà che l'assioma di scelta è equivalente
all’asserzione secondo cui ogni insieme può essere ben ordinato. Questo significa che, se è vero l'assioma di scelta, ogni elemento di un numero cardinale può essere ben ordinato, e dunque messo in corrispondenza biunivoca con un elemento di qualche numero ordinale. La
classe di tutti gli ordinali i cui elementi sono cardinalmente simili a quelli di un certo numero cardinale non è dunque vuota e, poiché i numeri ordinali sono ben ordinati, deve contenere un ordinale più piccolo. Possiamo dunque associare ogni numero cardinale all’ordinale corrispondente più piccolo. La serie di tutti questi ordinali sarà ben ordinata, e se un ordinale a è minore di un ordinale è il numero cardinale corrispondente ad a sarà anche minore di quello corrispondente a b. I numeri cardinali risulteranno quindi ordinati in ordine di grandezza come la serie ben ordinata dei corrispondenti ordinali. Si osservi, per inciso, che questa costruzione giustifica l’identificazione di von Neumann dei numeri cardinali con numeri ordinali corrispondenti.
407 V_ Specker [1953], p. 972. 408 Vv. Specker [1953], punto 8.1, p. 974.
Alternative, critiche e proposte di emendamento al sistema dei Principia
855
osservando che 1‘°°V è una classe di classi non vuote disgiunte; la sua classe di scelta sarebbe V stessa; ma poiché una classe di scelta ha la stessa cardinalità della classe di classi di partenza (comprende uno e un solo elemento per ogni classe appartenente alla classe originale, e questi elementi sono sempre tutti distinti, perché le classi appartenenti alla classe originale) ciò conduce a 1‘°V sm V, che contraddice il risultato (2). Prima di approfondire il nostro esame di alcuni aspetti di NF, accenniamo al sistema proposto per la prima vol-
ta da Quine in Mathematical Logic (1940), oggi noto con la sigla “ML”. ML è una teoria del primo ordine con il solo predicato binario primitivo “e”, che estende NF all’incirca come NBG estende ZF: in ML sono cioè presenti, oltre alle entità di NF, che Quine chiama elementi, poiché sono sempre elementi di altre classi, anche delle classi ultime (ultimate classes), che non possono essere membri di altre classi. Un’entità x è un elemento se e solo se è
membro di qualche classe; in simboli possiamo porre: E/(x) = (3y)(x € y). Tra gli assiomi non logici di ML vi sono un assioma di estensionalità per le classi e uno schema d’assiomi di comprensione per le classi:
ML) ML)
=MM)Ad(MWex=we yo xe z=ye Gay)@MXe y= E 1 FO),
2),
dove “F(x)” sta al posto di una qualsiasi formula ben formata del linguaggio di ML che non contiene la variabile ‘‘” libera. ML(II) corrisponde all’assioma di comprensione per le classi di NBG; la differenza è che Quine non pone l’ulteriore condizione — presente nel menzionato assioma di NBG — che la formula rappresentata da “(x)” non contenga variabili quantificate che non siano limitate a elementi — cioè che, per ogni variabile “2” che compare quantificata nella formula rappresentata da “(x)”, le sottoformule della formula rappresentata da “(x)” del tipo ‘‘(2)(G(z))” debbano avere la forma “(z)(E/(z) > Gi(2))”, e quelle del tipo “(42)(G(z))” debbano avere la forma “(42) (ElI(2) A Gi(2))”!® Il terzo, e ultimo, assioma non logico di ML è l’assioma di comprensione seguente:
ML(IHI)
Ex) A El) A... A El(xn) D AV (E10) A (Mx e y = El) A FA),
dove “F(x)” sta al posto di una formula ben formata del linguaggio di ML in cui la variabile “y” non compare libera, che sia stratificata, e la quale non contenga altre variabili che “x”, “xy”, “x”, ..., e la variabile rappresentata da “x,”. Quest’assioma afferma, in sostanza, che le entità di NF sono gli elementi di ML.
Il sistema proposto da Quine nella prima edizione di Mathematical Logic (1940) era contraddittorio: Barkley Rosser ([1942]) scoprì che in esso era derivabile il paradosso di Burali-Forti. In sintesi, l'assioma che abbiamo chiamato ML(III) (il #200 di Quine [1940] e [1951a], $ 29, p. 162) era formulato in Quine [1940] ($ 29, p. 162) senza la restrizione che tutte le variabili contenute nella sua sottoformula rappresentata da “F(x)” siano ristrette a elementi.
Nell’ autunno
del 1941, Rosser, comunicò telefonicamente a Quine che aveva ricavato il paradosso di
Burali-Forti nel sistema di Mathematical Logic. Quine corse ai ripari inserendo nelle copie ancora invendute del libro un foglietto recante un corrigendum in cui riconosceva la contraddizione ricavata da Rosser e rimpiazzava l’assioma *200 con sette assiomi che, nella versione originale, erano teoremi dimostrati attraverso *200 (Quine
osservava anche che i primi cinque assiomi si possono rimpiazzare con un unico assioma). Nel 1950, tuttavia, Hao Wang ([1950]) mostrò qual era stato precisamente l’errore di Quine. Quine aveva supposto che l’assioma *200 di Quine [1940] desse come elementi di ML esattamente le entità di NF; ma questo è sbagliato: infatti, nel linguaggio ampliato di ML, in una formula ben formata stratificata rappresentata da “F(x)” possono comparire variabili che non sono limitate alle entità riconosciute in NF, cioè a elementi di ML, cosicché, nella formulazione originale,
l’assioma ML(III) era più forte del corrispondente NF(II) e, in realtà, tanto forte da dare origine a una contraddizione. Wang ([1950], p. 27) propose allora una correzione di ML(II) (*200) che imponesse che la formula in esso rappresentata da “F(x)” non contenga variabili (libere o vincolate) che non siano ristrette a elementi di ML, ottenendo in tal modo che ML(III) asserisca che gli elementi di ML sono esattamente le entità di NF. Quine adottò la
soluzione proposta da Wang nella nuova edizione del libro, uscita nel 1951, ricavando il sistema ML che abbiamo presentato qui. Per comprendere il motivo che spinse Quine a superare il sistema NF proponendo ML, possiamo seguire una spiegazione fornita da Quine nei ‘“Supplementary remarks” del 1953 a “New foundations...”.*!° Una premessa: 40° MI (II) è dunque uno schema d’assiomi più forte del corrispondente schema di NBG, che fa sì che ML stia a NF come MKM più che come NBG sta a ZF.
410 Vv. Quine [1953a], pp. 98-99.
sta a ZF,
856
capitolo 12
sappiamo che, nei sistemi di Frege e Russell, il principio di induzione matematica è un teorema, dimostrabile a partire dalla definizione di numero naturale (v. sopra, cap. 2, $ 6.1). In NF i numeri naturali sono definiti alla ma-
niera di Frege-Russell; cioè, ‘7 è un numero naturale” sta per: (3)
M(0e
yn@®xe
yax+1le
y)aze
y),
“Z appartiene a ogni classe y che contiene 0 e contiene x + 1 ogni volta che contiene x”. Quine osserva che la (3) è ovviamente vera quando si prende come z uno qualsiasi dei numeri naturali 0, 1, 2, 3, ... Per converso — egli
continua — si può argomentare che tale espressione è vera solo si prende come z uno qualsiasi dei numeri naturali 0, 1, 2, 3, ...; e l’argomento consiste nel prendere come y la classe che contiene solo 0, 1, 2, 3, ... Ma quest’ultimo argomento, spiega Quine, non funziona in NF: In un sistema come NF dove alcune presunte classi esistono e altre no, possiamo ben chiederci se c’è una classe i cui membri siano tutti e solo 0, 1, 2, 3, ... Se non c’è, allora (3) cessa di essere una traduzione adeguata di “z è un numero naturale”; (3) diventa vera di altri valori di “2” oltre a 0, 1, 2, 3, ... In ML, d’altra parte, dove 0, 1, 2, 3, ... sono elementi e tutte le classi di elementi si possono
concepire come esistenti, non sorge nessuna perplessità del genere. La perplessità che è stata appena avanzata in termini intuitivi si ripresenta, in NF, al livello di dimostrazione formale in connessione con l’induzione matematica. L’induzione matematica è la legge che dice che qualsiasi condizione @ che vale per 0, e vale per x+ 1 ogni volta che vale per x, vale per ogni numero naturale. La dimostrazione logica di questa legge procede semplicemente con il definire “x è un numero naturale” come (3) e quindi prendendo y in (3) come la classe delle cose che soddisfano @. Ma questa
dimostrazione non riesce in NF per le @ non stratificate, per mancanza di qualsiasi assicurazione che vi sia una classe esattamente delle cose che soddisfano @. In ML, d’altra parte, non c’è tale insufficienza; infatti, data qualsiasi @ stratificata o non stratificata,
ML provvede all’esistenza della classe di tutti gli elementi che soddisfano te
Così, se ci si vuole servire di NF come sistema fondazionale per la matematica, si deve aggiungere ai suoi assiomi uno schema d’assiomi di induzione per tutte le formule, cioè anche per le formule non stratificate (in sostanza, il quinto assioma di Peano, formulato al primo ordine), un ostacolo che il sistema ML sembra superare. Infatti, in ML i numeri naturali sono definiti attraverso una formula identica a (3), ma il significato di tale formula cambia, perché, il campo di variazione della variabile ‘“y” non è più ristretto alle classi di NF, cioè agli elementi di ML, ma è esteso alle classi di ML, che includono non solo le classi di NF, ma anche le classi ultime di ML. Non c’è quindi più difficoltà, in ML, nel prendere %(@y) come y in (3), sia “@y” stratificata o no. Fin qui tutto bene. C'è però, a questo proposito, un problema esposto chiaramente da Lévy e Bar-Hillel nella seconda edizione del libro di Fraenkel e Bar-Hillel Foundations of Set Theory: Poiché N(x) [cioè, l’asserzione che x è un numero naturale] contiene quantificatori su variabili di classe [non ristretti a elementi di ML] non possiamo usare l’assioma di comprensione per un insieme [il nostro ML(III)] per dimostrare che la classe {x |N()} [cioè, % N(x)] di tutti inumeri naturali è un insieme [un elemento di ML]; in effetti, se ML è consistente, non si può dimostrare che
questa classe sia un insieme [elemento] in ML.'!?
L’impossibilità di dimostrare in ML che la classe dei numeri naturali è un elemento, e non una classe ultima, è
un portato della correzione cui dovette essere sottoposto il sistema ML per salvarlo dall’inconsistenza provocata dall’assioma ML(III), che era stato originariamente formulato senza la restrizione che nella sua sottoformula rappresentata da “(x)” potessero comparire solo variabili ristrette a elementi di ML. La versione originale dell’assioma, permetteva di dimostrare che la classe dei numeri naturali di ML è un insieme; ma questa dimostra-
zione divenne ovviamente vacua quando si scoprì che l'assioma è inconsistente. La versione corretta dell’assioma non permette più di dimostrare che la classe dei numeri naturali è un elemento di ML. Infatti, la formula (3) contiene una variabile quantificata, cioè “y”, che non è ristretta a elementi, e dunque non si può usare ML(III) per dimostrare che Z(M)(0e ye
yox+leyaze
yy)
*!! Quine [1953a], pp. 98-99. Il punto qui spiegato da Quine era noto dall’articolo di Rosser [1939b], ma è probabile che Quine fosse stato già informato del problema prima della pubblicazione di quest'articolo, dallo stesso Rosser.
4° Fraenkel, Bar-Hillel e Lévy [1973], cap. 3, $ 4, p. 170.
Alternative, critiche e proposte di emendamento al sistema dei Principia
857
è un elemento di ML. Cè anzi una dimostrazione, dovuta a Rosser, che non è possibile dimostrare in nessun altro modo che la classe dei numeri naturali di ML è un elemento di ML, supposto che ML sia coerente.''* Questo è un problema, perché lo sviluppo di parti della matematica standard (analisi, matematica cantoriana) richiede che la classe dei numeri naturali sia un insieme. Si può superare questo scoglio in due modi. O aggiungendo a ML l’assioma ad hoc che la classe dei numeri naturali è un elemento, oppure restringendo la quantificazione sulla variabile “y” di (3) a elementi di ML, ridefinendo cioè, in ML, ‘“z è un numero naturale” come:
(3)
MEM)
ADE yAMGxe
yoax+le
y)aze
y),
in modo che la classe dei numeri naturali si possa dimostrare essere un elemento attraverso l'assioma ML(III. Questa seconda opzione, però, rende nuovamente impossibile una dimostrazione dell’induzione matematica per le formule non stratificate di ML, e costringe ad assumere, come in NF, un assioma di induzione matematica.
In entrambi i casi, si torna alla situazione di dover aggiungere un assioma motivato solo dall’esigenza di far tornare i conti con la matematica — che era precisamente la situazione che aveva indotto Quine ad abbandonare NF per ML. Diversamente da ciò che accade in NF, in ML l’assioma di scelta non è refutabile. In ML si dimostra che è in
generale falso che data una classe & qualsiasi di classi non vuote di ML esista una classe di scelta da k /a quale sia un elemento di ML — e ciò permette di dimostrare in ML l’esistenza di una classe infinita che è un elemento di ML. Ma, poiché in ML ci sono classi ultime, nulla esclude che la classe di scelta da X possa essere, per certe scelte di k, una classe ultima. Volendo, dunque, si può aggiungere l’assioma di scelta a ML. Veniamo ora al problema della consistenza di NF e ML. Nell’articolo in cui corregge la prima versione, inconsistente, di ML, Hao Wang dimostra anche che ML è coerente se e solo se lo è anche NF.‘
Possiamo comprende-
re perché se consideriamo che l’assioma ML(III) coincide con l'assioma NF(II), nel senso che permette di formare tutti e solo quegli elementi di ML che sono classi di NF. Inoltre, l'assioma di estensionalità di NF è implicato da quello di ML. Infine, l’assioma di comprensione di ML per le classi non dice nulla sugli insiemi. Di conseguenza, si dimostra che ogni enunciato di ML in cui tutte le variabili siano ristrette a elementi è un teorema di ML se e solo se lo è il corrispondente enunciato di NF. Così, se si sceglie un enunciato contraddittorio del linguaggio di ML tutte le variabili del quale siano limitate a elementi, si ha che questo enunciato si può dedurre in ML se e solo se si può dedurre in NF: in altri termini, ML è consistente se e solo se lo è NF.'°
Tenendo conto di questo risultato, poiché NF è un sistema sistemi di Quine si sono opportunamente concentrate su NF. oggi una dimostrazione di coerenza relativa di NF rispetto a zioni tra la teoria semplice dei tipi e NF,‘ dimostrando che l’aggiunta di un assioma di ambiguità completa dei tipi. Per comprendere
di che cosa si tratti,5!” consideriamo
più semplice di ML, le indagini sulla consistenza dei Nonostante gli studi intensivi, tuttavia, non esiste ad ZF, o a NBG. Specker ha però fatto luce sulle relaNF è equivalente a una teoria semplice dei tipi con
una teoria semplice dei tipi, ST, priva di assioma
dell’infinito: ossia, ST è come ST (v. sopra, $ 2.7.1) senza l'assioma ST(III). I suoi assiomi non logici sono riassunti nei due schemi seguenti: STA)
ZI
e
gii
=
STD
a)wma ey =).
z" e
st)
>}!
=yt1)
Aggiungiamo alle regole di deduzione di ST (che possono ridursi al solo modus ponens) la regola generale che t Asee
solo set A', dove A è una formula ben formata di ST_, e A* è ottenuta da A elevando di uno l’indice di
tipo di ciascuna delle variabili di A: la regola dice che, se A è dimostrabile, lo è anche la sua elevazione di tipo A' e, viceversa, che se A'* è dimostrabile, lo è anche A. ST con questa nuova regola sarà detta ST con ambiguità dei tipi. Che se A è dimostrabile lo è anche la sua elevazione di tipo A* è vero in generale in ST, ma il converso, che
413 V_ Rosser [1952], $ 3, p. 241. 414 v. Wang [1950], pp. 28-31. 45 V_ Fraenkel e Bar-Hillel [1958], cap. 3, $ 4, p. 149, e Fraenkel, Bar-Hillel e Lévy [1973], cap. 3, $ 4, p. 169. Si ricordi che se un sistema
è inconsistente, in esso può essere derivato qualsiasi enunciato esprimibile nel linguaggio del sistema stesso.
416 v_ Specker [1958], pp. 458-463 (trad. ingl.: pp. 6-9), e Specker [1962], pp. 116-119. 47 Si veda anche l’esposizione di Hatcher [1968], $ 42, e Hatcher [1982], $ 7.4.
858
capitolo 12
se A' è dimostrabile lo è anche A, non vale in generale. Vediamo perché. In ST si può dimostrare che esistono almeno due oggetti di tipo 1. Infatti, in ST” si dimostra che esiste almeno un individuo, per cui vi saranno almeno due oggetti di tipo 1, almeno 4 oggetti di tipo 2, e, in generale, almeno 2” elementi di tipo n (formalmente, si dimostra “(ax') (ay!) (x! # y!)” attraverso le due istanze di ST (ID) ba e x =2=2Y e “(9 (e y'= 2° # 2°))”. Se fosse valida la regola che se A* è dimostrabile lo è anche A, dalla dimostrazione che Ab ay) SE y)), cioè che esistono almeno due oggetti di tipo 1, ricaveremmo la dimostrazione che Ax) ay) (x + O cioè che
esistono almeno due oggetti di tipo 0 (due individui); ma quest’ultima asserzione è falsa nei modelli di ST che hanno un solo individuo e quindi non è vera in tutti i modelli di ST. (Si osservi, invece, che dalla dimostrabilità che (3x') (ay!) (x! # y') possiamo inferire che (4xÈ) (Ay)) (2° # y?), cioè che esistono almeno due oggetti di tipo 2.) In effetti, nessuna gerarchia di tipi con meno di infiniti individui può essere un modello di ST con ambiguità dei tipi (si ricordi che ST” è, per ipotesi, priva di un assioma dell’infinito). Supponiamo infatti, per assurdo, che vi sia
una gerarchia di tipi con un numero finito n di individui, cioè con esattamente n oggetti di tipo 0. Poiché si può dimostrare, in ST, che l’n-esimo tipo ha almeno 2” elementi, applicando più volte la regola che consente di ricavare una dimostrazione di A da una dimostrazione di A* giungeremmo a provare che esistono 2" individui, che è contrario all’ipotesi che gli individui non fossero più di n. Dunque, la regola dell’ambiguità dei tipi rappresenta una sorta di assioma dell’infinito, e ST con ambiguità dei tipi è una teoria essenzialmente più forte di ST . Si può però dimostrare facilmente che ST con ambiguità dei tipi è consistente, se lo è Sia ST con ambiguità dei tipi corrisponde al sistema che si otterrebbe da NF limitandone tutte le formule ben formate a formule stratificate. Supponiamo di aggiungere a ST, invece della regola di ambiguità dei tipi, lo schema d’assiomi “S= S'”, dove “S” è una lettera schematica che sta al posto di una qualsiasi formula chiusa (un enunciato) di ST, 0, per dirla altrimenti, uno schema d’assiomi che assicuri che, per ogni formula chiusa A di ST, si ab-
bia
HA = A'. Questo schema d’assiomi è più forte della regola ‘+ A se e solo se + A’: infatti, per es.,
dall’assunzione che se A è dimostrabile lo sia anche A*, non segue necessariamente che sia dimostrabile "A > A*1, mentre dalla dimostrabilità di "A > A' segue che se A è dimostrabile lo è anche A*. Lo scherma d’assiomi in parola asserisce, in pratica, che tutto ciò che è vero in un tipo dev'essere vero in ogni tipo precedente o successivo. Il sistema così ottenuto è ST con ambiguità completa dei tipi. Specker ha dimostrato che NF equivale a ST con ambiguità completa dei tipi: cioè, che NF ha un modello se e solo se lo ha ST_ con' ambiguità completa dei tipi.*"° Non possediamo, tuttavia, nessuna dimostrazione di consistenza di ST con ambiguità completa dei tipi, per cui la
questione della consistenza di NF resta ancora oggi aperta.!” Si deve però ammettere che l’assioma secondo cui tutto ciò che è vero in un tipo dev'essere vero in tutti i tipi precedenti non appare più plausibile dello stesso assioma russelliano di riducibilità e, in ogni caso, non sembra un candidato migliore dell’assioma di riducibilità al ruolo di verità logica. NF consente di dimostrare l’esistenza di una classe infinita — cosa impossibile nella teoria russelliana dei tipi — ma ciò al prezzo di incorporare nella sua sintassi un principio non più certo dello stesso assioma dell’infinito. Il sistema NF avrebbe dovuto basarsi interamente su una restrizione del principio di comprensione: questo lo avrebbe reso più elegante e più accettabile come sistema logicista. Nell’articolo originale in cui espone il sistema NF, “New foundations for mathematical logic”, Quine lo presenta in effetti come un sistema logicista.*”' Abbiamo
4!8 V. Specker [1962], pp. 117-118. 4° V. Specker [1958], pp. 462-463 (trad. ingl.: pp. 8-9), e Specker [1962], pp. 118-119. 420 fl dubbio che NF sia inconsistente era tuttavia più forte in passato di quanto sia oggi. Da una parte, infatti, nonostante sia stata compiuta una mole di lavoro considerevole su NF, finora non si è potuta scoprire in esso nessuna contraddizione; inoltre, dalla fine degli anni Sessanta del Novecento, si sono accumulate dimostrazioni di consistenza di vari sottosistemi di NF (in proposito, si può consultare Boffa [1977]). Per esempio, Ronald Bjòrn Jensen ([1968], $ I) ha dimostrato che: il sistema (più debole di NF) NFU, ottenuto da NF restringendo la validità dell’assioma di estensionalità alle sole classi non vuote (ponendo l’assioma nella forma: “(x)(y)((Az)(z € x) A (2)(2 € x= ze Dara Y)” (“U” sta per “Urelemente”, perché il sistema così modificato ammette l’esistenza di Urelemente, ossia individui che non sono classi), è
consistente se e solo se lo è ST ;NFU + assioma dell’infinito (in NFU non è confutabile l’assioma di scelta e non è dimostrabile l'assioma dell’infinito) è consistente se e solo se lo è ST (ST = ST + assioma dell’infinito); NFU + assioma dell’infinito + assioma di scelta è consistente se e solo se lo è ST + assioma di scelta. (L’assioma di scelta non è refutato, in NFU, dalla dimostrazione di Specker, perché per condurla a termine è necessario usare l’assioma di estensionalità di NF, e non è sufficiente quello di NFU.) A questo si aggiunga che è noto che ST” è consistente se lo è l’aritmetica elementare (per il concetto di “aritmetica elementare”, v. sotto, cap. 14, nota 86); ne deriva che, se è consistente l’aritmetica elementare, lo è anche NFU.
12! Negli anni Trenta e 40, Quine non aveva ancora sviluppato il suo punto di vista maturo (che esamineremo nel cap. 14, $ 1) secondo cui
Alternative, critiche e proposte di emendamento al sistema dei Principia
859
visto, però, che si rende necessario aggiungere a NF un assioma di induzione, se si vuole usare NF come sistema fondazionale per la matematica. Quine cercò di superare il problema con il sistema ML, che fu ancora presentato come sistema logicista, °° ma la prima versione di ML si rivelò contraddittoria, e la versione corretta, se permette-
va di dimostrare il principio di induzione matematica, rendeva impossibile dimostrare che la classe dei numeri naturali non è una classe ultima e con ciò rendeva impossibile sviluppare pienamente l’analisi classica. Si può, anche qui, aggiungere a ML un assioma che dichiari che la classe dei numeri naturali è un elemento di ML, ma, con ciò, si torna alla situazione insoddisfacente che aveva provocato il superamento di NF.
I sistemi di Quine condividono con i sistemi ZF e NBG la caratteristica di non far scaturire gli assiomi da un
tentativo di spiegazione del perché certi modi di ragionare intuitivi siano sbagliati. Questo è indubbiamente un difetto agli occhi di un logicista come Russell che, anche in un’epoca in cui non riteneva più soddisfacente la teoria dei Principia, continuava a pensare che una teoria adeguata non possa limitarsi a evitare i paradossi, ma debba risolverli, cioè mostrare quale sia l’errore logico da cui scaturiscono. Inoltre, i sistemi di Quine mancano totalmente di un’idea guida intuitiva, come può essere la concezione iterativa degli insiemi, o l’idea che occorra limitarne la grandezza. La restrizione di stratificazione sul principio di comprensione di NF(II) (e sul parallelo assioma ML(III) sembra giustificabile solo avendo in mente qualche forma di teoria dei tipi. D'altra parte, se ci si basa su una teoria dei tipi, è arduo giustificare l'ambiguità completa dei tipi che caratterizza NF. Sembra dunque che gli assiomi di NF(II) e ML(IIT) non abbiano altra giustificazione intuitiva che quella di evitare i paradossi. Come abbiamo già visto all’inizio del $ 1.1.4, questa fu appunto la diagnosi che Russell diede sui sistemi di Quine alla fine degli anni Cinquanta dello scorso secolo: Il professor Quine, per esempio, ha prodotto sistemi che ammiro molto per la loro maestria, ma che non posso ritenere soddisfacenti perché sembrano creati ad hoc ed essere tali che neppure il logico più ingegnoso li avrebbe pensati se non avesse saputo delle conNERI 193 traddizioni.
In Mathematical Logic, Quine giustifica filosoficamente il suo sistema così: Le contraddizioni [...] erano implicite nei metodi inferenziali del senso comune acritico; e le varie riformulazioni della logica che
sono state proposte per evitare le contraddizioni sono state corrispondentemente artificiali ed estranee al senso comune. La formulazione meno artificiale e al tempo stesso più conveniente dal punto di vista tecnico sembrerebbe essere quella che si avvicina quanto più possibile ai canoni troppo liberali del senso comune senza ripristinare le contraddizioni. [...] L’ovvietà intuitiva è dunque l’arbitro ultimo — e un arbitro fallibile in vista della contraddizione che Russell riuscì a ricavare dalla logica del senso comune. Ma ci sono gradi di ovvietà; l’analisi futura potrà metterci in grado di derivare la logica da un insieme di principi ancora più ovvi e
naturali di quelli che Russell ha screditato. Nel frattempo adottiamo una tecnica senza intoppi che non appare inconsistente."
Come abbiamo visto, tuttavia, il sistema ML non è privo di intoppi. Non è difficile supporre che siano stati proprio questi tentativi insoddisfacenti di dare una forma accettabile al logicismo a provocare il suo abbandono da parte di Quine, che — come vedremo nel cap. 14 — caratterizzerà la sua filosofia matura in opposizione al logicismo, ponendo il confine tra logica e matematica laddove comincia la teoria degli insiemi.
la teoria delle classi ron fa parte della logica. In “New foundations...”, Quine scrive: «Si deve ammettere che la logica che genera tutto questo [l’intera matematica pura tradizionale] è uno strumento molto più potente di quella fornita da Aristotele. [...] [Si tratta di] una logica triplice di proposizioni, classi, e relazioni. Le notazioni primitive nei termini delle quali questi calcoli sono infine espressi non sono nozioni standard della logica tradizionale; tuttavia esse sono di un genere che non si esiterebbe a classificare come logico» (Quine [1937a], p. 81). Si confronti questo passo con l’asserzione dei Principles of Mathematics: «L'argomento della Logica Simbolica consiste di tre parti, il calcolo delle proposizioni, il calcolo delle classi, e il calcolo delle relazioni» (Russell [1903a], $ 13, p. 11). 42 In Mathematical Logic, Quine afferma che «la matematica si riduce a logica» (Quine [1940] e [1951a], introduzione, p. 5). Più avanti,
nello stesso libro, si legge: «le nozioni di identità, relazione, numero, funzione, somma, prodotto, potenza, limite, derivata, ecc., sono tutte definibili nei termini dei
nostri tre strumenti notazionali primitivi: appartenenza, negazione congiunta e quantificazione con le sue variabili. Con queste definizioni ogni asserzione vera e ogni asserzione falsa che sia espressa in termini puramente matematici diviene un’abbreviazione di una formula logica, in particolare di un’asserzione logica [...]» ($ 23, pp. 125-126). 423 Russell [1959], cap. 7, p. 80.
424 Quine [1940] e [1951a], $ 29, p. 166.
860
capitolo 12
2.9. CRITICHE ALL’ASSIOMA DELL’INFINITO Come abbiamo già avuto modo di osservare, nel corso di questo libro, la teoria dei tipi rende impraticabile la dimostrazione dell’esistenza di una classe infinita.*’’ Se si vuole che l’esistenza di una classe infinita sia un teorema, bisogna postularla. Nei Principia, il principio che postula l’esistenza di una classe infinita è chiamato “assioma dell’infinito”: in simboli, “Infin ax”. “Infin ax” è definito così:
Infin ax = (@(@e
NC induct > (Ax) (x € o).
Infin ax asserisce che nessuna classe induttiva è vuota; vale a dire che, dato un numero induttivo (cioè, un numero
naturale), per ogni tipo deve esistere una classe di oggetti di quel tipo che abbia quel numero induttivo. Ciò è vero, nella teoria dei tipi, solo se il numero degli individui è infinito, altrimenti per ciascun tipo ci sarebbe sempre un numero induttivo massimo di oggetti di quel tipo, e dunque tutti i numeri induttivi di oggetti di quel tipo superiori a tale numero sarebbero uguali alla classe vuota. Di conseguenza, il terzo assioma di Peano sarebbe falso in ciascun tipo di numeri induttivi — vale a dire che, in ciascun tipo di numeri induttivi, numeri diversi potrebbero avere lo stesso successore. Scrive Russell: [...] si supponga che ci siano esattamente n individui nell’universo, e non di più, dove n è un cardinale induttivo. Avremmo allora 2" classi, 2°
n
NAM
DUO
.
.
.
classidi classi, e così via. In tal caso, nel tipo degli individui avremmo
1+,1= A,
.
.
1+:2= A, ecc. Quindi avremmo
eccì
Nel tipo delle classi, otterremmo risultati simili per 2”, e così via.42”
Nonostante il suo nome, nei Principia l'assioma dell’infinito non è assunto come proposizione primitiva (cioè, Ò
RG
5
7
È
-_
428
È
DE
i
come assioma), ma è introdotto come ipotesi tutte le volte che si rende necessario. ‘° In altri termini, se si ha un
enunciato deducibile dall’assioma dell’infinito insieme con altri principi considerati puramente logici, sia rappresentato dalla lettera schematica “p’, quest’enunciato non è assunto come teorema, ma è assunto come rema il condizionale “Infin ax > p”. Per esempio, il terzo assioma di Peano non è un teorema dei Principia, un teorema dei Principia l’enunciato che l’assioma dell’infinito implica il terzo assioma di Peano.‘”° Russell ne che l’assioma dell’infinito non possa essere considerato un assioma logico: rettangolo (x))”, perché, in quest’analisi, diviene irrilevante che la nozione di “rettangolo equilatero” sia definita senza contraddizioni. In ogni caso, Russell non riprese più quest’argomento, in seguito. Tra il 1901 e il 1905, il Russell logicista continua a usare “analitico” per connotare le proposizioni vere che non ampliano la nostra conoscenza, la loro verità essendo garantita dal principio di non contraddizione — cioè, nel caso di proposizioni affermative, quelle in cui il predicato è contenuto nel soggetto, o le implicazioni il cui conseguente è già presente nella premessa. Egli ritiene ancora che le proposizioni della logica e della matematica siano sintetiche, in quanto ampliative della nostra conoscenza. Il senso della parola “sintetico” come “non deducibile dalla sola logica” gli è finora estraneo. Taylor qualifica quest’ultimo senso come «per noi singolare [peculiar]», aggiungendo che «esso può anche apparire innaturale o inappropriato»,'” ma si osservi che esso è l’unico senso assegnato da Frege alla parola “sintetico” (come attributo di enunciati o pensieri veri), e che, nelle sue Grundlagen der Arithmetik (1884), Frege afferma esplicitamente che con ciò non vuole «introdurre un nuovo senso [Sinn], ma solo cogliere [treffen] ciò che hanno inteso [gemeint haben] autori precedenti, in particolare Kant». Poco dopo, nelle Grundlagen, le verità analitiche e quelle sintetiche sono caratterizzate come segue: La questione [se una certa verità sia analitica o sintetica] è perciò sottratta al campo della psicologia e assegnata a quello della matematica, qualora si tratti di una verità matematica. L'essenziale è ora trovare la dimostrazione, e seguirla all’indietro fino alle verità primitive [Urwahrheiten]. Se in questo modo si incontrano solamente leggi logiche generali e definizioni, allora si ha una verità analitica [...]. Se invece non si può condurre la dimostrazione senza utilizzare verità che non sono di natura logica generale, ma si riferiscono a un particolare campo della conoscenza, allora la proposizione [Satz] è sintetica.!®*
“Verità analitica” significa dunque, per Frege, “deducibile dalle sole verità logiche”, con l’ausilio di definizioni; “verità sintetica” significa “non deducibile dalle sole verità logiche e definizioni”.
105 Russell [19004], $ 11, pp. 24-25. Russell porta quest’esempio: «[L]"idea di “quadrato rotondo” implica [involve] la proposizione “roton-
do e quadrato sono compatibili”, e ciò implica la compatibilità del non avere nessun angolo, e dell’averne quattro. Ma la contraddizione è possibile soltanto perché rotondo e quadrato sono entrambi complessi, e rotondo e quadrato implicano proposizioni sintetiche che asseriscono la compatibilità dei loro costituenti, mentre rotondo implica l’incompatibilità di suoi costituenti con il possesso di angoli. Se non fosse per questa relazione sintetica d’incompatibilità, non ci sarebbe nessuna proposizione negativa, e pertanto non vi potrebbe essere nessuna proposizione implicata che sia direttamente in contraddizione con la definizione di un quadrato» (Russell [1900a], $ 11, p. 24). Ancora in
Human Knowledge (1948) Russell afferma: «Due predicati positivi, come osservò Leibniz dimostrando che Dio è possibile, non possono essere logicamente incompatibili» (Russell [1948a], parte II, cap. 9, p. 140; ediz. americana, p. 123).
106 10? !08 10°
Russell [1900], $ 11, p. 26. Taylor [1981], p. 54. Frege [1884], $ 3, p. 3, nota. Frege [1884], $ 3, pp.3-4.
886
capitolo 13
Nonostante la differenza terminologica, però, il Frege che sostiene l’analiticità di logica e aritmetica la pensa esattamente come il Russell logicista che ne sostiene la sinteticità. Come per il secondo, anche per Frege gli enunciati aritmetici affermativi hanno queste caratteristiche: (1)
Sono deducibili da verità logiche, con l’ausilio di definizioni.
(2") Possono ampliare la nostra conoscenza. (3) Il concetto predicato non è necessariamente contenuto nel soggetto; più in generale, il conseguente di un condizionale non è necessariamente contenuto nell’ antecedente.
Infatti, sempre nelle Grundlagen der Arithmetik leggiamo: Kant [...] ha evidentemente sottovalutato l’importanza dei giudizi analitici — probabilmente a causa di una determinazione troppo ristretta del concetto —, anche se egli sembra aver avuto in mente il concetto più ampio utilizzato qui. [...] Kant sembra pensare il concetto come determinato mediante note caratteristiche [Merkmale] associate; questo è però uno dei modi meno fruttuosi di formare concetti. [...] [Nelle] definizioni veramente fruttuose in matematica [...] non abbiamo una serie di note caratteristiche coordi-
nate, ma una connessione più profonda, vorrei dire più organica, di determinazioni. Si può rendere intuitiva la differenza con un’immagine geometrica. Se si rappresentano i concetti (o le loro estensioni) per mezzo di regioni di un piano, allora al concetto definito attraverso note caratteristiche coordinate corrisponde la regione che è comune a tutte le regioni delle note caratteristiche; essa sarà racchiusa da parti dei loro confini. In una tale definizione si tratta dunque — per parlare valendoci dell'immagine — di usare le linee già tracciate in modo nuovo per delimitare una regione.!!° Ma con ciò non compare nulla di sostanzialmente nuovo. Le determinazioni di concetti fruttuose tracciano linee di confine che non erano ancora affatto state date. Ciò che si può desumere da esse non è prevedibile dall’inizio; con ciò non si ritira semplicemente fuori da una scatola ciò che si era messo dentro. Queste conseguenze ampliano le nostre conoscenze, e si dovrebbe perciò, secondo Kant, reputarle sintetiche; tuttavia esse possono essere dimostrate in modo puramente logico, e sono quindi analitiche. Esse sono effettivamente contenute nelle definizioni, ma come la
pianta nel seme, non come la trave nella casa [corsivo mio]. Spesso si ha bisogno di molte definizioni per la dimostrazione di un
teorema [eines Satzes], che pertanto non è contenuto in nessuna singolarmente, eppure consegue in modo puramente logico da tutte insieme.!!!
Dalle frasi che ho sottolineato emerge chiaramente che Frege non ritiene che un’implicazione analitica vera debba avere un conseguente che già compare nell’ antecedente e considera, invece, la deduzione logica come ampliativa delle nostre conoscenze. Sul senso da attribuire ai termini “analitico” e “sintetico” Couturat condivideva il punto di vista di Frege, che sostenne in diverse lettere a Russell tra il 1902 e il 1904. Per esempio, in una lettera a Russell del 27 marzo 1902, Couturat scrive: In effetti, si dovrebbe chiamare analitico, adesso, ciò che si deduce dai principi della Logica formale; dei quali il principio di contraddizione non è che uno: in modo che una verità può essere analitica senza per questo essere dedotta dal solo principio di condI DES o 3 È MA 2 traddizione (che si è per molto tempo considerato come l’unico principio logico).!!
Evidentemente, all’epoca la terminologia di Couturat (e di Frege) non convinceva Russell; infatti, ancora in una
lettera del 22 novembre 1904 al filosofo Elie Halévy, Russell obietta: Couturat conferisce un senso nuovo a “analitico” che rende tutta la matematica analitica. Per parte mia, ritengo che questo termine sia inutile, poiché mi sembra dare una rappresentazione falsa della natura delle proposizioni e della legge di contraddizione. Non vedo dunque nessun vantaggio a conferirgli un nuovo senso. Tuttavia, sono d’accordo con ciò che vuol dire Couturat, sebbene io pensi che il suo linguaggio sia calcolato per suscitare una logomachia fuori luogo. '!
Come egli stesso precisa, Russell non muove qui un’obiezione sostanziale, ma solo, per così dire, d’opportunità “politica”: non usare una terminologia che potesse rendere implausibile il logicismo agli occhi degli studiosi che non lo conoscevano ancora bene. Poco tempo dopo, il primo gennaio del 1905, Russell scrive a Couturat dicendo
di attribuire poca importanza alla distinzione tra analitico e sintetico in matematica: La distinzione analitico-sintetico mi sembra giusta in filosofia, ma senza importanza in matematica. p . q . > . p è un’inferenza analitica. !!° Così accade, quando si collegano le note caratteristiche con la congiunzione “o”. [Nota di Frege.]
!!! Frege [1884], $ 88, pp. 99-101. !!2 In Russell [2001a], p. 277. !!5 Il brano è riportato da Anne Francoise Schmid in Russell [2001], pp. 278-279, nota 4.
Il logicismo di Russell
887
Sia p“2+2=4”. Siha 2+2=4=3+1=4. Dunque 2+2=4.g9.2.3+1=4. Ecco un’inferenza sintetica [sintetica, secondo Russell, perché la proposizione espressa da “2 + 2=4 . g” non ha tra i suoi costituenti la proposizione espressa da “3 + 1 = 4”]. Sintetico—analitico ha a che fare con il significato delle Prop [‘‘proposizioni”: qui il termine è evidentemente usato in senso linguistico]; sostituendo a una proposizione vera un’altra prop vera, o a una falsa una falsa, in una parte solo della formula, se ne cambia il carattere sotto questo punto di vista, ma non sotto il punto di vista della logica dell’implicazione [cioè, dal punto di vista del valore di verità]. La maggior parte delle inferenze matematiche sono sintetiche [...] Ma ciò non ha importanza matematica, poiché, dal punto di vista del calcolo, non ci si occupa del significato delle Prop, ma solo della loro verità o falsità.!!4
Russell mostra qui di concepire l’analiticità come una proprietà di implicazioni in cui il conseguente è già contenuto nell’antecedente. Evidentemente, però, l'influenza di Couturat cominciava a farsi sentire perché, in un saggio
dello stesso anno, il 1905, dal titolo “Necessity and possibility”, Russell ne accetta la terminologia. In questo saggio, Russell spiega che «il significato tradizionale di analitico combinava due proprietà»: da un lato, la «proprietà da cui era derivato il nome», «che il soggetto di una proposizione analitica, se analizzato, doveva contenere il predicato»; dall’altro la proprietà «supposta equivalente a questa, sebbene in realtà non lo sia», «di essere deducibile [...] dalla legge di contraddizione, o, più in generale, da quelle che sono state ottimisticamente chiamate “leggi È 115 . = S° a iS parer del pensiero”».'! Russell spiega che ciò che gli interessa ora è il secondo senso di “analitico”. ‘© Dopo aver sottolineato come pochissimo di ciò che si desiderava includere nell’estensione del termine “analitico”, sia in realtà ricavabile dai principi tradizionalmente inclusi tra le “leggi del pensiero”, come i principi di non contraddizione, di identità, e del terzo escluso, !7 Russell scrive: Vogliamo, pertanto, un significato più ampio di analitico di quello tradizionale [nel secondo senso spiegato sopra], se la sua esten-
sione deve rimanere affatto quella che si era supposta in precedenza. Possiamo ottenere un tale significato adottando un suggerimento dovuto a M. Couturat. Un certo ampio corpo di proposizioni, cioè (approssimativamente) quelle costituenti la logica formale e la matematica pura, [...] sono tutte deducibili da un piccolo numero di premesse logiche generali [...]. Queste premesse logiche generali assolvono le stesse funzioni che in precedenza si supponevano assolte dalle cosiddette “leggi del pensiero”: esse si possono chiamare “leggi della logica”.'!* Dalle leggi della logica saranno deducibili tutte le proposizioni della logica formale e della matematica pura. Possiamo, quindi, definire utilmente come analitiche quelle proposizioni che sono deducibili dalle leggi della logica; e questa definizione è conforme nello spirito, sebbene non nella lettera, all’uso pre-kantiano. Certamente Kant, rilevando che la matematica pura consiste di proposizioni sintetiche, rilevava, fra le altre cose, che la matematica pura non si può dedurre dalle sole leggi logiche. In questo ora noi sappiamo che sbagliava e che Leibniz aveva ragione; chiamare analitica la matematica pura è quindi un modo appropriato di esprimere un dissenso da Kant su questo punto.'!°
Il saggio in cui compare questo brano non fu poi pubblicato durante la vita di Russell. Fu invece pubblicata, ‘sempre nel 1905, la sua recensione a La Science et l’hypothèse di Poincaré, dove “sintetico” è adoperato nel vecchio senso — la ragione “politica” (nel senso indicato dal brano della lettera a Élie Halévy che abbiamo riportato) di quest’uso del termine è qui evidente. Quest’uso permane ancora nell’articolo “Some explanations in reply to Mr. Bradley”, del 1910, e nei Problems of Philosophy, del 1912. Dopo il 1912, invece, Russell si serve perlopiù della terminologia fregeano-couturatiana già considerata utile nel suo saggio non pubblicato del 1905. Così, nella prefazione alla seconda edizione della Critical Exposition of the Philosophy of Leibniz, del 1937, Russell scrive: Ora non direi più, come è invece affermato nelle pagine della presente opera, che le proposizioni della matematica pura sono “sintetiche”. La distinzione fondamentale è tra proposizioni deducibili dalla logica e proposizioni non deducibili dalla logica; per convenienza si possono definire le prime “analitiche” e le seconde “sintetiche”.!°°
È importante però sottolineare che, fino a una certa fase del suo sviluppo filosofico, il Russell che afferma l’analiticità delle proposizioni logico-matematiche non pensa diversamente dal Russell logicista che ne affermava la sinteticità. Nei rari casi in cui Russell usa ancora il termine “analitico” nel vecchio senso — come nel seguente
114 In Russell [2001a], p. 462. 15 Russell [1905g], p. 516.
ibid !!” Ibid.
!!8 Le leggi di identità, contraddizione, e del medio escluso possono, se lo preferiamo, essere incluse tra le “leggi della logica”; ma è più o meno arbitrario ciò che poniamo tra le “leggi” e ciò che poniamo tra le loro conseguenze, e io penso che la lista più conveniente non includa nessuna delle cosiddette “leggi del pensiero”. Se le conserviamo, pertanto, dev'essere solo per il dispiacere di licenziare vecchi servitori che si sono fatti decrepiti al nostro servizio. [Nota di Russell.] i ibra.
120 Russell [1937b], p. 14.
888
capitolo 13
brano dell’ Introduction to Mathematical Philosophy (1919) —, chiarisce di non considerare analitiche le proposizioni logico-matematiche: Tutte le proposizioni della logica hanno una caratteristica che si usa esprimere dicendo che esse sarebbero analitiche, o che le loro contraddittorie sarebbero autocontraddittorie. Questo modo di esprimersi, tuttavia, non è soddisfacente. La legge di contraddizione è solamente una tra le proposizioni logiche; non ha una speciale preminenza; e la dimostrazione che la contraddittoria si qualche proposizione è autocontraddittoria è probabile che richieda altri principi di deduzione oltre alla legge di contraddizione.
In “On scientific method in philosophy” (1914), Russell scrive: La nostra conoscenza della geometria pura è a priori ma è interamente logica. La nostra conoscenza della geometria fisica è sintetica, ma non è a priori. [...] Alla domanda “Com’è possibile la conoscenza sintetica a priori?” possiamo ora rispondere, almeno per SI SI ale ” é EE} 2 LA “ URI s 99 122 quanto riguarda la geometria, “Non èS possibile”, se TP“sintetico” significa “non deducibile dalla sola logica”.
Dalla clausola «se di una conoscenza Intorno al 1920 della matematica.
“sintetico” significa...», sembra di poter qui arguire che Russell non escluderebbe la possibilità geometrica sintetica a priori, se “sintetico” non significasse “non deducibile dalla sola logica”. c’è però un cambiamento di prospettiva rilevante, nella concezione russelliana della logica e Sotto l’influsso del Wittgenstein del Tractatus, Russell giunse a considerare la conoscenza logi-
co-matematica come tautologica e, infine, come meramente verbale. Ciò comporta, naturalmente, il rifiuto della
precedente idea russelliana che le conseguenze di una deduzione logica possano essere più ricche d’informazione delle premesse. La prima traccia chiara di questo mutamento si trova in The Analysis of Mind (1921): La proposizione che due più due fa quattro segue dalle definizioni per mezzo di una deduzione puramente logica: ciò significa che la sua verità risulta, non dalle proprietà di oggetti, ma dai significati [meanings] dei simboli. Ora i simboli, in matematica, signifi cano ciò che scegliamo; così la sensazione di autoevidenza, in questo caso, sembra spiegabile con il fatto che l’intera questione è sotto il nostro controllo. Non voglio asserire che questa sia tutta la verità sulle proposizioni matematiche, perché la questione è complicata, e io non so quale sia tutta la verità. Ma vorrei suggerire che la sensazione di autoevidenza nelle proposizioni matematiche abbia a che fare con il fatto che esse riguardano il significato dei simboli, e non le proprietà del mondo come quelle che potrebbe rivelare l’osservazione esterna.'?
Ciò che Russell afferma qui con qualche incertezza, è ripreso con maggiore baldanza in The Analysis of Matter (1927). Qui Russell distingue due sensi di “analitico”: Tradizionalmente, una proposizione “analitica” era quella la cui contraddittoria era autocontraddittoria, o, ciò che nella logica ari-
stotelica risulta la stessa cosa, quella che ascriveva a un soggetto un predicato che era parte di esso — per es., “I cavalli bianchi sono cavalli”. In pratica, tuttavia, una proposizione analitica era quella la cui verità si potesse conoscere per mezzo della sola logica. Questo significato sopravvive, ed è ancora importante, sebbene non possiamo più usare la definizione in termini di soggetto e predicato o quella in termini della legge di contraddizione. Quando Kant sosteneva che “7 + 5 = 12” è sintetico, usava la definizione soggetto-predicato, come mostra il suo argomento. Ma quando definiamo una proposizione analitica come quella che può essere dedotta dalla sola logica, allora “7 + 5 = 12” è analitica. D’altra parte, la proposizione che la somma degli angoli di un triangolo è due angoli retti è sintetica. '?*
Russell continua affermando il carattere verbale delle proposizioni della logica e della matematica pura; il riferimento a Wittgenstein è esplicito: Dobbiamo chiederci, pertanto: Qual è la qualità comune delle proposizioni che si possono dedurre dalle premesse della logica? La risposta a questa domanda data da Wittgenstein nel suo Tractatus Logico-Philosophicus mi sembra quella giusta. Le proposizioni che sono parte della logica, o che si possono dimostrare per mezzo della logica, sono tutte tautologie — ossia esse mostrano che certi diversi insiemi di simboli sono modi diversi di dire la stessa cosa, o che un insieme dice parte di quello che dice l’altro insieme. Supponiamo che io dica: “Se p implica g, allora non-q implica non-p”. Wittgenstein afferma che “p implica 9” e “non-q implica non-p” sono semplicemente simboli diversi per una stessa proposizione: il fatto che rende l’una vera (o falsa) è lo stesso fatto che rende l’altra vera (o falsa). Tali proposizioni, pertanto, hanno in realtà a che fare con simboli. Possiamo conoscere la loro verità o falsità senza conoscere il mondo esterno, perché esse hanno solo a che fare con manipolazioni simboliche. Aggiungerei — anche se qui Wittgenstein potrebbe dissentire — che tutta la matematica pura consiste di tautologie nel suddetto senso.!”
12! 22 123 124 125
Russell Russell Russell Russell Russell
[1919a], [1914], [1921a], [1927a], [1927a],
cap. 18, p. 203. p. 119. lecture XIII, p. 264. cap. 17, pp. 170-171. cap. 17, p. 171.
Il logicismo di Russell
889
Più tardi, nell’Inquiry into Meaning and Truth (1940), Russell scrive: «In logica e in matematica, l’opinione 26 che “verità” sia un concetto sintattico è corretta, poiché è la sintassi che garantisce la verità delle tautologie»;'°° e in A History of Western Philosophy (1945), Russell afferma che la conoscenza matematica: E, in realtà, una conoscenza meramente verbale. “3” significa “2 + 1”, e “4” significa “3 + 1”. Ne consegue (sebbene la dimostra-
zione sia lunga) che “4” significa lo stesso di “2 + 2”. Così la conoscenza matematica cessa di essere misteriosa. E esattamente della stessa natura della “grande verità” che ci sono tre piedi in una iarda.'?”
In Human Knowledge (1948), Russell distingue tra significato (meaning), da attribuire alle parole, e significanza (significance), da attribuire agli enunciati;'* poco dopo scrive: La logica si occupa di enunciati [sentences] che sono veri in virtù della loro struttura, e che rimangono sempre veri quando si sostituiscono altre parole, finché la sostituzione non distrugge la significanza [significance]. Prendete, per esempio, l’enunciato: “Se tutti gli uomini sono mortali e Socrate è un uomo, allora Socrate è mortale”. Qui possiamo sostituire altre parole a “Socrate”, “uomo”, e “mortale”, senza distruggere la verità dell’enunciato. È vero che ci sono altre parole nell’enunciato, cioè “se-allora” (che deve contare come una sola parola), “tutti”, “sono”, “e?’, “è”, “un”. Queste parole non si devono cambiare. Ma queste sono parole “logi-
che”, e il loro scopo è indicare la struttura; quando esse si cambiano, si cambia la struttura. [...] Un enunciato appartiene alla logica se possiamo essere sicuri che è vero (o che è falso) senza dover conoscere i significati [meanings] di nessuna delle parole tranne quelle che indicano la struttura. Questa è la ragione dell’uso di variabili. '°°
Qualche capitolo dopo, nello stesso libro, si legge: La logica dimostrativa deduttiva [...] è possibile perché consiste di tautologie, perché semplicemente riformula la nostra partita iniziale di proposizioni in altre parole.'3°
Le stesse tesi sono sviluppate da Russell un manoscritto del 1951 intitolato “Is mathematics purely linguistic?””, che fu pubblicato per la prima volta solo ventidue anni dopo, in Essays in Analysis, la raccolta postuma di scritti russelliani curata da Douglas P. Lackey. In questo saggio, Russell afferma che una caratteristica necessaria delle a 5 È STES n È 5 5 QU) È a proposizioni della logica"?! è quella di contenere solo costanti logiche e variabili.'**? Ma questa, egli osserva, non è una caratteristica sufficiente, «perché di molte proposizioni che la posseggono non si può sapere se sono vere 0 false, tranne forse in virtù di un’evidenza extralogica».'* Russell porta l'esempio della proposizione (in senso linguistico) “Nel mondo ci sono almeno tre oggetti”, che può essere scritta, nel modo familiare, solo facendo uso di costanti logiche e variabili. Russell indica allora una seconda caratteristica che le proposizioni appartenenti alla matematica o alla logica devono avere: L’altra proprietà necessaria per fare di una proposizione una proposizione della matematica o della logica è difficile da definire. È la proprietà tradizionalmente espressa dicendo che le proposizioni che interessano sono “analitiche” o “logicamente necessarie”. Oppure possiamo dire che le verità della logica e della matematica sono “vere in virtù della loro forma”. Se io dico “Socrate fu saggio”, dico qualcosa di sostanziale, che si sa dalla storia e che non si può sapere in altro modo. Ma se dico “Socrate fu saggio o non fu saggio” dico qualcosa che non richiede alcuna conoscenza della storia; la sua verità deriva dal significato delle parole [corsivo mio]. ©
Alla pagina successiva, Russell spiega: La proposizione “La regina Anna è morta” è vera in virtù di una relazione tra le parole e un certo fatto non verbale. Quando sono interessate proposizioni del genere, “verità” non è un concetto sintattico. Ma quale fatto garantisce la verità di “La regina Anna è morta o non è morta”? Nessun fatto che riguarda la regina Anna: non è uno studio storico del suo regno che mi convince ad accetta-
26 Russell [1940], cap. 10, p. 140. 127 Russell [1945], libro III, cap. 31, p. 786 (ediz. americana, p. 832). 128 V. Russell [1948a], parte IV, cap. 3, p. 268 (ediz. americana, p. 251).
129 Russell [1948a], parte IV, cap. 3, pp. 269-270 (ediz. americana, pp. 252-253). 150 Russell [1948a], parte V, cap. 5, p. 393 (ediz. americana, p. 375). 131 Si avverta che, con il termine “proposizioni”, in questo scritto, Russell si riferisce a enunciati, non a entità extralinguistiche (come acca-
deva nei Principles).
132 V. Russell [1951], p. 302. 133 Ibid. 134 Russell [1951], p. 303.
890
capitolo 13 (T9RL) re quest’esempio della legge del terzo escluso. Cè, tuttavia, un fatto che è rilevante; è un fatto circa il significato delle parole “o” e appello fare senza conoscere possono si “non”. È perché questo è il solo fatto rilevante che le proposizioni matematiche
all’osservazione esterna.!5
Russell conclude: Tutte le dimostrazioni matematiche consistono semplicemente nel dire con altre parole in parte o completamente ciò che si dice nelle premesse. Se, da un teorema A, deducete un teorema B, si deve dare il caso che B ripeta A (0 parte di esso) con altre parole. E la verità di A deve risultare dai significati dalle parole usate per enunciarlo.'5°
In Portraits from Memory (1956), Russell scrive di essere giunto «alla conclusione che la matematica è solo l’arte di dire le stesse cose con parole diverse». In My Philosophical Development (1959), egli dichiara di essere giunto a questa conclusione «con molta riluttanza»: La matematica ha smesso di apparirmi non umana nel suo oggetto di studio [subject-matter]. Sono giunto a credere, anche se con
molta riluttanza, che essa consista di tautologie. Temo che, a una mente di sufficiente potenza intellettuale, l’intera matematica ap-
; E % ; ; > . 138 parirebbe banale [trivia/], banale come l’asserzione che un animale a quattro zampe è un animale.
In un altro punto di My Philosophical Development, Russell dichiara di non credere più, come credeva nei Problems of Philosophy (1912), «che le leggi della logica siano leggi delle cose (laws of things); al contrario, ora le considero come puramente linguistiche».'5° Così, l’ultimo Russell revoca la sua antica opinione sul carattere ampliativo della conoscenza logica, pervenendo a concepirla come costituita di enunciati “analitici”, precisamente nel senso che davano a questo termine gli empiristi logici.
1.2. IPRINCIPI LOGICI SONO AUTOEVIDENTI? SONO A PRIORI? In “Logical atomism” (1924), Russell scrive: Sono arrivato alla filosofia attraverso la matematica, o piuttosto attraverso il desiderio di trovare qualche ragione di credere nella verità della matematica. Fin dalla prima giovinezza, ho avuto un ardente desiderio di credere che possa esservi una cosa come la conoscenza, congiunto con una grande difficoltà nell’accettare molto di ciò che passa per conoscenza. Mi sembrava chiaro che la possibilità migliore di trovare una verità indubitabile fosse nella matematica pura [.. Ta
Nei Principles, Russell afferma: [...] tutta la matematica pura tratta esclusivamente con concetti definibili in termini di un numero molto piccolo di concetti logici fondamentali e [...] tutte le sue proposizioni sono deducibili da un numero molto piccolo di principi logici fondamentali [....].!!
Mettendo insieme questi due brani, può venir spontaneo interpretare il logicismo di Russell come una risposta al problema epistemico della certezza della matematica. Si potrebbe cioè interpretare la posizione di Russell come volta a sostenere quello che chiameremo — seguendo Irvine [1989] — “logicismo epistemico”: ossia la posizione secondo cui la riduzione della matematica pura alla logica costituisce una giustificazione della nostra conoscenza della matematica pura, conoscenza basata su quella dei principi della logica i quali, dal canto loro, s’imporrebbero per la loro assoluta autoevidenza. Questa era, in effetti, non solo la posizione di Frege (riguardo all’aritmetica), ma — come ora vedremo — la posizione dello stesso Russell (riguardo a tutta la matematica) nel primissimo periodo del suo logicismo. Tuttavia,
135 150 57 135 13° 14°
Russell Russell Russell Russell Russell Russell
[1951], p. 304. [1951], pp. 304-305. [1956b], “Reflections on My Eightieth Birthday”, p. 58. [1959], cap. 17, pp. 211-212. [1959], cap. 9, p. 102. [1924a], p. 323. V. anche Russell [1956b], “Reflections on My Eightieth Birthday”, p. 54.
14! Russell [1903a], prefazione, p. xx; ediz. orig., p. v.
Il logicismo di Russell
891
con la scoperta dei paradossi — almeno, una volta che Russell si fu reso conto della difficoltà di risolverli — le cose cambiarono. Nei suoi Grundgesetze, Frege aveva ricostruito l’aritmetica a partire da un piccolo numero di principi e regole che apparivano autoevidenti. Con la scoperta del paradosso di Russell, il sistema di Frege si dimostrò tuttavia inconsistente." In My Philosophical Development (1959), Russell ricorda che «Frege fu così turbato da questa contraddizione che abbandonò il tentativo di ridurre l’aritmetica alla logica, al quale, fino ad allora, era stata princi-
palmente dedicata la sua vita».!* Ma Russell non rinunciò. Ai suoi occhi, la contraddizione costituiva una prova che principi logici fino allora ritenuti autoevidenti richiedevano una correzione: «Avevo l’impressione che il problema risiedesse nella logica piuttosto che nella matematica e che fosse la logica a dover essere riformata». HA
La necessità, per i logicisti, di riformare la loro “logica” per non incorrere nei paradossi fu salutata da Poincaré come una riduzione all’assurdo della tesi logicista. Nella terza parte del suo articolo del 1906 “Les mathématiques et la logique”, Poincaré attacca i logicisti (nel novero dei quali egli pone anche Peano e Hilbert) scrivendo: Si devono seguire ciecamente le vostre regole? Sì, altrimenti sarebbe la sola intuizione a permetterci di distinguere tra esse; ma allora devono essere infallibili; è solo in un’autorità infallibile che si può avere una fiducia cieca. Questa è dunque per voi una necessità. Sarete infallibili o non sarete. Non avete il diritto di dirci: “Noi facciamo errori, è vero, ma anche voi ne fate”. Fare errori, per noi, è una disgrazia, una grandissima disgrazia, per voi è la morte. !4
Poincaré prosegue spiegando che il caso di chi, per esempio, sbaglia un’addizione è completamente diverso dal caso dei logicisti, che — a causa dei paradossi — sono costretti a rivedere i loro principi logici. Infatti, un’addizione sbagliata deriva in realtà dal fatto che qualche regola aritmetica non è stata realmente applicata, mentre, al contrario, osserva Poincaré, [...] i logicisti hanno applicato le loro regole, e sono caduti in contraddizione; e questo è tanto vero che essi si apprestano a cambiare queste regole [...]. Perché cambiarle se esse erano infallibili?!‘
Il ragionamento di Poincaré è stringente: se i principi logici sono la sola giustificazione epistemica della matematica, essi devono essere infallibili — ma le antinomie mostrano che non lo sono affatto. La replica di Russell — contenuta nella parte iniziale dell’articolo “Les paradoxes de la logique” (1906) — getta molta luce sulla sua concezione del logicismo: Mi sembra che queste osservazioni [di Poincaré] contengano un fraintendimento delle pretese della logistica [logistique: v. sotto, nota 149], e della natura dell’evidenza su cui si appoggia. Ma è un fraintendimento molto naturale, che può darsi sia stato condiviso da qualcuno dei suoi difensori oltre che dai suoi nemici.'!”
Qui Russell inserisce una nota a piè di pagina in cui dice: «In effetti, lo condivisi io stesso finché non m’imbattei nelle contraddizioni».'* L’idea che Russell dice di aver condiviso e di non condividere più è precisamente ciò che abbiamo chiamato “logicismo epistemico” — ossia quella forma di logicismo che fa coincidere le premesse logiche fondamentali con le premesse epistemiche, garantite da un’assoluta autoevidenza. Russell spiega così la sua posizione: Il metodo della logistica['4] è fondamentalmente lo stesso di quello di ogni altra scienza. C'è la stessa fallibilità, la stessa incertezza, la stessa mescolanza d’induzione e deduzione, e la stessa necessità di appellarsi, per confermare i principi, all’accordo diffuso tra i risultati
del calcolo
e l’osservazione.
[...] In tutto
ciò, la logistica
è esattamente
sullo
stesso
piano
(per esempio)
dell’astronomia, eccetto che, nell’astronomia, la verifica è compiuta non con l’intuizione ma coi sensi. Le “proposizioni primitive”
142 143 14 145 146 147
V_ sopra, cap. 5, $$ 2 e 3. Russell [1959], cap. 7, p. 76. Ibid. Poincaré [1906b], $ II, pp. 295-296. Poincaré [1906b], $ II, p. 296. Russell [1906d], $ I, p. 193.
148 Jbid., nota 2. di “Logistique” era il termine che Couturat propose al Secondo Congresso Internazionale di Filosofia (Ginevra, 1904), in accordo con proposte indipendenti di André Lalande e Gregorius Itelson (v. Couturat [1905], p. 706), per indicare la moderna logica matematica. Il termi-
ne non era però filosoficamente neutro, ma indicava piuttosto la “logica” sviluppata dai logicisti. Russell usa “logistica” in questo senso filosoficamente connotato.
892
capitolo 13 con cui cominciano le deduzioni della logistica dovrebbero, se possibile, essere evidenti [evidenz] all’intuizione; ma ciò non è indi-
spensabile e non è neppure, in nessun caso, l’intera ragione per accettarle. Questa ragione è induttiva, ovverosia che, tra le loro conseguenze conosciute (incluse esse stesse), molte appaiono vere all’intuizione, nessuna appare falsa all’intuizione, e quelle che appaiono vere all’intuizione non sono, per quanto è possibile vedere, deducibili da alcun sistema di proposizioni indimostrabili inconsistente con il sistema in questione. Pr Fra diversi sistemi che soddisfano tutte queste condizioni, è da preferire, esteticamente, quello le cui proposizioni primitive sono
meno numerose e più generali [...].!°
Questa risposta a Poincaré non era, per Russell, una difesa occasionale, né dipendeva dall’esigenza di legittima-
re l'assunzione del suo assioma di riducibilità, ! proposto per la prima volta nello stesso saggio: il logicismo epistemico non era più la posizione di Russell da anni. Il 4 giugno del 1903, Couturat scrisse una lettera a Russell in cui si dichiarava molto deluso della prima parte dei Principles — della quale aveva appena terminato la lettura — poiché i principi su cui Russell fondava il suo sistema avrebbero mancato di «evidenza intuitiva». Il 9 giugno Russell rispose a Couturat: È per evitare paralogismi e conseguenze false che ho dovuto adottare un sistema tanto repellente; e a meno che non prendiate un centinaio d’assiomi, non potrete far a meno di premesse che non abbiano evidenza. Del resto, conoscete la massima di Dedekind:
Was beweisbar ist, soll in der Wissenschaft nicht ohne Beweis geglaubt werden [«Nella scienza non si deve credere senza dimostrazione a ciò che è dimostrabile»: è la frase con cui si apre la prefazione alla prima edizione di Dedekind [1988]]. Se si accetta questo principio, si ha il dovere di ridurre per quanto possibile il numero degli assiomi.'5
In un’altra lettera a Couturat del 5 ottobre dello stesso anno, Russell spiega più ampiamente il suo punto di vista: Per [quanto riguarda] l’intuizione, credo anch'io che sia essenziale come supporto soggettivo [subjectif] di qualsiasi ragionamento. Ma direi: (1) che molte cose che si credono intuitive prima di rifletterci si scoprono infine molto complicate, (2) che è l’intuizione
dello scienziato, e anche dello scienziato che ha maggiormente analizzato i fatti logici, che si deve adottare, (3) che spesso è meglio non prendere come premessa la verità che appare più intuitiva, ma un’altra che le equivale da un punto di vista logico, e che è più semplice nel senso logico. Perché la semplicità logica è tutt'altra cosa dell’evidenza intuitiva. Ciò che è essenziale, è che ci sia sufficiente evidenza intuitiva per reggere la costruzione; ma non è necessario che tutta l’evidenza si trovi nelle premesse. Del resto, [ia proposizione può sembrare molto difficile un giorno, e divenire chiarissima il giorno dopo — è una questione molto soggettiva.!
Tesi simili sono articolate nel testo di una conferenza tenuta da Russell al Cambridge Mathematical Club il 9 marzo 1907, intitolata “The regressive method of discovering the premises of mathematics” e pubblicata per la prima volta nell’antologia postuma di saggi russelliani Essays in Analysis. Qui, Russell si propone di spiegare: [...] in che senso una proposizione relativamente oscura e difficile possa dirsi la premessa di una proposizione relativamente ovvia [obvious], esaminare come possano essere scoperte premesse in questo senso, e sottolineare la stretta analogia tra i metodi della matematica pura e i metodi delle scienze basate sull’osservazione.'°°
Russell comincia con il notare che: C'è un’apparente assurdità nel procedere, come si fa nella teoria logica [logicista] dell’aritmetica, attraverso molte proposizioni di logica simbolica piuttosto oscure, alla “dimostrazione” di truismi come 2 + 2 = 4: perché è chiaro che la conclusione è più certa delle premesse, e la supposta dimostrazione sembra quindi futile.'5°
L’“apparente assurdità” deriva proprio, come chiarirà la trattazione seguente di Russell, dal fatto di intendere il
logicismo come “logicismo epistemico”, cioè come una teoria che si propone di giustificare la conoscenza della matematica pura sulla base di una presupposta conoscenza della logica. In realtà — secondo Russell — è vero proprio il contrario: la nostra conoscenza della logica si basa, spesso, sulla nostra conoscenza della matematica 150 Russell [1906d], $ I, p. 194. !51 Come suggeriscono diversi autori: v. Hylton [1990a], cap. 7, p. 322; Proops [2006], $$ 7 e 8; e Kraal [2015], p. 1500. 152 In Russell [2001a], p. 295. La sottolineatura è di Couturat.
!53 !°4 !55 So
In Russell [2001a], p. 297. In Russell [2001], pp. 305-306. Russell [1907a], p. 272. lTpidi
Il logicismo di Russell
893
pura. Ciò, nonostante che tutta la matematica pura derivi dalla logica. Com'è possibile questo? Seguiamo la spie-
gazione di Russell: [...] ciò che dimostriamo in realtà non è la verità di 2 + 2= 4, ma il fatto che si può dedurre questa verità dalle nostre premesse. La stessa proposizione 2 + 2 = 4 ci appare ora ovvia; e se ci si chiedesse di dimostrare che 2 pecore + 2 pecore = 4 pecore, saremmo propensi a dedurlo da 2 + 2 = 4. Ma la proposizione “2 pecore + 2 pecore = 4 pecore” era probabilmente nota ai pastori migliaia di anni prima che fosse scoperta la proposizione 2 + 2 = 4; e quando 2 + 2 = 4 fu scoperto per la prima volta, fu probabilmente inferito dal caso delle pecore o da altri casi concreti. Si vede quindi che la parola “premessa” ha due sensi del tutto diversi: c’è quella che possiamo chiamare la “premessa empirica”, che è la proposizione o le proposizioni dalle quali siamo di fatto condotti a credere alla proposizione in questione; e c’è quella che chiameremo la “premessa logica”, che è una proposizione o più proposizioni logicamente più semplici dalle quali, con una deduzione valida, si può ottenere la proposizione in questione. Così le premesse empiriche di Dai FAlUOnO “2 pecore + 2 pecore = 4 pecore” e altri fatti simili; mentre le premesse logiche saranno certi principi di logica simbolica.
Russell distingue dunque due possibilità di ordinare le nostre conoscenze: secondo un ordine logico o secondo un ordine epistemologico. Sebbene questi ordini si trovino talvolta a coincidere, non necessariamente è così. L’ordine logico porta dal logicamente più semplice al logicamente più complesso, ma l’ordine epistemologico non rispetta sempre questa gerarchia: La “semplicità logica” di una proposizione si misura, per dirla in modo grossolano, dal numero dei suoi costituenti. Così 2+2=4 è più semplice di 2 pecore + 2 pecore = 4 pecore, perché l’ultima contiene tutti i costituenti della prima con un’aggiunta, ovverosia “pecore”. È un errore supporre che un’idea o una proposizione più semplice sia sempre più facile da afferrare di una più complicata; e quest’errore è stato la fonte di molti degli errori dei filosofi dell’a priori. Le proposizioni più facili da afferrare stanno all’incirca nel mezzo, non sono né molto semplici né molto complesse." 3
Russell prosegue: Quando giungiamo al di là del grado di complessità che rende le proposizioni più facili, la premessa empirica e la premessa logica immediata generalmente coincideranno. Così in matematica, tranne che nelle prime parti, le proposizioni dalle quali si deduce una data proposizione danno generalmente la ragione per cui crediamo alla proposizione data. Ma trattando con i principi della matematica, questa relazione s’inverte. Le nostre proposizioni sono troppo semplici per essere facili, e così le loro conseguenze sono generalmente più facili di esse. Perciò tendiamo a credere alle premesse perché possiamo vedere che le loro conseguenze sono vere, invece di credere alle conseguenze perché sappiamo che le premesse sono vere.'°°
Questo stesso punto è ripreso da Russell più volte, negli scritti successivi. Facciamo qualche esempio. In “L’importance philosophique de la logistique” (1911), si legge: Sull'argomento delle verità autoevidenti occorre evitare un malinteso. L’autoevidenza è una proprietà psicologica ed è quindi soggettiva e variabile. È essenziale per la conoscenza, poiché tutta la conoscenza dev'essere autoevidente o dedotta da conoscenza autoevidente. Ma l’ordine della conoscenza che si ottiene partendo da ciò che è autoevidente non è la stessa cosa dell’ordine della deduzione logica, e non dobbiamo supporre che quando diamo tali e tali premesse per un sistema deduttivo, siamo dell’opinione che queste premesse costituiscano ciò che è autoevidente nel sistema. In primo luogo l’autoevidenza ha dei gradi: è possibilissimo che le conseguenze siano più evidenti delle premesse. In secondo luogo può capitare che siamo sicuri della verità di molte delle conseguenze, ma che le premesse appaiano solo probabili, e che la loro probabilità si debba al fatto che da esse derivano conseguenze vere. In tal caso, ciò di cui siamo certi è che le premesse implicano tutte le conseguenze vere che si volevano porre nel sistema deduttivo. Quest’osservazione si applica ai fondamenti della matematica, poiché molte delle premesse fondamentali sono intrinsecamente meno evidenti di molte delle conseguenze che si deducono da esse.!°
Nell'Introduction to Mathematical Philosophy (1919) leggiamo: Le cose più ovvie e facili in matematica non sono quelle che si presentano logicamente all’inizio; sono le cose che, dal punto di vista della deduzione logica, si presentano più o meno nel mezzo. Proprio come i corpi più facili a vedersi sono quelli che non sono molto vicino né molto lontano, non molto piccoli né molto grandi, così i concetti più facili da afferrare sono quelli che non sono molto complessi né molto semplici (usando “semplici” in un senso logico). E come abbiamo bisogno di due sorte di strumenti, il telescopio e il microscopio, per l’ampliamento dei nostri poteri visivi, così abbiamo bisogno di due sorte di strumenti per
!57 !58 159 160
Russell Russell Russell Russell
[1907a], [1907a], [1907a], [1911c],
pp. 272-273. p. 273. pp. 273-274. pp. 293-294.
894
capitolo 13 l'ampliamento dei nostri poteri logici, uno per condurci innanzi verso l’alta matematica, l’altro per condurci indietro verso i fondaè
è
se
5
.
.
.
Ira
161
menti logici delle cose che in matematica siamo inclini a tenere per certe. °
In “Logical atomism” (1924), Russell scrive: Quando la matematica pura è organizzata come sistema deduttivo — ossia come la classe di tutte quelle proposizioni che si possono dedurre da una classe assegnata di premesse — diviene ovvio che, se dobbiamo credere alla verità della matematica, non può essere soltanto perché crediamo nella verità della classe di premesse. Alcune delle premesse sono molto meno ovvie di alcune delle loro conseguenze, e sono credute principalmente a causa delle loro conseguenze. Si troverà che è sempre così quando una scienza è organizzata come sistema deduttivo. Non sono le proposizioni logicamente più semplici del sistema ad essere le più ovvie, o a forniîre la parte principale delle nostre ragioni per credere nel sistema. Con le scienze empiriche questo è evidente. L’elettrodinamica, per esempio, si può concentrare nelle equazioni di Maxwell, ma queste equazioni sono credute a causa della verità osservata di certune delle loro conseguenze logiche. Esattamente la stessa cosa accade nel puro regno della logica; i principi della logica logicamente primi — almeno alcuni di essi — si devono credere, non di per sé, ma per le loro conseguenze. La questione epistemologica: “Perché dovrei credere questa classe di proposizioni?” è del tutto differente dalla questione logica: “Qual è il gruppo di proposizioni più piccolo e logicamente più semplice dal quale questa classe di proposizioni può essere dedotta?” Le nostre ragioni per credere alla logica e alla matematica pura sono, in parte, solo induttive e probabili, a dispetto del fatto che, nel loro ordine logico, le proposizioni della logica e della matematica pura seguano dalle premesse della logica per deduzione pura. Penso che questo punto sia importante, perché è facile che sorgano errori dall’assimilare l’ordine logico all’ordine epistemologico. Il solo modo in cui il lavoro sulla logica matematica getta luce sulla verità o falsità della matematica è attraverso la confutazione delle supposte antinomie. Ciò mostra che la matematica può essere vera. Ma mostrare che la matematica è vera richiederebbe altri metodi e altre considerazioni.- 162
Russell respinge dunque nettamente il logicismo epistemico." Invece, sottolinea costantemente la stretta analogia tra il metodo delle scienze empiriche e il metodo usato nella matematica e nella logica: Ma l’inferenza delle premesse dalle conseguenze è l’essenza dell’induzione; quindi il metodo nel ricercare i principi della matematica è in realtà un metodo induttivo, ed è sostanzialmente lo stesso metodo impiegato per scoprire leggi generali in qualsiasi altra D 164 scienza.
Si osservi che con ‘metodo induttivo” Russell non intende qui l’induzione per semplice enumerazione, cioè il metodo empirico di trarre una conclusione generale da un certo numero di esempi particolari — nell’esempio classico, concludere che tutti i corvi sono neri dall’aver esaminato un buon numero di corvi e dal non averne mai trovato uno che non sia nero —, ma il metodo oggi noto come ipotetico-deduttivo.' Questo appare da accenni in alcuni dei brani di Russell che ho già riportato ed è chiarito più dettagliatamente nel seguente passo dei Principles: Se P è la premessa empirica, sia A la classe degli insiemi di proposizioni (nella loro forma più semplice) da cui [cioè, da ciascuno dei quali] P può essere dedotta; e due membri della classe A siano considerati equivalenti quando essi si implicano l’un l’altro. Dalla verità di P noi inferiamo la verità di un insieme della classe A. Se A ha soltanto un membro, questo membro dev'essere vero. Ma se vi sono molti membri della classe A, non tutti equivalenti, cerchiamo di trovare qualche altra premessa empirica P', implicata da tutti gli insiemi di proposizioni semplici della classe A'. Se ora accade che le classi A e A'hanno soltanto un membro in comune, e gli altri membri di A sono inconsistenti con gli altri membri di A', il membro comune dev'essere vero. Se no, cerchiamo una nuova premessa empirica P", e così via. Questa è l’essenza dell’induzione. [...] La premessa empirica non è in nessun senso essenziale una premessa, ma è una proposizione a cui noi vogliamo che giunga la nostra deduzione. Scegliendo le premesse della nostra deduzione, noi siamo guidati soltanto dalla semplicità logica e dalla deducibilità delle nostre premesse empiriche.'°°
10! Russell [1919a], cap. l, p.2.
162 Russell [1924a], pp. 325-326. 163 Questa è anche la tesi di fondo sostenuta in Irvine [1989].
164 Russell [1907a], p. 274. '°5 Il termine “ipotetico-deduttivo” fu introdotto dal collaboratore di Peano Mario Pieri alla fine dell’800, ma era riferito ai sistemi assiomatici formali, non a un metodo scientifico — come nell’uso poi reso popolare da Karl Popper. Nel saggio del 1899 “Della geometria elementare come sistema ipotetico deduttivo”, Pieri scrive:
«Per sistema ipotetico-deduttivo intendiamo qualunque dottrina puramente deduttiva — o scienza di ragionamento — la quale non solo distingua organicamente i giudizi a priori, o primitivi, da quelli derivati o dedotti, o insomma gli assiomi e postulati dai teoremi; ma così ancora e nella stessa misura disponga le varie nozioni intorno a cui versano questi giudizi, segnalando perciò le idee madri, primitive, o indecomposte, e mantenendole ben distinte da quelle che ne sono riproduzioni e derivazioni formali o possono aversi per tali, e che insomma risultano effettivamente composte mediante le prime combinate fra loro e con le categorie della Logica» (Pieri [1900], p. 173; spaziati e corsivi nell’originale).
160 Russell [1903a], $ 420, p. 441.
Il logicismo di Russell
895
Semplifichiamo il ragionamento di Russell considerando un caso in cui si abbiano solo due teorie in competizione. Abbiamo dunque, per iniziare, un certo fatto P che desideriamo spiegare. Supponiamo che vi siano solo due teorie non equivalenti, 7 e 7", da cui è possibile dedurre P. Per decidere tra 7 e 7' cerchiamo — eventualmente attraverso l’esperimento —
un nuovo fatto P' che possa essere dedotto, per es., dalle teorie
7 e 7", 7", ..., ma non
dalla teoria 7”. In questo caso, la teoria vera dev'essere 7. Una questione importante, per il tema che stiamo affrontando, riguarda il significato che Russell attribuisce al termine “premessa empirica”. Poiché in “The regressive method of discovering the premises of mathematics” Russell dice che i principi di tutte le scienze, logica e matematica compresa, si ricavano elaborando ipotesi che rendano conto delle “premesse empiriche”, sembra quasi inevitabile concluderne che — per Russell — la logica e la matematica debbano essere considerate a posteriori, né più né meno delle altre scienze. In apparenza questa conclusione sembra confermata dal passo del saggio menzionato in cui Russell dice che [...] la proposizione “2 pecore + 2 pecore = 4 pecore” era probabilmente nota ai pastori migliaia di anni prima che fosse scoperta la proposizione 2 + 2 = 4; e quando 2+ 2 = 4 fu scoperto per la prima volta, fu probabilmente inferito dal caso delle pecore o da altri casi concreti [corsivo mio].!”
Sembra dunque che il procedimento che ha in mente Russell sia qualcosa del genere: constatiamo una serie di fatti relativi alla somma di oggetti concreti — uno di essi essendo, per esempio, che 2 pecore + 2 pecore = 4 pecore — e cerchiamo un’ipotesi che possa rendere conto di questi fatti in modo rigoroso e ordinato; così scopriamo la leggi dell’addizione, come la legge 2 + 2 = 4. Una volta fatto questo, cerchiamo ulteriori ipotesi che rendano conto di queste leggi aritmetiche, giungendo così alle premesse logiche fondamentali. Quest’interpretazione, secondo cui Russell sosterrebbe una variante della posizione empirista di John Stuart Mill, che vede nella matematica pura una scienza a posteriori, non può tuttavia essere corretta. Russell è infatti esplicito nell’affermare che la logica e la matematica pura sono a priori. Proprio nello stesso scritto “The regressive method...” da cui è tratto l’ultimo brano riportato, Russell scrive: La funzione dell’ovvietà intrinseca [intrinsic obviousness] in un qualsiasi corpo di conoscenze richiede alcune considerazioni. Bisogna osservare che essa dà necessariamente la base per ogni altra conoscenza: le nostre premesse empiriche devono essere ovvie [obvious]. Nelle scienze naturali l’ovvietà è quella dei sensi, mentre nella matematica pura è un’ovvietà a priori, come quella della legge di contraddizione."
Di fronte a quest’affermazione di Russell si può restare confusi: egli non aveva forse detto, poco prima, che la legge 2+ 2= 4 fu probabilmente inferita da casi particolari come 2 pecore + 2 pecore = 4 pecore? Certamente Russell non può intendere dire che “2 pecore + 2 pecore = 4 pecore” sia noto a priori — se non altro perché non si può supporre che egli possa considerare noto a priori il concetto di “pecora”. Il punto è che il termine “premesse empiriche” è usato da Russell in un modo idiosincratico e potenzialmente fuorviante: “premesse epistemiche” sarebbe stato migliore, per esprimere ciò intendeva." Quelle che in “The regressive method...” Russell chiama le “premesse empiriche” dell’aritmetica non sono soltanto enunciati come “2 pecore + 2 pecore = 4 pecore” ma anche enunciati come “2 + 2 = 4”: le premesse empiriche sono semplicemente ciò che ci pare ovvio all’inizio, ciò da cui partiamo alla ricerca di leggi generali. Riportiamo, in proposito, un altro passo di “The regressive method...”: In tutte le scienze si parte da un corpo di proposizioni di cui ci sentiamo abbastanza sicuri. Queste sono le nostre premesse empiriche, comunemente chiamate 1 fatti, che di solito si ricavano dall’osservazione. A questo punto ci possiamo chiedere: Che cosa deriva da questi fatti? oppure, da dove derivano questi fatti? Le leggi generali di una scienza sono proposizioni logicamente più semplici delle premesse empiriche di questa scienza, ma sono tali che le premesse empiriche, o alcune di esse, possono essere dedotte da queste leggi. Le leggi diventano certe come le premesse empiriche solo se riusciamo a mostrare che nessun’altra ipotesi porterebbe alle premesse empiriche, o (cosa che può accadere in matematica) se si scopre che le leggi, una volta ottenute, sono esse stesse ovvie [obvious], e quindi suscettibili di diventare esse stesse premesse empiriche [corsivo mio].!?°
167 Russell [1907a], p. 272. 168 Russell [1907a], PAZZO:
169 Russell usa in effetti il termine “premesse epistemologiche”, in un senso affine, in Theory of Knowledge (v. Russell [1913a], parte I, cap. 4, p. 50), e in An Inquiry into Meaning and Truth (v. Russell [1940], cap. 9).
17° Russell [1907a], p. 274.
capitolo 13
896
Leggi come “2 + 2 = 4”, tratte da premesse come “2 pecore + 2 pecore = 4 pecore”, sono per Russell esse stesse ovvie, e sono quindi, nella sua terminologia, “premesse empiriche”, sebbene la loro evidenza non sia tratta dall’esperienza. Si comincia dunque a comprendere come sia possibile che certe “premesse empiriche” (ossia premesse epistemiche) possano essere considerate da Russell a priori. Ma perché, allora, Russell sembra suggerire che la conoscenza della legge “2 + 2 = 4” sia stata inferita dalla precedente constatazione di verità empiriche sulla somma, per es., delle pecore? Questa appare la posizione di un empirismo radicale che considera le leggi matematiche come a posteriori. Su questo problema getta luce il settimo capitolo dei Problems of Philosophy, intitolato “Sulla nostra conoscenza dei principi generali” (“On our knowledge of general principles”). Qui Russell prende spunto dall’antica disputa tra empirismo e razionalismo: Una delle grandi controversie storiche in filosofia è la controversia tra le due scuole rispettivamente chiamate “empiristi” e “razio-
nalisti”. Gli empiristi — che sono rappresentati al meglio dai filosofi inglesi, Locke, Berkeley, e Hume — sostenevano che tutta la nostra conoscenza è derivata dall’esperienza; i razionalisti — che sono rappresentati dai filosofi continentali del diciassettesimo secolo, specialmente Descartes e Leibniz — sostenevano che, in aggiunta a ciò che conosciamo per esperienza, ci sono certe “idee innate”, che conosciamo in modo indipendente dall'esperienza. È ora divenuto possibile decidere con una certa sicurezza sulla verità o falsità di queste opposte scuole.!”!
Russell prosegue sostenendo che i principi logici non possono essere provati dall’esperienza, poiché qualsiasi dimostrazione presuppone questi stessi principi. In questo senso — egli dice — i razionalisti avevano ragione. Ma Russell ritiene, nondimeno, che l’esperienza abbia un suo ruolo anche nella conoscenza dei principi logici: D'altra parte, anche quella parte della nostra conoscenza che è logicamente indipendente dalla nostra esperienza (nel senso che l’esperienza non può provarla) è tuttavia suscitata [elicited] e causata [caused] dall'esperienza. È in occasione di esperienze particolari che diveniamo consapevoli delle leggi generali che le circostanze esemplificano. Sarebbe certamente assurdo supporre che vi siano principi innati nel senso che i bambini nascano con una conoscenza di tutto ciò che sanno gli uomini e che non può essere dedotto da ciò di cui si è fatto esperienza. Per questa ragione, non s’impiegherebbe oggi la parola “innato” per descrivere la nostra conoscenza dei principi logici. L'espressione “a priori” è meno soggetta a obiezioni, ed è più usuale negli scrittori moderni. Così, pur ammettendo che tutta la conoscenza è suscitata e causata dall’ esperienza, sosterremo tuttavia che qualche conoscenza è a priori, nel senso che l’esperienza che ce la fa pensare non è sufficiente a provarla, ma solo dirige la nostra attenzione in modo che noi vediamo CHA UUiRO a È 9 172 la sua verità senza richiedere nessuna prova dall’esperienza [corsivo mio].!”
Come gli empiristi classici, Russell ritiene dunque implausibile l’esistenza di idee innate. D'altra parte, egli ammette che abbiamo conoscenze a priori: con questo termine egli intende conoscenze che, pur non essendo innate, non sono derivate dall’esperienza, ma possono svilupparsi solo a partire dall’esperienza.'" Quest’idea non può non richiamare l’inizio della seconda edizione della Critica della ragion pura, laddove Kant, dopo aver dichiarato: «Non c’è dubbio che ogni nostra conoscenza incomincia con l’esperienza», osserva: «Ma benché ogni nostra conoscenza cominci con l’esperienza, da ciò non segue che essa derivi interamente dall’esperienza».!”* Russell porta, in proposito, un esempio che riguarda la nostra conoscenza di ciò che è eticamente valido: Non parlo di giudizi riguardo a ciò che è utile o ciò che è virtuoso, poiché tali giudizi richiedono premesse empiriche; parlo di giudizi riguardo all’intrinseca desiderabilità delle cose. Se qualcosa è utile, dev'essere utile perché ottiene un certo fine; il fine, se siamo andati abbastanza lontano, dev'essere valido di per sé, e non solo perché è utile per qualche fine ulteriore. Così tutti i giudizi riguardo a ciò che è utile dipendono da giudizi riguardo a ciò che ha valore di per sé. Noi giudichiamo, per esempio, che la felicità è più desiderabile dell’infelicità, la conoscenza dell’ignoranza, la benevolenza dell’odio, e così via. Tali giudizi devono, in parte almeno, essere immediati e a priori. Come i nostri precedenti giudizi a priori, essi possono essere suscizati dall’esperienza, e di fatto devono esserlo; poiché non sembra possibile giudicare se qualcosa è intrinse-
!7! Russell [1912a], cap. 7, pp. 114-115. 172 Russell [1912a], cap. 7, pp. 115-116. !° AI tempo dell’ Essay on the Foundations of Geometry (1897), Russell ammetteva, in modo simile, che la conoscenza a priori possa svilupparsi solo a partire dall’esperienza, ma non la definiva come conoscenza logicamente indipendente dall’esperienza (nel senso che l’esperienza non può provarla); la definiva (in modo più forte) come conoscenza logicamente presupposta dall’esperienza (nel senso che senza di essa l’esperienza sarebbe impossibile). Nel saggio citato egli scrive: «a priori si applica a qualsiasi parte di conoscenza che, sebbene forse suscitata [elicited] dall’esperienza, è logicamente presupposta nell’esperienza» (Russell [1897a], $ 2, p. 2); e poco più avanti
chiarisce: «Il mio test di apriorità sarà puramente logico: Sarebbe forse l’esperienza impossibile, se un certo assioma o postulato fosse negato? O, in un senso più ristretto, che dà l’apriorità solo all’interno di una scienza particolare: Sarebbe forse impossibile l’esperienza riguardo a quella scienza, senza un certo assioma o postulato?» (Russell [1897a], $ 5, p. 3).
!?4 Kant [1781], introduzione, $ I, pp. 73-74 (B 1).
Il logicismo di Russell
897
camente valida senza che abbiamo esperito qualcosa dello stesso genere. Ma è del tutto ovvio che essi non possono essere provati dall’esperienza; perché il fatto che una cosa esiste o non esiste non può provare che la sua esistenza sia un bene o che sia un male. La ricerca su quest’argomento appartiene all’etica, nell’ambito della quale si deve stabilire l'impossibilità di dedurre ciò che dovrebbe essere da ciò che è. Nel presente contesto, è importante solo rendersi conto che la conoscenza riguardo a ciò che ha valore intrinseco è a priori nello stesso senso in cui è a priori la logica, cioè nel senso che la verità di una tale conoscenza non può essere né provata né refutata attraverso l’esperienza.'”°
Riguardo all’etica, Russell — nel passo riportato ancora sotto l’influenza dei Principia Ethica (1902) di George E. Moore — muterà in seguito idea; ma l’esempio serve bene a illustrare ciò che c’interessa ora riguardo alla logica. Russell pensa a qualcosa di simile: abbiamo la facoltà di riconoscere determinate verità come evidenti, ma perché questa facoltà si traduca in una vera conoscenza
di queste verità occorre il contatto con l’esperienza. Quando
l’esperienza ci ha suggerito tali verità, mostrandocene degli esempi, non abbiamo alcun bisogno di ricorrere a un metodo induttivo (ipotetico-deduttivo) per assicurarcene: siamo direttamente in grado di riconoscerle. Per tornare all’esempio precedente, la legge “2 + 2 = 4” sarebbe riconosciuta come evidentemente vera, una volta che ci sia
stata suggerita, per es., dall’esperienza che mettendo insieme 2 pecore con altre 2 pecore ne abbiamo 4. Non abbiamo bisogno di ripetere l’esperimento diverse volte — in diverse circostanze e usando, per esempio, tapiri, giraffe o piroghe al posto delle pecore — alla ricerca di una conferma empirica dell’ipotesi che 2 + 2 = 4: sappiamo
già che 2 + 2 = 4, senza bisogno di ulteriori conferme, ne siamo certi non appena l’esperienza è riuscita a richiamare la nostra attenzione su questa legge. Nel complesso, la teoria di Russell è qui molto simile a quella che, più tardi, sosterrà l’empirista logico Alfred J. Ayer nel seguente brano di Language, Truth and Logic (1936): Quando diciamo che le verità della logica sono conosciute indipendentemente dall’esperienza, naturalmente non stiamo dicendo che esse siano innate, nel senso che siamo nati conoscendole. È ovvio che matematica e logica devono essere imparate nello stesso
modo in cui devono essere imparate la chimica e la storia. Né stiamo negando che il primo a scoprire una data verità logica o matematica sia stato condotto ad essa da un procedimento induttivo. È molto probabile, per esempio, che il principio del sillogismo non sia stato formulato prima ma dopo che si era osservata la validità del ragionamento sillogistico in un certo numero di casi. Ciò che discutiamo, tuttavia, quando diciamo che verità logiche e matematiche sono conosciute indipendentemente dall’esperienza, non è una questione storica concernente il modo in cui queste verità sono state originariamente scoperte, né una questione psicologica concernente il modo in cui ciascuno di noi giunge a impararle, ma una questione epistemologica. La tesi di Mill che respingiamo è che le proposizioni di logica e matematica abbiano lo stesso status delle ipotesi empiriche; che la loro validità sia determinata nello stesso modo. Noi sosteniamo che esse sono indipendenti dall’esperienza nel senso che non devono la loro validità a una verificazione empirica. Possiamo arrivare a scoprirle attraverso un processo induttivo; ma una volta che le abbiamo afferrate [apprehended] vediamo che sono necessariamente vere, che valgono per ogni esempio concepibile. E questo serve a distinguerle dalle generalizzazioni empiriche. Sappiamo infatti che una proposizione la cui validità dipende dall’esperienza non può essere considerata come necessariamente e universalmente vera.'”°
Un passo, questo di Ayer, che appare chiaramente ispirato alla concezione di Russell. Come abbiamo visto prima, il risalire da una certa premessa empirica (epistemica) a un principio più generale non conduce necessariamente, per Russell, a una nuova premessa empirica, cioè a un principio garantito dalla sua stessa autoevidenza. Questo è vero, secondo Russell, quando si risale da “2 pecore + 2 pecore = 4 pecore” a “2 + 2=4”, ma cessa (spesso) di valere quando ci si avvicina alle premesse logiche fondamentali della matematica;'”” tuttavia, le premesse logiche fondamentali restano — per Russell — a priori, poiché sono ricavate da conoscenze a priori. Nei Problems of Philosophy, Russell fornisce altri dettagli su come giungiamo ad avere conoscenze a priori: egli afferma che «Tutta la conoscenza a priori tratta esclusivamente con le relazioni tra universali». Per intendere il significato che ha, per Russell, quest’affermazione, cominciamo con l’osservare che nei Problems of Philosophy egli distingue — come già nei Principles!” — tra due generi di essere: l’essere nel tempo — chiamato esistere — e l’essere fuori del tempo — chiamato essere, o sussistere. Il primo genere di essere è quello che ap-
175 Russell [1912a], cap. 7, pp. 118-119. 176 Ayer [1936], cap. 4, pp. 74-75. 177 «Nella logica matematica», scrive Russell, «sono le conclusioni che hanno il maggior grado di certezza: quanto più ci avviciniamo alle premesse fondamentali tanto più incontriamo incertezza e difficoltà» (Russell [1911c], p. 285). 178 Russell [1912a], cap. 10, p. 162; corsivi di Russell. esa per es., Russell [1903a], $ 427, p. 449. Anche Frege faceva una distinzione simile.
898
capitolo 13
partiene ai particolari, che comprendono tutte le entità fisiche e tutte le entità mentali; il secondo genere di essere x 3 È oe È DCS NES : - 180 d appartiene, invece, agli universali, cioè a qualità e relazioni. °°Scrive Russell: 5 Riterremo conveniente parlare di cose esistenti [existing] solo quando esse siano nel tempo, vale a dire, quando possiamo indicare qualche tempo in cui esse esistano (senza escludere la possibilità che esse esistano in ogni tempo). Così pensieri e sensazioni [feelings], menti e oggetti fisici esistono [exist]. Ma gli universali non esistono in questo senso; diremo che essi sussistono [subsist] 0 hanno l’essere [have being], dove “essere” è opposto a “esistenza” in quanto essere senza tempo [timeless]. Il mondo degli univer-
sali, pertanto, si può anche descrivere come il mondo dell’essere. Il mondo dell’essere è immutabile, rigido, esatto, la delizia del matematico, del logico, del costruttore di sistemi metafisici, e di tutti quelli che amano la perfezione più della vita. Il mondo dell’esistenza è effimero, vago, senza confini netti, senza nessun disegno o assetto chiaro, ma contiene tutti i pensieri e sentimenti, tutti i dati del senso, e tutti gli oggetti fisici, tutto ciò che può fare bene o male, tutto ciò che conta per il valore della vita e del mondo. Secondo i nostri temperamenti, preferiremo la contemplazione dell’uno o dell’altro. Quello che non preferiamo ci sembrerà probabilmente una pallida ombra di quello che preferiamo, e indegno di essere considerato in qualche senso reale. Ma la verità è che Sibeloo hanno lo stesso diritto alla nostra attenzione imparziale, entrambi sono reali, ed entrambi sono importanti per il metafisico.
Sebbene gli universali non possano essere direttamente esperiti attraverso i sensi, talvolta essi possono — seCra aa : 182 condo Russell — essere conosciuti per familiarità (acquaintance): È ovvio, per cominciare, che siamo in familiarità [we are acquainted] con universali come bianco, rosso, nero, dolce, aspro, pesante, duro, ecc., ossia con le qualità che sono esemplificate nei dati di senso [sense-data]. Quando vediamo una macchia bianca, noi
siamo in familiarità, in primo luogo, con la macchia particolare; ma vedendo molte macchie bianche, impariamo facilmente ad astrarre la bianchezza che tutte hanno in comune, e imparando a far questo impariamo ad essere in familiarità con la bianchezza. Un processo simile ci renderà familiari [wi/{ make us acquainted) con qualsiasi altro universale della stessa sorta. Universali di questa sorta si possono chiamare “qualità sensibili”. Essi si possono afferrare [can be apprehended] con meno sforzo di astrazione di qualsiasi altro, e sembrano meno lontani dai particolari di quanto siano gli altri universali. Veniamo poi alle relazioni. Le più facili ad afferrarsi sono quelle che sussistono tra le diverse parti di un singolo dato di senso [sense-datum] complesso. Per esempio, posso vedere con un colpo d’occhio tutta la pagina su cui sto scrivendo; così l’intera pagina è inclusa in un solo dato di senso. Ma io percepisco [perceive] che alcune parti della pagina sono a sinistra di altre parti, e alcune parti sono sopra altre parti. Il processo di astrazione in questo caso sembra procedere all’incirca come segue: vedo successivamente un certo numero di dati di senso in cui una parte è a sinistra di un’altra; percepisco [perceive], come nel caso delle diverse macchie bianche, che tutti questi dati di senso hanno qualcosa in comune, e per astrazione scopro che ciò che hanno in comune è una certa relazione tra le loro parti, cioè la relazione che chiamo “essere alla sinistra di”. In questo modo familiarizzo [/ become acquainted] con la relazione universale. (SS) Un'altra relazione con la quale familiarizziamo in modo molto simile è la rassomiglianza [resemblance]. Se vedo simultaneamente due tonalità di verde, posso vedere che esse rassomigliano l’una all’altra; se nello stesso tempo vedo anche una tonalità di rosso, posso vedere che i due verdi hanno una maggiore rassomiglianza l’uno con l’altro di quanto ciascuno dei due abbia con il rosso. In questo modo familiarizzo con l’universale rassomiglianza o similarità [similarity].!*
Secondo Russell, dunque, entriamo in familiarità con gli universali attraverso la familiarità con i dati di senso che li esemplificano, e astraendo ciò che questi dati di senso hanno in comune. Russell prosegue spiegando che, talvolta, possiamo anche percepire delle relazioni tra universali: Tra gli universali, come tra i particolari, vi sono relazioni di cui possiamo essere immediatamente consapevoli [immediately aware). Abbiamo appena visto che possiamo percepire [perceive] che la rassomiglianza tra due tonalità di verde è più grande della rassomiglianza tra una tonalità di rosso e una tonalità di verde. Abbiamo qui a che fare con una relazione, cioè “più grande di” tra due relazioni. La nostra conoscenza di tali relazioni, sebbene richieda un maggior potere di astrazione di quanto sia richiesto per percepire le qualità dei dati di senso, sembra essere ugualmente immediata, e (almeno in alcuni casi) ugualmente indubitabile. Quindi c’è una conoscenza immediata riguardo agli universali così come c’è riguardo ai dati di senso.!**
«Si deve accettare come un fatto», scrive Russell più avanti, «scoperto riflettendo sulla nostra conoscenza, che abbiamo talvolta la capacità di percepire [perceiving] tali relazioni tra universali, e quindi talvolta di conoscere Lava per es., Russell [1912a], cap. 8, pp. 139-140.
15! Russell [1912a], cap. 9, p. 155-157.
i
182 Ciò che Russell chiama “acquaintance” — un termine che noi abbiamo tradotto con “familiarità” (v. sopra, cap. 7, nota 10) — è, lo ricordiamo (v. sopra, cap. 7, $ 1), una relazione cognitiva in cui un soggetto è direttamente consapevole di un oggetto. Poiché la familiarità è per Russell una relazione diadica tra un soggetto conoscente e un oggetto, la sua sussistenza implica l’esistenza dell’oggetto e dunque essa è — secondo Russell — del tutto immune da errore.
153 Russell [1912a], cap. 10, pp. 158-161. 184 Russell [1912a], cap. 10, p. 161.
Il logicismo di Russell ._:
5
È
SO
A
;
899 ,
proposizioni generali a priori come quelle dell’aritmetica e della logica».'#
5
-
Per Russell, dunque, possiamo
“
“per-
cepire” relazioni tra universali; ma questa “percezione” non è effettuata attraverso i sensi, perché gli universali, non essendo nel tempo, non possono darsi nel senso interno o esterno. "5°
1.3.
L’AUTOEVIDENZA A PRIORI È GARANZIA DI VERITÀ?
1.3.1. Proprio come la percezione attraverso i sensi non offre una garanzia completa di immunità dall’errore nei giudizi ricavati da essa, nello stesso modo si può sospettare che la percezione delle relazioni tra universali non offra una garanzia completa che i nostri giudizi immediati sulle relazioni che valgono tra essi siano corretti. Il problema è: come possiamo essere sicuri che ciò che ci appare autoevidente a priori sia anche vero? In diversi passi dei suoi scritti, Russell suggerisce che non possiamo avere una sicurezza assoluta che ciò che ci appare evidente debba essere vero. Questa tesi è sostenuta, per esempio, nel seguente brano dei Principia, in cui Russell cerca di giustificare l'assunzione dell'assioma di riducibilità come principio logico: Che l’assioma di riducibilità sia autoevidente è una proposizione che si può difficilmente sostenere. Ma di fatto l’autoevidenza non è mai più che una parte della ragione per accettare un assioma, e non è mai indispensabile. La ragione per accettare un assioma, come per accettare qualsiasi altra proposizione, è sempre largamente induttiva, cioè che molte proposizioni che sono pressoché indubitabili [near}y indubitable] possano essere dedotte da esso, e che non si conosca nessun modo altrettanto plausibile attraverso il
quale queste proposizioni potrebbero essere vere se l’assioma fosse falso, e che nulla che sia probabilmente falso possa essere dedotto da esso. Se l’assioma è apparentemente autoevidente, ciò significa solo, in pratica, che esso è pressoché indubitabile; perché
vi sono cose che si sono ritenute autoevidenti e tuttavia sono risultate false. E se l’assioma stesso è pressoché indubitabile, questo semplicemente si aggiunge all’evidenza induttiva derivata dal fatto che le sue conseguenze sono pressoché indubitabili: non provvede una nuova evidenza di genere radicalmente diverso. L’infallibilità non è mai raggiungibile, e quindi qualche elemento di dubbio dovrebbe sempre accompagnarsi a ogni assioma e a tutte le sue conseguenze. Nella logica formale, l'elemento di dubbio è minore che nella maggior parte delle scienze, ma non è assente, come appare dal fatto che i paradossi sono conseguiti da premesse che in precedenza non si sapeva richiedessero limitazioni. Nel caso dell’assioma di riducibilità, l'evidenza induttiva in suo favore è molto forte, poiché i ragionamenti che esso consente e i risultati a cui esso conduce sono tutti tali da apparire validi.'8”
In uno scritto contemporaneo alla prima edizione dei Principia, Russell ribadisce che l'evidenza non è mai una ragione conclusiva poiché «[l']autoevidenza è una proprietà psicologica ed è quindi soggettiva e variabile»'* e che, inoltre, non è questione di bianco o nero, ma vi sono delle sfumature tra ciò che può essere più o meno autoevidente: «l’autoevidenza ha dei gradi RI
a
Anche nei seguenti brani, tratti da “The philosophy of logical atomism” (1918), Russell sembra asserire che la certezza non garantisca la verità, anche se è quanto di meglio possiamo avere: Quando parlo di “dati innegabili” [undeniable data] questo non dev'essere considerato sinonimo di “dati veri”, perché “innegabile” è un termine psicologico e “vero” non lo è. Quando dico che qualcosa è innegabile, intendo dire che non è la sorta di cosa che qualcuno voglia negare; da ciò non segue che essa sia vera, sebbene ne segua che noi tutti la pensiamo vera — e ciò è quanto di più prossimo alla verità che sembriamo in grado di ottenere [corsivo mio].!° Le cose che dobbiamo assumere come premesse in ogni sorta di lavoro di analisi sono le cose che appaiono innegabili a noi — a noi qui e ora, così come siamo — e penso che tutto sommato il tipo di metodo adottato da Descartes sia giusto: che dovreste mettervi a dubitare delle cose e prendere per buono solo ciò di cui non potete dubitare per la sua chiarezza e distinzione, non perché
siete sicuri di non essere stati indotti in errore, poiché non esiste un metodo che vi garantisca contro la possibilità di errore. Il desiderio della sicurezza assoluta è una di quelle trappole in cui andiamo sempre a cadere, ed è insostenibile nel regno della conoscenza proprio come in qualsiasi altro.'!°'
!85 Russell [1912a], cap. 10, pp. 164-165. 186 Si osservi che, per Russell, neppure gli usuali oggetti fisici possono darsi nel senso: per esempio, per Russell non si percepisce mai un tavolo, ma solo un certo dato di senso, per es., una certa macchia di colore così e così (v. sopra, cap. 7, $ 5.2). Tuttavia, a differenza di quanto sostiene a proposito degli universali, Russell ritiene che non possiamo conoscere per familiarità gli usuali oggetti fisici.
187 188 15° 190 !°1
[PM], vol. I, introduzione, cap. 2, $ VII, p. 59. Russell [1911c], p. 293. Russell [1911c], p. 294. Russell [1918-19], $ I, p. 179. Russell [1918-19], $ I, p. 181.
900
capitolo 13
Se l’autoevidenza non è una garanzia di verità assoluta, non lo può essere neppure l’apriorità, poiché essere a priori — per Russell —
significa essere evidente indipendentemente dalle conferme empiriche (o essere derivato
esclusivamente da ciò che è tale). In quest’interpretazione, l’apriorità non sarebbe più un fenomeno metafisicamente importante: potrebbe essere ingannevole. Tuttavia, in alcuni testi del periodo 1912-13, Russell cerca di sostenere che vi sia un genere di autoevidenza la quale è garanzia di verità. AI termine del cap. 11 dei Problems of Philosophy, Russell suggerisce una possibile ambiguità semantica nel termine “autoevidenza”: [...] ’autoevidenza ha dei gradi: non è una qualità che sia semplicemente presente o assente, ma una qualità che può essere più o meno presente, in gradazioni che vanno dall’assoluta certezza a una fiochezza quasi impercettibile. Le verità di percezione e alcuni dei principi della logica hanno il più alto grado di autoevidenza [...]. Sembra, tuttavia, molto probabile che in “autoevidenza” come spiegata sopra siano combinate due nozioni diverse; che una di esse, che corrisponde al più alto grado di autoevidenza, sia realmente una garanzia infallibile di verità, mentre l’altra, che corrisponde a tutti gli altri gradi, non dia una garanzia infallibile, ma solo una maggiore o minore presunzione. Questo, tuttavia, è solo un suggerimento, che non possiamo per ora sviluppare oltre.!?”
L’argomento è però ripreso nel cap. 13 dei Problems of Philosophy — dopo un capitolo dedicato all'esposizione della teoria della verità nel contesto della teoria del giudizio come relazione multipla.!” Qui Russell sostiene che si può dire che una verità è autoevidente in un senso che garantisce la sua verità qualora abbiamo familiarità (acquaintance) con ilfatto corrispondente: Si ricorderà che alla fine del Capitolo 11 abbiamo suggerito che ci potrebbero essere due generi di autoevidenza, uno che dà una garanzia assoluta di verità, l’altra solo una garanzia parziale. Questi due generi si possono ora distinguere. Possiamo dire che una verità è autoevidente, nel primo e più assoluto senso, quando abbiamo familiarità [we have acquaintance] con il fatto che corrisponde alla verità.'**
Russell prosegue poi servendosi della sua teoria secondo cui tutte le conoscenze a priori sono conoscenze di relazioni tra universali per spiegare come sia possibile che l'umanità abbia un patrimonio condiviso di conoscenze autoevidenti a priori. Egli scrive: Quando Otello crede che Desdemona ami Cassio, il fatto corrispondente, se la sua credenza fosse vera, sarebbe “l’amore di Desde-
mona per Cassio”. Questo sarebbe un fatto con cui nessuno potrebbe avere familiarità eccetto Desdemona; quindi nel senso di autoevidenza che stiamo considerando, la verità che Desdemona ama Cassio (se fosse una verità) potrebbe essere autoevidente solo a
Desdemona. Tutti i fatti mentali, e tutti i fatti riguardanti i dati di senso, hanno questa stessa privatezza: c’è una sola persona a cui essi possono risultare autoevidenti nel nostro senso attuale, perché c’è una sola persona che può essere in familiarità [can be acquainted) con le cose mentali o i dati di senso in questione. Così nessun fatto circa qualsiasi particolare cosa esistente può essere autoevidente a più di una persona. D’altra parte, i fatti circa gli universali non hanno questa privatezza. Molte menti possono essere in familiarità con gli stessi universali; quindi una relazione tra universali può essere nota per familiarità [by acquaintance] a molte persone diverse. In tutti i casi in cui conosciamo per familiarità un fatto complesso consistente di certi termini in certe relazioni, diciamo che la verità che questi termini sono così relati ha il primo o assoluto genere di autoevidenza, e in questi casi il giudizio che questi termini sono così relati deve essere vero. Quindi questa sorta di autoevidenza è una garanzia assoluta di verità.!°°
Subito dopo, tuttavia, Russell attenua l’ultima affermazione: Ma sebbene questa sorta d’autoevidenza sia una garanzia assoluta di verità, non ci autorizza ad essere assolutamente [absolutely] certi, nel caso di qualsiasi giudizio dato, che il giudizio in questione sia vero. Supponiamo che noi dapprima percepiamo il sole splendere, che è un fatto complesso, e quindi procediamo a formulare il giudizio “Il sole splende”. Passando dalla percezione al giudizio, è necessario analizzare il fatto complesso dato: dobbiamo separare “il sole” e “splendere” come costituenti del fatto. In questo processo è possibile commettere un errore; quindi anche laddove un fatto ha il primo o assoluto genere di autoevidenza, un giudizio che si crede corrispondere al fatto non è assolutamente infallibile, perché potrebbe non corrispondere realmente al fatto. Ma se esso vi corrisponde [...], deve essere vero.!°9
Infine, Russell sembra affermare che non possiamo essere del tutto certi neppure dei giudizi che possiedono il più alto grado di autoevidenza e, quindi, neppure di ciò che ci sembra autoevidente a priori. 1°? Russell [1912a], cap. 11, pp. 183-185. AV. sopra, cap. 10. 194 Russell [1912a], cap. 13, p. 212.
!°5 Russell [1912a], cap. 13, pp. 212-214 °° Russell [1912a], cap. 13, p. 214.
Il logicismo di Russell
901
L’idea secondo cui esiste un genere d’autoevidenza che è garanzia assoluta di verità è ripresa da Russell, l’anno successivo, nell’incompiuto Theory of Knowledge. In quest'opera, Russell dedica un intero capitolo — il sesto della parte II — all’argomento dell’autoevidenza. Qui il termine “autoevidenza” è riservato a ciò che nei Problems of Philosophy era considerato il genere “più alto” di autoevidenza: cioè all’autoevidenza che è una garanzia di verità. Russell considera l’autoevidenza come una proprietà di credenze, '?” e caratterizza una credenza autoevidente come una credenza che «dev'essere indipendente dall’inferenza»,'’* chiarendo subito: Non intendo dire che non possa essere accertata attraverso l’inferenza in un primo momento, ma che, una volta accertata, dev’essere in grado di stare in piedi da sola, senza l’aiuto dell’inferenza. Molte credenze astratte sono ottenute per inferenza da casi particolari,
e allora
diventano
luminosamente
ovvie
di per sé. Questa
luminosa
ovvietà
è una
condicio
sine
qua
non
dell’autoevidenza.'?°
Pur essendo una caratteristica necessaria delle credenze autoevidenti, la caratteristica psicologica dell’ovvietà non può tuttavia essere anche una caratteristica sufficiente perché si abbia una credenza autoevidente: Ma a parte questa caratteristica psicologica, le credenze autoevidenti devono anche essere vere. Vogliamo che le credenze autoevidenti siano il fondamento della conoscenza [...]. Se avessimo richiesto semplicemente la caratteristica psicologica dell’ovvietà, a-
vremmo evitato tutte le difficoltà, ma non avremmo scoperto nulla d’importante per la teoria della conoscenza. Vogliamo, se possibile, trovare una classe di credenze di cui si può sapere che sono vere. Per questo scopo dobbiamo formulare la nostra definizione di autoevidenza così da assicurare che le credenze che hanno questa caratteristica siano vere.”
Le credenze autoevidenti — nel senso più specifico in cui il termine è ora usato — devono dunque avere la caratteristica di essere vere. Ma Russell spiega che sarebbe inutile includere la verità nella definizione di autoevidenza, perché, così facendo, si resterebbe «con il problema di scoprire quale delle nostre credenze possiede la verità e quale no, che è lo stesso problema che speravamo di risolvere per mezzo dell’autoevidenza».?! Russell cerca dunque «qualche caratteristica, diversa dalla verità, che assicuri la verità delle nostre credenze senza richiedere che dobbiamo già sapere che sono vere». Naturalmente, l’ovvietà, per quanto luminosa, è una proprietà meramente psicologica e pertanto non è sufficiente ad assicurare la verità. Per comprendere la definizione di autoevidenza proposta da Russell in Theory of Knowledge, si deve richiamare che in questo libro — come già, in una forma meno sviluppata, nei Problems of Philosophy — egli sostiene la teoria degli atteggiamenti proposizionali come relazioni multiple.”°* Rammentiamo che, secondo questa teoria, gli enunciati sono simboli incompleti che ricevono un significato nel contesto di un’ascrizione a un soggetto di un “atteggiamento proposizionale” — come credere, comprendere, sperare, ecc. Le relazioni di atteggiamento proposizionale sono poi interpretate come relazioni multiple aventi come termini: il soggetto dell’atteggiamento proposizionale, gli oggetti cui l’enunciato si riferisce, e la forma logica secondo la quale tali oggetti devono essere combinati. Per esempio, la credenza di Otello che Desdemona ami Cassio è interpretata come una relazione a cinque
posti
tra
Otello,
Desdemona,
l’amare,
Cassio
e
la
forma
generale
dei
complessi
diadici,
cioè:
(4x) (4y) (AR) (xRy). Una credenza è vera — secondo questa teoria — quando esiste, nella realtà, un complesso formato dagli oggetti della credenza, combinati nel modo indicato dalla forma che compare come termine di quella relazione di credenza. Ora abbiamo tutti gli strumenti per comprendere il tentativo russelliano di definizione dell’ autoevidenza. Come primo abbozzo di definizione, Russell offre il seguente: «un giudizio [la stessa cosa di una credenza] è autoevidente quando è contemporaneo alla familiarità [acquaintance] con il complesso corrispondente».”* L'idea è questa: formuliamo un giudizio e contemporaneamente percepiamo (in senso lato) il complesso che rende vero tale giudizio; per esempio, vedo una macchia rossa e dico: “Ho una macchia rossa nel campo visivo”: in questo caso, il giudizio è autoevidente. Fin qui, la teoria di Russell non pare diversa da quella sostenuta nei Problems of Philosophy. Più avanti, tuttavia, Russell osserva che la semplice contemporaneità nell’esperienza non è sufficiente:
197 V_ Russell [1913a], parte II, cap. 6, p. 157.
198 °° 200 °°! 202
Ibid. Ibid. Ibid. Ibid. Ibid.
203 Per un'esposizione di questa teoria, v. sopra, cap. 10. 204 Russell [1913a], parte II, cap. 6, p. 161.
902
capitolo 13
A 3 ) aa A, . e poi «dev'essere data nell’esperienza an intanto, ovviamente, deve trattarsi di «simultaneità in una esperienza», al . o o 205 O 5 . Egli spiega l’ultimo punto attraverso un esempio: che la rilevanza del complesso per il giudizio». Supponiamo che siamo in teatro prima dell’inizio della rappresentazione: crederemo che il sipario si alzerà, ma questa credenza non è autoevidente. A un certo momento, lo vediamo alzarsi, ossia percepiamo il complesso corrispondente; in questo momento la nostra credenza può diventare autoevidente, ma penso che lo diventi solo se percepiamo la corrispondenza del sipario che si alza con la nostra credenza. Perciò sembra che la percezione della corrispondenza stessa sia essenziale all’autoevidenza.?®9
Questa considerazione porta Russell a riformulare così la sua definizione: «un giudizio è autoevidente quando, nel momento in cui lo si formula, la persona che lo formula percepisce la sua corrispondenza con qualche complesso». Poiché — in Theory of Knowledge — la verità di un giudizio è definita come l’esistenza del complesso corrispondente ad esso, Russell formula la sua definizione definitiva in questo modo: «L’ autoevidenza è una proprietà dei giudizi, consistente nel fatto che, nella loro stessa esperienza, essi sono accompagnati dalla familiarità
[acquaintance] con la loro verità». Definita in questo modo l’autoevidenza implica, secondo Russell, l’indubitabilità: «Quando si percepisce che un giudizio corrisponde al fatto, esso è indubitabile; così l’indubitabilità accompagna l’autoevidenza».” Ma, l’indubitabilità — sottolinea Russell — non costituisce l’autoevidenza e quindi «può esistere laddove l’autoevidenza è assente»,7!° spiegando così come credenze indubitabili si possano poi rivelare false. Purtroppo, nel contesto di Theory of Knowledge, la teoria appena esposta risulta in conflitto con l’idea russelliana che le leggi logiche possano non essere immediatamente evidenti; un’idea, quest’ultima, che Russell ribadisce proprio nello stesso capitolo 6 della parte II che abbiamo considerato fin qui: Dato un corpus di proposizioni che si sa che sono tutte vere, o si sa che sono tutte probabili, e di cui alcune sono deducibili da altre, l’ordine migliore, da un punto di vista puramente logico, sarà quello in cui ci sono minori premesse e più semplici. Ma nella teoria della conoscenza, in cui vogliamo considerare come queste proposizioni siano conosciute, è verosimile che l’ordine sia del tutto diverso. Le nostre premesse dovranno essere autoevidenti, e generalmente non avviene che le premesse logiche più semplici siano così evidenti come alcune delle loro conseguenze. Può accadere che, come sostiene l’empirista induttivo, le premesse logiche più semplici siano rese solo probabili, non certe, dall’autoevidenza delle proposizioni che sarebbero le loro conseguenze in un ordine puramente logico. Ma questo non può fornire alcun argomento contro l’autoevidenza come fonte di conoscenza, poiché, se l’intero corpus di proposizioni in questione dev'essere accettato — l’autoevidenza deve appartenere alle proposizioni che sono premesse epistemologiche e che danno probabilità induttiva alle premesse puramente logiche. Perciò l’autoevidenza rimane qui ancora fondamentale epistemologicamente.?"! 3
Ciò introduce una tensione nella teoria sostenuta in Theory of Knowledge. Ricordiamo infatti che — secondo quanto sostiene Russell in questo libro — il giudicare vero qualcosa presuppone il comprenderlo," e poiché comprendere una forma logica è — sempre stando alle dottrine sostenute in Theory of Knowledge — essere in una relazione di conoscenza per familiarità (acquaintance) con essa,!? ne deriva che giudicare vera una forma, si accompagnerà sempre alla familiarità con la forma stessa e, naturalmente, alla familiarità con il fatto che questa forma è quella che si giudica esser vera. Se si aggiunge che le forme logiche sono — in Theory of Knowledge — ciò che costituisce la logica, si ottiene che tutte le leggi logiche dovrebbero essere autoevidenti. Ma poiché
205 Russell [1913a], parte II, cap. 6, p. 165.
206 Russell [1913a], parte II, cap. 6, pp. 165-166. 207 Russell [1913a], parte II, cap. 6, p. 166.
295 Ibid.
20° Russell [1913a], parte II, cap. 6, p. 164.
2° Ibid.
2!! Russell [1913a], parte II, cap. 6, pp. 158-159. 212 V. Russell [1913a], parte II, cap. 1, p. 110. 213 V. Russell [1913a], parte II, cap. 3, p. 131 e p. 132. Questo punto di vista è ineludibile, per Russell, date le premesse da cui parte in quel periodo. La prima premessa è che le relazioni di atteggiamento proposizionale non sono, in realtà, delle relazioni diadiche tra un soggetto e una proposizione, ma relazioni multiple aventi come termini: il soggetto che ha l'atteggiamento proposizionale; gli oggetti che, nella teoria dei Principles, sarebbero stati considerati come i costituenti della proposizione; una forma logica. La seconda premessa è la teoria secondo cui la nostra conoscenza si deve ridurre, in ultima analisi, a familiarità (acquaintance). Quando Russell ammette le proposizioni, egli for-
mula questo principio dicendo Quando — come nel periodo debba essere interpretato come una conoscenza per familiarità
che, per comprendere una proposizione, dobbiamo avere conoscenza per familiarità con i suoi costituenti. 1909-1913 — pensa che le proposizioni (in senso ontologico) non esistano, e che il parlare di proposizioni il parlare di relazioni multiple, egli formula questo principio dicendo che, per comprendere, dobbiamo avere delle entità che, oltre al soggetto, entrano come termini nella relazione di comprensione.
Il logicismo di Russell
903
l’autoevidenza implica l’indubitabilità,"!' tale posizione risulta in armonia con il logicismo epistemico, ma non con la tesi — costantemente sostenuta da Russell — secondo cui le leggi logiche possono, esse stesse, essere meno indubitabili di certe loro conseguenze. Riassumendo, Russell sostiene che i principi logici sono a priori, ma non necessariamente autoevidenti, pur essendo derivati esclusivamente da ciò che appare autoevidente a priori. In un certo periodo della sua riflessione filosofica, egli cerca di stabilire che vi sia un’autoevidenza a priori la quale è una garanzia di verità, ma non riesce a spiegare come ciò possa avvenire senza entrare in conflitto con la sua dottrina della fallibilità degli enunciati logici. In seguito, Russell abbandona la dottrina di una forma di autoevidenza che garantisca la verità. Le tesi russelliane fin qui descritte sono, naturalmente, molto distanti da quella sostenuta dall’ultimo Russell,
per il quale —
lo ricordiamo!’ — le verità logiche sarebbero “analitiche” nel senso usato dagli empiristi logici,
cioè vere in virtù del significato delle parole. Anche allora, tuttavia, Russell continua a rifiutare l’autoevidenza come criterio di verità. In The Analysis of Mind (1921) — il primo testo russelliano in cui si adombra la tesi secondo cui la conoscenza matematica sarebbe meramente verbale — Russell ammette che proposizioni della matematica come quella espressa da “2 + 2 = 4” siano autoevidenti, ma sostiene che tale autoevidenza «risiede meramente nel fatto che esse rappresentano la nostra decisione riguardo all’uso delle parole, non una proprietà di 0ggetti fisici»,7!° e, dopo aver argomentato che l’autoevidenza delle proposizioni empiriche può essere ingannevole, Russell conclude, ancora una volta, che «nessuna forma di autoevidenza sembra fornirci un criterio assoluto di ve-
rità».?!” Russell non lo dice esplicitamente, ma il caso delle proposizioni matematiche non contraddice questa tesi perché non sarebbe l’autoevidenza, ma la tautologicità a garantirne la verità e, talora (nel caso di proposizioni non troppo complesse), a spiegarne anche l’autoevidenza. 1.3.2. L’idea secondo cui gli assiomi fondamentali della matematica sono desunti dal dato della matematica, nello
stesso modo in cui le leggi scientifiche sono ricavate dai dati empirici — sostenuta da Russell nella fase produttiva del suo logicismo —, risponde non solo al modo in cui sono effettivamente concepiti i Principia Mathematica,
218 : | nie : : ° ma anche all’usuale modo di procedere dei matematici nella loro scienza. Rilevando questo stesso punto,
Andrew D. Irvine ([1989]) riporta come paradigmatico il seguente passaggio dell’articolo “The unreasonable effectiveness of mathematics”, del matematico Richard W. Hamming: Se si scoprisse che il teorema di Pitagora non segue dai postulati, cercheremmo ancora un modo di modificare i postulati finché esso divenisse vero. I postulati di Euclide derivarono dal teorema di Pitagora, non viceversa. Per più di trent'anni ho osservato che se veniste nel mio ufficio e mi mostraste una dimostrazione che il teorema di Cauchy è falso io ne sarei molto interessato, ma credo
che in ultima analisi modificheremmo le assunzioni finché il teorema divenisse vero.?!°
Irvine ([1989], p. 186) osserva che non è a proposito degli assiomi della matematica che i matematici si sentono più sicuri; come esempio, egli cita il caso dell’assioma di scelta (o assioma moltiplicativo, come lo chiama Russell):?°0 Per esempio, assiomi (come l’assioma di scelta) sono spesso stati accettati dalla comunità matematica, non per la loro autoevidenza,
ma per l’esistenza di una sorta di conferma empirica durante un certo periodo. Cioè, quando sono usati come assiomi all’interno dell’appropriato sistema assiomatico-deduttivo, essi producono i risultati richiesti. Fu proprio per tali ragioni che Zermelo accettò l’assioma di scelta dimostrando il suo famoso teorema del buon ordinamento nel 1904. In modo simile, Fraenkel aveva affermato
che alcuni assiomi ricevono la loro “piena autorità” dall’“evidenza delle loro conseguenze” .?”!
214 V. Russell [1913a], parte II, cap. 6, p. 164. SAVA sopra,$ 1.1.3.
210 Russell [1921a], lecture XII, pp. 264-265. 217 Russell [1921a], lecture XIII, p. 266. 218 Da un passo della prefazione ai Principia, appare chiaro che il sistema deduttivo contenuto in quell’opera è concepito come derivato dalla matematica esistente trattata come dato, e non viceversa: «Da un lato, dobbiamo analizzare la matematica esistente, allo scopo di sco-
prire quali sono le premesse impiegate, se queste premesse sono mutuamente consistenti, e se esse sono suscettibili di una riduzione a pre-
messe più fondamentali. Dall’altro lato, una volta che abbiamo deciso sulle premesse, dobbiamo nuovamente costruire quanto può sembrare necessario dei dati prima analizzati, e quelle altre conseguenze delle nostre premesse che siano di sufficiente interesse generale da meritare un’asserzione» ([PM], vol. I, prefazione, p. v).
21° Hamming [1980], p. 87. Riportato in Irvine [1989], p. 186. Si veda anche l’articolo di Hamming del 1998 “Mathematics on a distant planet”, in cui l’autore scrive: «La matematica non è semplicemente porre qualche postulato arbitrario e quindi fare deduzioni, è molto di più; cominciate da alcune delle cose che volete e cercate di trovare postulati per supportarle!» (Hamming [1998], p. 645). 220 Sull’assioma di scelta (o assioma moltiplicativo), v. sopra, cap. 4, $ 4.
22! Irvine [1989], pp. 185-186.
904
capitolo 13
Il matematico
Godfrey Harold Hardy, in due lettere a Russell del 1905, sostiene una posizione del genere
sull’assioma di scelta. In una delle due lettere, datata 5 luglio 1905,”°° Hardy ammette che «qualcosa di così astratto e generale come l’assioma di Zermelo [...]» non gli sembra ovvio, ma dice che «più ci si pensa, più sembra paradossale il contrario, cosicché, a meno che esso non risulti portare a contraddizioni, i0 sarei (in mancanza di prove) disposto ad assumerlo e sperare per il meglio».”?? Nell’altra lettera a Russell, di poco precedente, datata 30 giugno (1905),“°* Hardy scrive: Ammetto che sembra impossibile dimostrare l’esistenza della classe moltiplicativa in generale [...] D’altra parte negare la classe 1) sembra paradossale, come direbbe un idealista “non soddisfa l'intelletto”, 2) non sembra logicamente necessario, 3) non mi sembra (sebbene io sia disposto a ricredermi) risolvere in un modo ovvio difficoltà altrimenti insolubili, 4) sembra gettare nello scompiglio molta della matematica più interessante. ”°°
A Hardy, l’assioma di scelta non appare affatto ovvio. Tuttavia egli adduce ragioni pragmatiche per accettarlo. In particolare — apportando, come ragione a favore della classe moltiplicativa (e quindi dell’assioma di scelta), il motivo che la sua ripulsa scombinerebbe molta matematica interessante — Hardy si mostra incline a considerare legittimo valutare un assioma sulla base della sua fruttuosità matematica. L’idea secondo cui la scelta degli assiomi di una teoria matematica non si basa sulla loro maggiore o minore e-
videnza, ma sugli obiettivi che si vogliono raggiungere era corrente — nella prima decade del Novecento — nell’ambito della scuola di Peano. Nel suo discorso inaugurale per l’anno accademico 1906-1907 all’Università di Catania, Mario Pieri scrive: I logici-matematici non concepiscono la differenza fra le proposizioni primitive e le altre che ne derivano attraverso il processo deduttivo come dovuta all’esser quelle per sé stesse più evidenti, più credibili, meno impugnabili: ma al contrario essi vedono nei postulati delle proposizioni come tutte le altre; la cui scelta può esser diversa, a tenor degli scopi che si voglion raggiungere, e dipende anzi tutto dal paragone dei vari aspetti che assumerebbe il trattato, secondo il variar delle scelte. Richiamando un’immagine assai felice di G. VAILATI”°° diremo che, se i rapporti fra i postulati e le proposizioni che ne dipendono si potevano un tempo paragonare a quelli che intercedono fra il monarca ed i sudditi d’un governo autocratico; ora invece i postulati, rinunziando a quella specie di diritto divino, di cui pareva investirli la loro vantata evidenza, son divenuti come i capi elettivi d’un regime democratico, la scelta dei quali si deve (0 si dovrebbe) alla riconosciuta capacità d’esercitare per qualche tempo una funzione nell’interesse pubblico.??”
Anche per Gédel gli assiomi non devono necessariamente essere per se stessi evidenti, ma si possono valutare sulla base delle loro conseguenze; in “What is Cantor’s continuum problem?” (1947), egli scrive che si può decidere sulla verità di un nuovo assioma [...] induttivamente studiando il suo “successo”. Successo qui significa fruttuosità delle conseguenze, in particolare delle conseguenze “verificabili”, cioè, conseguenze dimostrabili senza il nuovo assioma, le cui dimostrazioni per mezzo del nuovo assioma, in
ogni caso, sono considerevolmente più semplici e facili da scoprire, e rendono possibile sintetizzare in una sola dimostrazione molte dimostrazioni diverse.?°3
In un articolo del 1944 sulla logica matematica di Russell, Gòdel attribuisce a Russell la posizione che considera corretta riguardo agli assiomi della logica e della matematica: Egli [Russell] paragona gli assiomi della logica e della matematica alle leggi di natura, e l'evidenza logica alla percezione sensoriale [sense perception], cosicché gli assiomi non devono necessariamente essere evidenti in se stessi, ma piuttosto la loro giustificazione riposa (esattamente come in fisica) sul fatto che essi rendono possibile a queste “percezioni sensoriali” l'essere dedotte; cosa
222 Ora in Garciadiego [1992], appendice, pp. 203-204. 2235111 Garciadiego [1992], appendice, p. 204.
224 Ora in Garciadiego [1992], appendice, pp. 192-195. “20 Garciadiego [1992], appendice, p. 195. Hardy elenca motivazioni analoghe per accettare provvisoriamente l’assioma di scelta al termine di un articolo del 1906: «Sono quindi, in mancanza di prove, pronto ad accettare provvisoriamente l’assioma moltiplicativo [...] sulla base: (1) che negarlo sembra paradossale
(11) che non è stata fornita nessuna ragione per negarlo (iii) che negarlo riduce a uno stato di caos una gran quantità di matematica molto interessante» (Hardy [1906], p. 17).
22° “Il Pragmatismo e la Logica matem.’, nella Rivista «Leonardo», Firenze, febbraio ‘906. [Nota di Pieri. V. Vailati [1906], pp. 17-18.] 227 Pieri [1907], pp. 61-62. 228 Gédel [1947], $ 3, p. 521; [1964], $ 3, p. 477.
Il logicismo di Russell
905
che naturalmente non escluderebbe che essi abbiano anche un genere di plausibilità intrinseca simile a quella che hanno in fisica. Penso che (purché “evidenza” s’intenda in un senso sufficientemente ristretto) questo modo di vedere sia stato abbondantemente giustificato dagli sviluppi successivi, e c’è da aspettarsi che lo sarà ancora di più in futuro. Si è scoperto che (assumendo che la matematica moderna sia consistente) la soluzione di certi problemi aritmetici richiede l’uso di assunzioni che essenzialmente trascendono l’aritmetica,[??°] cioè, il dominio di quel genere di evidenza elementare indiscutibile che può essere più appropriatamente [fit tingly] paragonata con la percezione sensoriale. Inoltre sembra probabile che per decidere certe questioni della teoria astratta degli insiemi e anche per certe questioni connesse della teoria dei numeri reali saranno necessari nuovi assiomi basati su idee finora sconosciute. Forse anche le difficoltà apparentemente insormontabili che alcuni altri problemi matematici hanno presentato per molti anni si devono al fatto che gli assiomi necessari non sono ancora stati trovati. Naturalmente, in queste circostanze la matematica può perdere buona parte della sua “certezza assoluta”; ma, sotto l’influenza della moderna critica dei fondamenti, questo è già in larga misura avvenuto.??°
2. CHE COS'È LA LOGICA? 2.1. Secondo i Principles of Mathematics le proposizioni della logica, e quindi — per la tesi logicista — della matematica pura, devono essere massimamente generali: ciò significa che non devono valere solo in un dominio ristretto di entità, ma per qualsiasi entità al mondo. Questa tesi, che Russell mutua dal pensiero tradizionale, implica, per il Russell dei Principles, che gli enunciati logici e matematici debbano contenere solo costanti logiche e variabili, e che le variabili della logica e della matematica pura debbano essere completamente non ristrette, variando su tutte le entità dell’ universo — che nei Principles includono particolari, qualità, relazioni, proposizioni in
senso ontologico e classi. Come abbiamo visto (v. sopra, cap. 6, fine del $ 3), da questi presupposti — e non da un supposto ‘“se-allorismo” — scaturisce la forma implicazionale che, nei Principles, Russell individua come caratteristica delle proposizioni della matematica pura: La matematica pura è la classe di tutte le proposizioni della forma “p implica g”, dove p e qg sono proposizioni contenenti una o più variabili, le stesse nelle due proposizioni, e né p né qg contengono nessuna costante eccetto le costanti logiche o che possano essere definite in termini di costanti logiche.??!
Alla fine del primo capitolo dei Principles, dopo aver affermato che «una volta che l’apparato della logica è stato accettato, ne segue necessariamente tutta la matematica»,”°° Russell suggerisce una possibilità di distinguere tra logica e matematica. Egli scrive: La distinzione della matematica dalla logica è molto arbitraria, ma se si desidera una distinzione, si può fare come segue. La logica consiste delle premesse della matematica, insieme con tutte le altre proposizioni che riguardano esclusivamente costanti logiche e variabili ma non soddisfano la precedente definizione della matematica ($ 1) [si tratta della definizione che abbiamo riportato so-
pra]. La matematica consiste di tutte le conseguenze bili, insieme con quelle premesse stesse che hanno principio del sillogismo “Se p implica gq e q implica “L’implicazione è una relazione” apparterranno alla
delle suddette premesse che asseriscono implicazioni formali contenenti variaqueste caratteristiche. Così alcune delle premesse della matematica, per es. il r, allora p implica r°, apparterranno alla matematica, mentre altri principi come logica, ma non alla matematica.??*
Subito dopo, tuttavia, Russell precisa che questa distinzione è, in realtà, un puro omaggio alla tradizione: Se non fosse per il desiderio di attenerci all’uso, potremmo identificare la matematica con la logica, e definire l’una e l’altra come la classe delle proposizioni che contengono solo variabili e costanti logiche; ma il rispetto per la tradizione mi conduce piuttosto a .
.
.
.
2
aderire alla precedente distinzione [RA
Secondo i Principles, dunque, la logica (in senso ampio, includente la matematica pura) è la classe delle proposizioni contenenti solo variabili e costanti logiche. Le costanti logiche sono per Russell quelle entità che devono rimanere in una proposizione affinché essa mantenga la sua forma. Poiché un enunciato logico deve avere il massimo grado possibile di generalità, le costanti presenti in esso — dice Russell — devono essere sostituite da variabili ogni volta che questo è possibile: «Finché 229 Gòdel si riferisce, naturalmente, al suo primo teorema d’incompletezza (sull’argomento, v. sotto, cap. 14, $ 2).
230 231 232 233 234
Gédel [1944], p. 449. Russell [1903a], $ 1, p.3. Russell [1903a], $ 10, p. 8. Russell [1903a], $ 10, p. 9. Russell [1903a], $ 10, p. 9.
906
capitolo 13
un qualsiasi termine nella nostra proposizione può essere trasformato in una variabile, la nostra proposizione può essere generalizzata; e finché ciò è possibile, è compito della matematica farlo». Si giunge tuttavia a un punto in
cui un enunciato non può essere ulteriormente generalizzato, senza perdere, con ciò, la sua struttura. Le costanti che rimangono in esso a questo punto denotano — secondo Russell — costanti logiche. Le costanti logiche, dice Russell nel primo capitolo dei Principles, «vanno definite soltanto per enumerazione, perché esse sono così fondamentali che tutte le proprietà per mezzo delle quali la loro classe potrebbe essere definita presuppongono alcuni termini della classe».??° «Il numero delle costanti logiche indefinibili», afferma Russell nel capitolo successivo, «non è grande: sembra essere, di fatto, otto 0 nove». Di seguito, però, egli elenca solo sei di questi indefinibili:
la nozione di implicazione formale,?** quella di implicazione (materiale) tra proposizioni non contenenti variabili, la relazione di un termine con la classe di cui è un membro, la nozione espressa da “tale che” (such that), la nozione di relazione, e quella di verità. L'elenco completo delle costanti logiche è fornito solo al termine della prima
parte dei Principles, nell’ultimo paragrafo del cap. 10: [...] le costanti logiche sono: Implicazione [materiale], la relazione di un termine con la classe di cui esso è un membro, la nozione
di tale che, la nozione di relazione, e quelle nozioni ulteriori che sono implicite nell’implicazione formale, che abbiamo trovato ($ 93) essere le seguenti: funzione proposizionale, classe,”?? denotare, e qualsiasi [any] o ogni [every] termine.
Se si assume come primitiva la nozione di “classe di proposizioni di forma costante”, come propone di fare Russell nella nota al brano riportato, si possono eliminare le nozioni primitive di “funzione proposizionale” e di “classe”, cosicché si hanno sette nozioni primitive, che divengono otto aggiungendo la nozione di “verità”, la quale — dice Russell nel primo paragrafo dei Principles — è usata in matematica, sebbene «non sia un costituente delle proposizioni che essa considera».”*! La differenza, tra il resoconto del secondo capitolo dei Principles e quello del decimo, è che nel secondo capitolo la nozione di implicazione formale è considerata come primitiva, laddove nel decimo è analizzata.” Poiché le proposizioni, nei Principles, sono entità non linguistiche costituenti la realtà del mondo — non vi sono, secondo la teoria della verità dei Principles, “fatti” che si aggiungono alle proposizioni vere —, e poiché le proposizioni contenenti solo variabili e costanti logiche sono quelle massimamente generali, la concezione della logica dei Principles — come classe delle proposizioni contenenti solo variabili e costanti logiche — viene a identificare lo studio della logica con la scienza che ha per oggetto la struttura fondamentale della realtà. Per il Russell dei Principles la logica non riguarda in alcun modo lo studio di sistemi formali, in senso linguistico. Nel 1909, Russell adotta una nuova teoria del giudizio come relazione multipla secondo la quale non esistono “proposizioni”, nel senso ontologico dei Principles.”* Quindi egli non può più sostenere la sua primitiva visione della logica come classe di proposizioni, e cerca una nuova definizione. Nell’ottobre del 1912, Russell scrive l’abbozzo di un articolo, che sarà pubblicato postumo, dal titolo ‘What is logic?”.?* Qui Russell non sostiene più che la logica è una classe di proposizioni, ma respinge anche i punti di vista secondo cui la logica sarebbe una classe di giudizi — con la motivazione che questi «sono psicologici»? — e secondo cui la logica sarebbe una classe di enunciati — perché, come in precedenza, egli sostiene che essa «non ha a che fare con le forme di parole».?!° La prima definizione che Russell tenta di dare di logica, in questo scritto, è quella secondo cui la logica sarebbe una classe di particolari complessi — i complessi logici. Ai fini di questa definizione, Russell assume come primitiva l’idea di complesso. “Complesso” è inteso con il significato che la parola ha nella teoria del giudizio come 235 Russell [1903a], $ 8, p. 7. 230 Russell [1903a], $ 10, pp. 8-9. 237 Russell [1903a], $ 12, p. 11. 238 Per la nozione di “implicazione formale”, v. sopra, cap. 6, $$ 3 e 4.
23° La nozione di classe in generale, abbiamo deciso, potrebbe essere rimpiazzata, come indefinibile, da quella della classe di proposizioni definite da una funzione proposizionale. [Nota di Russell. Abbiamo parlato dell’analisi russelliana delle implicazioni formali nel cap. 6, alla fine del $ 4.]
240 Russell [1903a], $ 106, p. 106. 24! Russell [1903a], $ 1, p. 3. Sebbene Russell non lo dica esplicitamente, è ovvio che anche la nozione di “denotare” —
dei Principles — è usata in matematica, ma non è un costituente delle proposizioni matematiche. 242 Abbiamo parlato di quest’aspetto della teoria dei Principles nell’ultima parte del $ 4 del cap. 6. SE Va sopra, cap. 10.
244 V. Russell [1912e].
245 Russell [1912e], p. 55.
24° Ibid.
secondo la teoria
Il logicismo di Russell
907
relazione multipla:?!” ossia, un complesso non è altro da ciò che in seguito lo stesso Russell chiamerà un fatto. Per esempio, il complesso (fatto) Bruto-assassina-Cesare è ciò che, secondo la teoria del giudizio come relazione multipla, rende vero il giudizio che Bruto assassinò Cesare. I complessi (fatti) sono evidentemente gli eredi delle
proposizioni vere, in quanto entità che rendono veri gli enunciati veri, ed è dunque del tutto naturale che Russell cerchi di riformulare la sua concezione della logica in termini di complessi, in luogo di proposizioni. Per identificare i complessi logici, in “What is logic?” Russell fa uso dell’idea di forma di un complesso, definita come «ciò che esso ha in comune con un complesso ottenuto rimpiazzando ciascun costituente del complesso con qualcosa di differente».?** La forma di un complesso non è, precisa Russell, un costituente del complesso stesso: In un complesso, dev’esserci qualcosa, che possiamo chiamare la forma, che non è un costituente [di esso], ma il modo in cui i co-
stituenti sono messi insieme. Se ne facessimo un costituente, esso dovrebbe essere relato in qualche modo con gli altri costituenti, e il modo in cui fosse relato sarebbe realmente la forma; di qui un regresso senza fine. Quindi la forma non è un costituente. Si prenda, per es., “Antonio
sconfisse
Bruto”.
Mettiamo
a per Antonio,
ecc.
e otteniamo
“aRb”.
Qualsiasi
complesso
risultante
dall’assegnare valori a a, R, b, ha la stessa forma del precedente.”*°
Russell propone ora le definizioni: Due complessi “hanno la stessa forma” se l’uno può essere ottenuto dall’altro attraverso semplici sostituzioni di nuovi termini al posto degli altri. Df. Un complesso è logico se resta un complesso qualsiasi sostituzione possa essere effettuata in esso. Df. Logica = la classe dei complessi logici.?9
Qui però c’è un problema. Parlando del rimpiazzamento di costituenti di complessi, Russell non parla del rimpiazzamento di simboli che designano certe entità con altri simboli in un simbolo complesso, ma del rimpiazzamento delle entità stesse con altre entità in un complesso extralinguistico: egli non intende, per esempio, ciò che si ottiene dal simbolo complesso “Bruto assassina Cesare” sostituendo in esso il nome “Platone” al nome “Bruto”; intende piuttosto — come nella sua precedente teoria sostituzionale — ciò che si dovrebbe ottenere sostituendo, nel complesso, cioè nel fatto extralinguistico, Bruto-assassina-Cesare, Platone (l’uomo in carne e ossa) a Bruto (l’uomo in carne e ossa). Il punto, però, è che questa sostituzione non si può fare, perché, se si potesse, eseguendola otterremmo il complesso (il fatto) Platone-assassina-Cesare: ma questo complesso non esiste, perché Platone non fu tra gli assassini di Cesare, e dunque Platone-assassina-Cesare non è un fatto. In generale, la sostituzione di un costituente di un complesso — qualora sia possibile — non può non dare un altro complesso. Questo rende vacua la precedente definizione di complesso logico e, dunque, di logica. Russell se ne rese conto; infatti, subito dopo aver dato le definizioni riportate sopra, le revoca, scrivendo: E difficile vedere che cosa s’intenda per sostituzione in un complesso se il risultato manca di essere un complesso. Potete sostituire nel simbolo per un complesso, ma non nel complesso. La sostituzione in un complesso può avere un significato definito quando il risultato è un complesso, non quando non lo è. Ciò rende inutile quanto sopra. ca .
x
x
DES
.
.
2
Russell tenta allora una strada diversa, consistente nell’assumere come primitiva l’idea di forma: Possiamo assumere la forma come primitiva. I valori di una forma sono i complessi che hanno quella forma. Una forma è necessaria se per ogni valore delle variabili nella forma c’è un valore per la forma e possibile se la contraddittoria non è necessaria. Allora la logica = la classe delle forme necessarie e possibili. Df.?°°
È evidente che “What is logic?” una “forma” è concepita come il corrispondente ontologico di un enunciato aperto. Russell afferma che una forma «è qualcosa, anche se non un costituente dei complessi aventi quella forma», e
247 V. sopra, cap. 10.
248 Russell [1912e], p. 55.
249 Ibid. 250 Russell [1912e], pp. 55-56. 291 Russell [1912e], p. 56. 252 Ibid.
908
capitolo 13
che essa «non è un semplice simbolo: un simbolo composto interamente di variabili simbolizza una forma, ma non è una forma». L’idea che la logica si occupi di forme è ripresa da Russell in Theory of Knowledge — il suo libro incompiuto del 1913. Qui le forme non sono più simboleggiate da enunciati aperti, come nel caso di “What is logic?”, ma da enunciati chiusi.?* Per esempio, la forma del complesso Otello-ama-Desdemona non è più xRy, ma (3x) (@y) (AR) (xRy). Questa forma è ora considerata un fatto, uno dei fatti massimamente generali di cui si occupa la logica. A far parte della logica, in Theory of Knowledge, non sono più solo alcune forme, ma — come ci si può aspettare considerato il mutamento della nozione di “forma” — tutte le forme.”
Nel ciclo di conferenze del 1918-19 intitolato “The philosophy of logical atomism”, Russell adotta molte delle idee che Wittgenstein sosteneva già nel 1913, e che si ritrovano nel Tractatus Logico-Philosophicus (1918).29°
Russell sostiene ora che le “proposizioni” — termine con il quale non si riferisce più a entità extralinguistiche, ma (come Wittgenstein) a enunciati dichiarativi?” — si riferiscono a fatti, che sono quel genere di entità complesse che rende gli enunciati veri o falsi.”°* I fatti possono essere particolari, come i fatti cui si riferiscono gli enunciati veri che non contengono variabili, o possono essere generali, come i fatti cui si riferiscono gli enunciati veri contenenti variabili vincolate.” I fatti completamente generali, cioè quelli cui si riferiscono gli enunciati costituiti solo di variabili vincolate e costanti logiche, sono, dice Russell, i fatti del genere di cui si occupa la logica.?® Sebbene le proposizioni (enunciati) siano intese riferirsi a fatti, Russell è ora deciso nel negare — in accordo con Wittgenstein — che esse siano nomi di fatti. Una prova di questo, dice Russell, è che a ogni fatto sono associate due proposizioni (enunciati) opposte: [...] le proposizioni non sono nomi per i fatti. È abbastanza ovvio appena ve lo fanno notare, ma di fatto non l’avevo mai realizzato
finché non mi fu fatto notare da un mio ex allievo, Wittgenstein. È del tutto evidente non appena ci pensate, che una proposizione non è un nome per un fatto, per la semplice circostanza che ci sono due proposizioni corrispondenti a ciascun fatto. Supponete che sia un fatto che Socrate è morto. Avete due proposizioni: “Socrate è morto” e “Socrate non è morto”. E corrispondendo queste due proposizioni allo stesso fatto, c’è un solo fatto nel mondo che rende vera l’una e falsa l’altra.”
Quindi la relazione che un enunciato ha con un fatto è diversa dalla relazione di denotazione che c’è tra un nome e il nominato: Ci sono due diverse relazioni [...] che una proposizione può avere con un fatto: l’una è la relazione che potete dire essere vera rispetto al fatto, e l’altra essere falsa rispetto al fatto. Entrambe sono nello stesso modo essenzialmente relazioni logiche che possono .
.
%
è
5
in
DES
,
sussistere tra i due, mentre nel caso del nome, c’è solo un’unica relazione che esso può avere con ciò che nomina.
ZI
ai
Russell prosegue sostenendo — come Wittgenstein — che non è possibile nominare un fatto: Non potete propriamente nominare un fatto. La sola cosa che potete fare è asserirlo, o negarlo, o desiderarlo, o volerlo, o auspicarlo, o metterlo in questione [...]. Non potete mai mettere la sorta di cosa che rende una proposizione vera o falsa nella posizione di un soggetto logico.
Nella breve discussione che segue la prima conferenza di “The philosophy of logical atomism” — dalla quale sono tratti gli ultimi brani riportati —, rispondendo a una domanda Russell ammette che sembra possibile nominare, per esempio, il fatto cui si riferisce l’enunciato “Socrate è morto” attraverso l’espressione ‘la morte di Socrate”. Per inciso, questa era esattamente la sua posizione nei Principles. Ma ora egli sostiene che quest’apparenza
2° Ibid. SV
proposito, sopra, cap. 10, $ 2.
255 v., per esempio, Russell [1913a], parte II, cap. 3, p. 132. 25° V. sopra, cap. 10, $ 5. 27 V. Russell [1918-19], $ I, pp. 184-185, $ II, pp. 195 e 196. Quest’uso della parola proposition per indicare enunciati — che risale ai Principles (v. sopra, cap. 6, $ 7.4) — diviene uno degli usi ufficiali del termine in tutti gli scritti russelliani successivi ai Principia. 258 V. Russell [1918-19], $ I, p. 182. I fatti sono entità complesse ovviamente eredi delle proposizioni (in senso non linguistico) dei Principles o dei complessi della teoria degli atteggiamenti proposizionali come relazioni multiple.
29° 200 20! 2° 203
V. Russell [1918-19], $ I, p: 183. V. Russell [1918-19], $ I, p. 184. Russell [1918-19], $ I, p. 187; corsivi di Russell. Ibid. V. anche ibid., $ III, p. 208. Russell [1918-19], $ I, p. 188.
Il logicismo di Russell
909
è illusoria. La ragione addotta è che un’espressione come “la morte di Socrate” è una descrizione definita, non un nome, e le descrizioni definite non denotano nulla: Potete in apparenza nominare i fatti, ma non penso che lo possiate realmente [...]. Supponete di dire “La morte di Socrate”. Potreste dire che questo è un nome per il fatto che Socrate è morto. Ma ovviamente non è così. [...] Supponendo che egli non fosse mor-
to, l’espressione resterebbe ancora significante anche se allora non ci potrebbe essere nulla che potreste nominare. [...] Potete dire “La morte di Socrate è una finzione”?
Secondo questo punto di vista, tuttavia, i fatti dovrebbero essere valori possibili delle variabili vincolate (per esempio, nell’interpretazione secondo la teoria delle descrizioni russelliana dell’enunciato “La morte di Socrate è un fatto”), eppure non essere nominabili: un’idea che non trovo nessun modo di rendere intelligibile. I fatti, dice Russell, sono essenzialmente complessi, cioè sono costituiti di entità.” I fatti particolari sono costi-
tuiti da individui, qualità e relazioni in intensione (sui costituenti dei fatti generali — come sempre, dopo “On denoting” — Russell è evasivo). Ma, secondo Russell, i fatti non sono in alcun modo riducibili ai loro componenti: essi sono, invece, ulteriori elementi dell’ arredo ontologico del mondo. In altri termini, per dare un resoconto ontologico completo del mondo non basta nominare individui e universali, ma occorre aggiungere i fatti:?°° un’altra
tesi tipicamente wittgensteiniana. Sebbene esistano enunciati (Russell dice qui “proposizioni”) molecolari, cioè composti a partire da altri enunciati attraverso l’uso di connettivi come
“o”,
699
“e”, ecc., Russell considera implausibile che vi siano anche singoli
66-29
fatti molecolari — per esempio, un singolo fatto disgiuntivo che possa essere asserito con l’enunciato “p 0 g”. A Russell sembra che la verità o la falsità di un enunciato della forma “p o g” dipenda da due fatti, e non da un singolo fatto disgiuntivo. Ma questo è un punto su cui egli non insiste, osservando che la plausibilità non è cosa su cui si possa sempre fare affidamento. Egli tuttavia spiega, nel caso di “o”, come si può decidere della verità di un enunciato molecolare — una volta che si conosca il valore di verità degli enunciati atomici che lo compongono — facendo uso delle tavole di verità. Il significato della disgiunzione, afferma Russell, è interamente spiegato in que-
sto modo. Naturalmente, egli aggiunge, lo stesso metodo si applica agli altri connettivi.?°” Anche se Russell inclina a respingere i fatti molecolari, egli propende per ammettere (come il Wittgenstein delle “Notes on logic”) fatti negativi. Per dar conto degli enunciati in cui è presente una negazione parrebbe sufficiente una spiegazione sulla falsariga di quella fornita per gli altri connettivi; ma ciò ovviamente richiede una spiegazione di ciò che rende falsi gli enunciati positivi falsi. Russell, all’epoca, ritiene che i fatti negativi siano necessari per render conto appunto degli enunciati positivi falsi, come, per esempio, “Socrate è vivo”: secondo Russell, “Socrate è vivo” è falso in base a una caratteristica del mondo, cioè il fatto che Socrate non è vivo.
204 Russell [1918-19], $ I, p. 189. 265 V. Russell [1918-19], $ II, p. 195. Nel $ V, a p. 202, Russell dichiara drasticamente: «Nessun fatto è semplice».
200 V. Russell [1918-19], $ I, p. 183. 267 Per quanto detto nell’ultimo capoverso, v. Russell [1918-19], $ III, pp. 209-210. 20V Wittgenstein [1913], $ I, p. 233. Per la posizione del Wittgenstein del Tractatus sui fatti negativi, v. sopra, cap. 10, nota 172. 26 V. Russell [1918-19], $ III, p. 214. Nella discussione che segue l’esposizione di questa parte del saggio, Russell chiarisce di intendere “Socrate è morto” come corrispondente, in parte, a un fatto negativo: “Socrate è morto”, secondo Russell, è «due affermazioni messe insieme: “Socrate fu vivo” e “Socrate non è vivo”» (Russell [1918-19], $ II, p. 215).
In un articolo dell’anno successivo (v. Russell [1919b], $ I, pp. 287-288) Russell esamina e respinge due teorie antagoniste di quella che ammette fatti negativi. Secondo la prima, negare qualcosa equivarrebbe ad affermare che è vera qualche proposizione incompatibile con ciò che neghiamo. Secondo l’altra, un fatto negativo è sostituito dalla mera assenza di un fatto: per es., “Socrate è vivo” non sarebbe falsa perché esiste il fatto negativo che Socrate non è vivo, ma perché non vi è alcun fatto corrispondente. Contro la prima teoria — che Russell attribuisce a Raphael Demos (v. Demos [1917]) e discute anche nel suo precedente [1918-19], $ III, pp. 211-215 —
Russell obietta che la
circostanza che due proposizioni siano incompatibili — per esempio, che “Il tavolo è rotondo” sia incompatibile con “Il tavolo è quadrato” — dipende, a sua volta da un fatto — per esempio, il fatto che ciò che è rotondo non è quadrato — e questo fatto non è meno negativo del fatto di cui si voleva inizialmente negare l’esistenza. Contro la seconda teoria, Russell obietta che l'assenza di un fatto è essa stessa un fatto negativo: il fato, cioè, che non vi è un certo fatto. Sempre in [1919b], $ I, p. 287, Russell sostiene (come il Wittgenstein delle “Notes on logic”: v. Wittgenstein [1913], $ I, p. 233) che un fatto negativo ron contiene più componenti del corrispondente fatto positivo: non contiene, cioè, alcun costituente che corrisponda alla parola “non”. La differenza tra fatti positivi e negativi è, per Russell, primitiva e irriducibile (come la differenza tra proposizioni vere e false all’epoca dei Principles), dipendendo da ciò che egli chiama due qualità [qualities] opposte dei fatti, rispettivamente positiva e negativa (v. ibid.). L’ultimo Russell respingerà l’esistenza di fatti negativi. In An Inquiry into Meaning and Truth (1940) si legge: «Un’asserzione [assertion] ha due lati, soggettivo e oggettivo. Soggettivamente, “esprime” uno stato del parlante, che si può chiamare una “credenza”, che può esistere senza parole, e anche negli animali e negli infanti che non possiedono il linguaggio. Oggettivamente, l’asserzione, se vera, “indica” [indicates| un fatto; se falsa, intende [intends] “indicare” [indicate] un fatto, ma non riesce a farlo» (Russell [1940], cap. 13, A, p. 171); ma in
questo libro Russell non articola una teoria chiara degli enunciati elementari negativi (v. Russell [1940], cap. 5, pp. 82-83, e cap. 11, punto
910
capitolo 13
Interessante, nello scritto ora in esame, è l’argomentazione addotta per sostenere l’esistenza di fatti generali: Quando avevamo discusso le proposizioni molecolari avevo messo in dubbio la supposizione che ci siano fatti molecolari, ma non credo che si possa dubitare che vi siano fatti generali. È perfettamente chiaro, penso, che quando avete enumerato tutti i fatti atomici del mondo, è un ulteriore fatto circa il mondo che questi sono tutti i fatti atomici che ci sono circa il mondo, e questo è proprio un fatto obiettivo circa il mondo quanto lo è uno qualsiasi di essi.??° Supponete di essere riusciti a registrare ogni singolo fatto particolare in tutto l’universo, e che non esista da nessuna parte un singolo fatto particolare di qualsiasi genere che non abbiate registrato, non avrete ancora ottenuto una descrizione completa dell’ universo finché non avrete aggiunto anche: “Questi che ho registrato sono tutti i fatti particolari che vi sono”. Così, non potete sperare di descrivere completamente il mondo senza fatti generali oltre che fatti particolari.??!
Russell fa l’esempio dell’enunciato “Tutti gli uomini sono mortali”, notando che, anche quando si sia constatato, di ciascun uomo esistente al mondo, che esso è mortale, la circostanza che quelli considerati siano tutti gli uomini,
e che, quindi, tutti gli uomini siano mortali, resta un fatto ulteriore, che non può essere inferito dalla mortalità di ciascuno dei diversi uomini che ci sono al mondo.?”?
III, pp. 162-164). Alcuni anni dopo, in Human Knowledge (1948), Russell respinge esplicitamente l’esistenza di fatti negativi, adottando
una teoria che si può considerare una variante di quella di Demos (v. Russell [1948a], parte II, cap. 9, pp. 137-142 (ediz. americana, pp. 121-126), cap. 10, p. 153 (ediz. americana, p. 136), cap. 11, C, pp. 164-165 (ediz. americana, pp. 148-149). La teoria di Human Knowledge
si può riassumere così: ad essere vere o false sono in primo luogo le credenze o discredenze (disbeliefs: una discredenza è il rifiuto di una credenza, il credere-che-non) e, in senso derivato, gli enunciati che le esprimono; un enunciato «può dirsi “vero” o “falso” anche se nessuno lo crede, ammesso che, se esso fosse creduto, la credenza sarebbe vera o falsa secondo il caso» (Russell [1948a], parte II, cap. 11, C, p.
165; ediz. americana, p. 148); la differenza tra credenze vere e false è che alle prime corrisponde un fatto, mentre alle seconde no: «La differenza tra una credenza vera e una falsa è come quella tra una moglie e una zitella: nel caso di una credenza vera c’è un fatto con cui essa ha una certa relazione, ma nel caso di una credenza falsa un tale fatto non c’è» (Russell [1948a], parte II, cap. 11, C, p. 165; ediz. america-
na, p. 149); un enunciato dichiarativo positivo esprime una credenza, mentre un enunciato dichiarativo negativo esprime una discredenza (una tesi simile è sostenuta in Russell [1940], cap. 13, B, p. 193); per es., un enunciato percettivo della forma “a non è Y° — l’unico genere
di enunciato negativo contingente che qui Russell tratta, ritenendo che «Tutti i giudizi empirici negativi sono derivati da giudizi di percezione del tipo di “questo non è blu”» (Russell [1948a], parte II, cap. 9, p. 142; ediz. americana, p. 125) — esprime la discredenza che a sia F; perché questa discredenza sia vera non occorre un fatto negativo: condizione sufficiente della sua verità è l’esistenza del fatto positivo che a è G, laddove G è una qualità dissimile da F — «In questi giudizi», scrive Russell, «[...] abbiamo l’idea suggerita di una qualità e la sensazione di una qualità differente che ci fa discredere l’idea suggerita» (Russell [1948a], parte II, cap. 10, p. 153; ediz. americana, p. 136). La relazione di dissomiglianza (dissimilarity) non è, afferma Russell, la non-identità, ma una relazione positiva (v. Russell [1948a],
parte II, cap. 9, pp. 138-139; ediz. americana, p. 122); diversamente dalla non-identità, questa relazione, osserva Russell, «è questione di gradi. Possiamo passare [per es.] dal blu al rosso per mezzo di una serie di sfumature intermedie, ciascuna delle quali è soggettivamente indistinguibile dalla successiva» (Russell [1948a], parte II, cap. 9, p. 139; ediz. americana, p. 122). La relazione di dissomiglianza vale, chiarisce Russell, solo tra qualità percettive dello stesso genere, le quali sono incompatibili l’una con l’altra (un’incompatibilità non logica, ma immediatamente evidente, non derivata da una generalizzazione dall’esperienza: v. Russell [1948a], parte II, cap. 9, p. 140 (ediz. americana, p. 124), e Russell [1940], cap. 5, p. 82), come, per es., l’essere blu o rosso, dolce o salato: «In tutti i giudizi percettivi negativi spontanei l’esperienza che conduce al giudizio è, nel suo nucleo essenziale, sempre dello stesso genere. C°è un’immagine o idea di una sensazione di una certa classe di sensazioni [sensational class], e c'è una sensazione della stessa classe ma differente da quella di cui c’era
un’idea. Cerco il blu, e vedo rosso; mi aspetto il sapore di salato, e ho il sapore di zucchero» (Russell [1948a], parte II, cap. 9, p. 138; ediz. americana, p. 122). Spiega ancora Russell: «Quando, come risultato di una percezione, dico “questo non è blu”, posso essere interpretato
come se dicessi “questo è un colore differente dal blu”, dove “differente” è la relazione positiva che si può chiamare “dissomiglianza [dissimilarity|”, non la non-identità astratta. Ad ogni modo, si può assumere che questo sia il fatto in virtù del quale il mio giudizio è vero» (Russell [1948a], parte II, cap. 9, p. 139; ediz. americana, p. 122).
270 Russell [1918-19], $ V, p. 236. 27! Russell [1918-19], $ I, pp. 183-184. 272 V. Russell [1918-19], $ V, p. 236. Negli anni Quaranta, Russell non accetterà più quest’argomento, e respingerà l’esistenza di fatti generali. Egli sosterrà che il fatto ulteriore necessario per inferire un enunciato generale “(x)FY? dalla totalità delle istanze di “Fx? — che si trat-
ti, appunto, della totalità delle istanze di “Fx? — non è un fatto del mondo, ma un fatto che riguarda solo la nostra consapevolezza che le suddette istanze siano la totalità delle istanze di “FX”: dal punto di vista logico, la congiunzione di tutte le istanze di “Fx” è equivalente a ‘“(©) Fx”, anche se noi possiamo non esserne consapevoli, perché possiamo non sapere che in tale congiunzione sono presenti tutte le istanze di “Fx”. In Human Knowledge (v. Russell [1948a], parte II, cap. 10, pp. 149-151; ediz. americana, p. 133-134), Russell argomenta che se, per es., «A, B, C, ..., Z sono i valori di “x” per cui “x è umano” è vero», e se «per ciascuno di questi valori “x è mortale” è vero», allora «Je asserzioni [statements] “A è mortale”, “B è mortale”, “C è mortale” ..., “Z è mortale”, prese insieme, sono di fatto [corsivo di Russell] e-
quivalenti a “tutti gli uomini sono mortali”, vale a dire, se l’uno è vero lo è anche l’altro, e viceversa» (v. Russell [1948a], parte II, cap. 10, p. 150; ediz. americana, p. 134), anche se un uomo che conoscesse il valore di verità degli enunciati “x è umano” e “x è mortale” per tutti i valori di “x”, senza però sapere che non ci sono altri valori di “x”, non saprebbe che questa equivalenza vale. Anche nel precedente libro Inquiry into Meaning and Truth Russell scrive: «Il mondo non mentale può essere completamente descritto senza l’uso di nessuna parola logica, anche se non possiamo, senza la parola “tutti”, affermare [state: corsivo di Russell ] che la descrizione è completa [...]» (Russell [1940], cap. 6, p. 92).
Il logicismo di Russell
911
C'è qui, osserva Russell, «una certa difficoltà»??? nel sostenere il rifiuto dei fatti molecolari. La difficoltà è che
“Tutti gli uomini sono mortali” si dovrebbe parafrasare: ‘“(x)(x è un uomo > x è mortale)”. Ci dovrebbe dunque
essere un fatto generale corrispondente; ma allora sembra che dovrebbero esserci fatti particolari corrispondenti agli enunciati che costituiscono le diverse esemplificazioni di quest’enunciato generale, come, per esempio, “Socrate è un uomo > Socrate è mortale”. A questo riguardo, Russell dice: «Non sono sicuro che non si possa aggirare questa difficoltà. Suggerisco soltanto che questo è un punto che si dovrebbe considerare quando si nega che ci sono fatti molecolari, perché, se non può essere aggirato, dovremo ammettere i fatti molecolari».””! Le proposizioni (enunciati) completamente generali, insieme alle funzioni proposizionali — dice Russell — coprono l’intero ambito della logica;””? egli spiega: Ogni proposizione logica consiste interamente e solamente di variabili, sebbene non sia vero che ogni proposizione che consista interamente e solamente di variabili sia logica. Potete considerare stadi di generalizzazione come, per es., “Socrate ama Platone” “x ama Platone” “x ama y” “xRy? [...] Quando siete giunti a “xRy”, avete ottenuto uno schema consistente solo di variabili, non contenente affatto costanti, il puro
schema delle relazioni duali, ed è chiaro che qualsiasi proposizione che esprime una relazione duale si può derivare da xRy assegnando valori a x e R e y. Cosicché questa è, si potreste dire, la pura forma di tutte queste proposizioni. Per forma di una proposizione intendo ciò che ottenete quando sostituite una variabile a ciascun suo singolo costituente.?”°
Colpisce qui l’affermazione secondo cui ogni proposizione logica consisterebbe unicamente di variabili. Che ne è delle costanti logiche? Ciò che Russell ha in mente è chiarito da un altro passo del medesimo saggio: N
Questa è una caratteristica delle proposizioni logiche, che esse non menzionano niente. Una tale proposizione è “Se una classe è parte di un’altra, un termine che è membro dell’una è membro anche dell’altra”. Tutte quelle parole che entrano nell’asserzione [statement] di una proposizione puramente logica sono parole che in realtà appartengono alla sintassi. Sono parole che esprimono de una forma o connessione, senza menzionare nessun costituente particolare della proposizione in cui compaiono |[corsivo mio].
Le costanti logiche esprimono dunque quella forma senza la quale una successione di simboli non ha più quella struttura che contraddistingue un enunciato chiuso (proposizione) o aperto (funzione proposizionale). Si osservi che, in questo brano, il termine “proposizione”, è usato in un modo duplice. Da un lato, per designare entità lin-
guistiche, cioè enunciati. Questo è il significato ufficiale — wittgensteiniano — assegnato a “proposizione” in “The philosophy of logical atomism”.?’* Dall'altro, è usato per indicare ciò che è espresso da un enunciato — il suo riferimento, secondo l’uso russelliano più antico, risalente all’epoca dei Principles. Nella frase conclusiva del brano, che ho posto in corsivo, “proposizione” significa sia l’enunciato, sia il suo riferimento.” Qui i sensi si possono ancora districare: basta trasformare il russelliano «Sono parole che esprimono meramente una forma o connessione, senza menzionare nessun costituente particolare della proposizione in cui occorrono» in: “Sono pa-
273 Russell [1918-19], $ V, p. 237. 274 Ibid. Si veda, in proposito, anche Russell [1911c]: «La matematica, pertanto, è interamente composta di proposizioni che contengono solo variabili e costanti logiche, vale a dire, da proposizioni puramente formali — perché le costanti logiche sono quelle che costituiscono la forma» (p. 291).
295 V. ibid.
276 Russell [1918-19], $ V, p. 237-238. 277 Russell [1918-19], $ I, p. 184. La stessa spiegazione del rapporto tra costanti logiche e “forme” si trova in Russell [1914a], lecture VII, pp. 212-213 (1° ediz., p. 208), e in Russell [1919a], cap. 18, pp. 199-202. 278 Russell scrive: «Una proposizione, si può dire, è un enunciato [sentence] all’indicativo, un enunciato che asserisce qualcosa, non interroga o ordina o comanda. [...] Una proposizione è solo un simbolo. È un simbolo complesso nel senso che ha parti che sono simboli. In un enunciato contenente diverse parole, le diverse parole sono simboli, e l’enunciato che le mette insieme è quindi un simbolo complesso in questo senso» (Russell [1918-19], $ I, pp. 184-185; v. anche, ibid., $ II, p. 195 e p. 196). 27° Russell usa la parola “proposizione” con lo stesso senso duplice anche in altre parti di “The philosophy of logical atomism”, per esempio, quando, nel $ VII, a p. 262, egli scrive che «il simbolo per una classe è un simbolo incompleto; non sta realmente per una parte della proposizione in cui simbolicamente esso compare, ma nell’analisi corretta di queste proposizioni quel simbolo è stato scomposto ed è scomparso». Lo stesso uso duplice del termine “proposizione” compare naturalmernte in altri testi russelliani; per es., in modo evidente, nel seguente passo di “Logical atomism”: «Il fatto è che, quando le parole “il così e così” compaiono in una proposizione, non c’è un corrispondente singolo costituente della proposizione, e quanso la proposizione è pienamente analizzata le parole “il così e così” sono scomparse» (Russell [1924a], p. 328).
9
capitolo 13
role che esprimono
meramente
una
forma
o connessione,
senza
menzionare
nessun
costituente
particolare
dell’entità cui si riferisce la proposizione (in senso linguistico) in cui compaiono”. Ma quando Russell afferma che una proposizione logica dev’essere composta solo di variabili, i suddetti due sensi di “proposizione” appaiono
confusi in modo inestricabile: in quanto si dice contenere variabili, la proposizione dev'essere una successione di simboli, perché poco dopo Russell nega esplicitamente che vi siano “variabili” in senso ontologico non linguistico, cioè come denotazione delle lettere variabili (v. il prossimo brano riportato); tuttavia, in quanto è detta non
contenere costanti, la proposizione dev'essere piuttosto ciò cui si riferisce un enunciato dichiarativo. Ci troviamo di fronte a un intrico simile anche quando Russell, una pagina dopo il penultimo brano riportato scrive: Non è una cosa molto facile scoprire quali siano i costituenti di una proposizione logica. Quando si prende “Socrate ama Platone”, “Socrate” è un costituente, “ama” è un costituente, e “Platone” è un costituente. Quindi cambiate “Socrate” in x, “ama” in KR, e “Pla-
tone” in y. x e R e y non sono nulla, e non sono costituenti, cosicché sembra che tutte le proposizioni della logica siano interamente prive di costituenti. Io non penso che questo possa essere del tutto vero. Ma allora la sola altra cosa che apparentemente possiate dire è che la forma è un costituente, che le proposizioni di una certa forma sono sempre vere: questa può essere l’analisi corretta, seb-
bene io ne dubiti molto.?8° A un primo sguardo, risulta perfino difficile comprendere quale problema Russell si stia ponendo. Stando alle spiegazioni fornite nell’articolo, il termine “proposizioni” dovrebbe riferirsi a entità linguistiche — enunciati. E, in apparenza, all’inizio di questo brano Russell sembra riferirsi alle parole “Socrate”, “ama” e “Platone” come costituenti dell’enunciato “Socrate ama Platone”. Del resto, quando Russell parla di cambiare “Socrate” in x, “ama” in R, e “Platone” in y, non può intendere la sostituzione, in una proposizione in senso ontologico non linguistico, delle entità Socrate, ama e Platone con “variabili” in senso ontologico non linguistico, perché dicendo, subito dopo, che «x e R e y non sono nulla, e non sono costituenti», Russell certamente intende dire che non vi sono i corrispondenti ontologici dei simboli “x”, “R” e “Y° —
i simboli stessi certamente vi sono, e sono anche costituenti
(degli enunciati in cui compaiono). Ci si aspetterebbe che Russell dica ora che le variabili sono costituenti delle proposizioni (in senso linguistico) logiche. Invece egli conclude che, poiché «x e R e y non sono nulla, e non sono costituenti», «sembra che tutte le proposizioni della logica siano interamente prive di costituenti». È evidente che Russell è tornato a parlare di proposizioni — secondo la sua antica abitudine — come entità non linguistiche espresse dagli enunciati, e si chiede implicitamente quali entità siano i costituenti delle proposizioni logiche (in questo senso non linguistico). Poiché le entità cui si riferiscono gli enunciati sono ora i fatti, il problema posto da Russell si può sintetizzare così: quali sono i costituenti dei fatti completamente generali? Ciò che è denotato dalle variabili non può essere, perché le variabili non denotano nulla di definito. Potrebbe esserlo invece — congettura Russell — la forma, che è ciò che esprimono le costanti logiche presenti in un enunciato. Se effettivamente le forme sono costituenti dei fatti generali, «le proposizioni logiche si potrebbero interpretare come proposizioni circa le forme».?! Ancora una volta, ci troviamo di fronte all'emergere, nel pensiero russelliano, della nozione di
“forma”, intesa come “fatto” assolutamente generale, controparte ontologica degli enunciati logici e vero oggetto della logica. Il problema della definizione della logica è ripreso da Russell nell’ Introduction to Mathematical Philosophy (1919). Innanzi tutto, Russell ribadisce che le proposizioni (con questo termine, anche qui egli si riferisce ufficialmente a enunciati) della logica devono essere del tutto generali, nel senso di non menzionare nessun’entità particolare: Che cos'è questo soggetto, che si può chiamare indifferentemente matematica o logica? Cè un modo in cui possiamo definirlo? Alcune caratteristiche del soggetto sono chiare. Per cominciare, non trattiamo, in questo soggetto, con cose particolari o proprietà particolari: trattiamo formalmente con ciò che si può dire di qualsiasi cosa o di qualsiasi proprietà.?*°
Nel seguito, Russell chiarisce che una proposizione come “Se tutti gli uomini sono mortali e Socrate è un uomo, allora Socrate è mortale” non è una proposizione della logica — una proposizione della logica è invece quella del tutto generale: “Per ogni x, per ogni & per ogni /3, se tutti gli a sono Le x è un 4 allora x è un 2°. Dopo a-
280 Sh 282 283
Russell [1918-19], $ V, p. 239. Ibid: Russell [1919a], cap. 18, p. 196. V. Russell [1919a], cap. 18, p. 197.
Il logicismo di Russell
913
ver stabilito questo primo punto, Russell si chiede: «Quali sono i costituenti di una proposizione logica?».?** Anche qui, come in “The philosophy of logical atomism”, Russell oscilla tra l’uso ufficiale del termine “proposizione”, e quello più antico, secondo il quale una proposizione è l’entità cui un enunciato si riferisce. Come ci si può aspettare dalla cronologia degli scritti, la conclusione di Russell è molto vicina a quella di “The philosophy of logical atomism”: Non voglio asserire decisamente che le pure forme — per es. la forma “xRy” — entrino realmente nelle proposizioni del genere che stiamo considerando. La questione dell’analisi di tali proposizioni è difficile, con considerazioni in conflitto tra loro da una parte e dall’altra. Non possiamo imbarcarci in tale questione ora, ma possiamo accettare, come prima approssimazione, il punto di vista che le forme sono ciò che entra nelle proposizioni logiche come loro costituenti. E possiamo spiegare (sebbene non definire formalmente) ciò che intendiamo con “forma” di una proposizione come segue:— La ATTI di una proposizione è ciò che, in essa, rimane immutato quando ogni costituente della proposizione è rimpiazzato da un altro.
Perché la spiegazione di “forma” proposta da Russell abbia qui un senso, occorre non intendere il termine “proposizione” come sinonimo di “enunciato”, ma nella sua vecchia accezione di entità costituente il riferimento degli enunciati. Come in “What is logic?” una forma sembra essere qui intesa come il corrispondente ontologico di un enunciato aperto. In ogni caso, la “forma” è per Russell (come per il primo Wittgenstein) la struttura di un fatto, non (solo) di un simbolo.
2.2. Considerando l’evoluzione del pensiero di Russell sulla logica nel periodo fin qui preso in esame, emerge chiaramente che, nella sua concezione, la logica non ha affatto a che fare con successioni di simboli, ma con enti-
tà non linguistiche, chiamate volta a volta “proposizioni”, “complessi”, o “forme”, che Russell concepisce come fatti, i fatti più generali possibile dell’universo. La logica è quindi per Russell una scienza che studia il mondo, non un semplice calcolo (linguaggio) non interpretato che, potendo ricevere interpretazioni diverse, in diversi domini di oggetti, è utile alle altre scienze: «la logica», dichiara Russell nell’ Introduction to Mathematical PhilosoPhy, «ha a che fare con il mondo reale proprio come la zoologia, anche se con le sue caratteristiche più generali e astratte».?3°
Ma in questa concezione si pone un problema difficile: quello di distinguere, tra le verità completamente generali — cioè quei fatti che possono essere espressi interamente in termini di variabili e costanti logiche —, quelle che realmente sono verità logiche. Nel periodo dei Principles, e negli anni immediatamente successivi, Russell non considerava la questione, perché riteneva che tutte le verità esprimibili interamente in termini di variabili e di costanti logiche siano verità logiche. Ma, dopo aver dovuto considerare, nel corso della sua ricerca sui fondamenti della matematica, principi come l’assioma di scelta (sconosciuto fino al 1904) e l'assioma dell’infinito (un teorema logico, secondo i Principles, ma non più secondo la teoria russelliana dei tipi) — esprimibili entrambi, certo, esclusivamente in termini di variabili e costanti logiche, ma non per questo ritenuti verità o falsità logiche — Russell riconobbe il problema. In “The philosophy of logical atomism”, egli espone il punto, senza però riuscire a fornirne una spiegazione. Scrive Russell: Vorrei solo darvi qualche illustrazione di proposizioni che possono essere espresse nel linguaggio delle pure variabili ma non sono proposizioni della logica. Tra le proposizioni che sono proposizioni della logica sono incluse tutte le proposizioni della matematica pura, le quali non solo possono tutte essere espresse in termini logici ma possono altresì essere dedotte dalle premesse della logica, e sono quindi proposizioni logiche. A parte queste, ve ne sono molte che possono essere espresse in termini logici, ma non possono essere dimostrate dalla logica, e certamente non sono proposizioni che formano parte della logica. Supponete di prendere una proposizione come “C’è almeno una cosa al mondo”. [...] Questa è una proposizione [...] che potete esprimere in termini logici; ma
non potete sapere dalla logica se è vera o falsa. [...] La proposizione che ci sono esattamente 30.000 cose nel mondo si può anch’essa esprimere in termini puramente logici, e non è certo una proposizione della logica ma una proposizione empirica (vera o
falsa), poiché un mondo che contiene più di 30.000 cose e un mondo che contiene meno di 30.000 cose sono entrambi possibili, cosicché se accade che vi siano esattamente 30.000 cose, si tratta di ciò che si potrebbe chiamare un accidente e non è una proposizione della logica.”*”
284 Russell [1919a], cap. 18, p. 198. 285 Russell [1919a], cap. 18, p. 199.
26 Russell [1919a], cap. 16, p. 169. Anche in “The philosophy of logical atomism” Russell scrive: «In conformità alla sorta di tendenza realistica che vorrei porre in tutto lo studio della metafisica, vorrei essere sempre impegnato nell’investigazione di qualche fatto reale o di qualche insieme di fatti, e mi sembra che questo sia il caso in logica quanto in zoologia» (Russell [1918-19], $ IV, p. 216).
287 Russell [1918-19], $ V, pp. 239-240.
914
capitolo 13
Russell prosegue menzionando l’assioma moltiplicativo (assioma di scelta) e l'assioma dell’infinito come esempi di proposizioni formulabili in termini logici, ma non logiche, e conclude: Tutto ciò che è una proposizione della logica dev'essere in un senso o in un altro una tautologia. Dev’essere qualcosa che ha qualche qualità peculiare, che non so come definire, che appartiene alle proposizioni logiche e non alle altre. Esempi di proposizioni tipicamente logiche sono: “Se p implica g e q implica r, allorap implica 7° “Se tutti gli a sono de tutti i b sono c, allora tutti gli a sono e “Se tutti gli a sono b e x è un a, allora x è un d”. Queste sono le proposizioni della logica. Esse hanno una certa peculiare qualità che le distingue dalle altre proposizioni e che ci permette di conoscerle a priori. Ma quale sia esattamente questa caratteristica, non sono in grado di dirvi.28*
Sebbene l’essere esprimibili solo attraverso l’uso di variabili e di costanti logiche sia una caratteristica necessaria delle verità logiche, questa non è — ammette ora Russell — una caratteristica sufficiente. Occorre qualche altra proprietà: la proprietà di essere «in un senso o in un altro una tautologia», ma Russell confessa di non essere in grado di chiarire che cosa ciò precisamente significhi. Wittgenstein — citato da Russell nella nota prefatoria a “The Philosophy of logical atomism” come l’ispiratore di molte delle idee contenute nel testo — sosteneva per l’appunto che la logica è costituita di tautologie. Il termine aveva però, in Wittgenstein, un significato preciso: egli riteneva che tutte le proposizioni siano funzioni di verità delle proposizioni elementari che le costituiscono (una proposizione elementare essendo una funzione di verità di se stessa e una proposizione preceduta da un quantificatore universale essendo ridotta alla congiunzione infinita di tutte le proposizioni che ne costituiscono le istanze). Wittgenstein riteneva che le proposizioni della logica siano tautologie nel senso di essere vere per qualsiasi attribuzione di valori di verità alle proposizioni costituenti. L'idea di Wittgenstein, poi fatta propria da Ramsey, non poteva però essere adottata senza modifiche da Russell. Intanto, la concezione russelliana della quantificazione è diversa da quella di Wittgenstein. Russell non ritiene che un enunciato generale si possa ridurre al prodotto logico delle sue istanze: la sua posizione, come abbiamo visto, è che quando si sia asserito, di tutti gli individui dell’universo, che hanno una certa proprietà, l’idea che questi individui siano tutti gli individui dell’universo non è ancora stata espressa. Poi c’era il problema dell’assioma di riducibilità dei Principia (abbandonato, tuttavia, nella seconda edizione (1925)) il quale non può considerarsi una tautologia nel senso di Wittgenstein. Anche nell’Introduction to Mathematical Philosophy, Russell si pone il problema di delimitare la classe delle verità logiche rispetto alle altre verità generali. Dopo aver indicato come caratteristica degli enunciati logici il fatto che essi debbano contenere solo variabili e costanti logiche (queste ultime esprimenti le “forme” che, sia pure con qualche incertezza, Russell identifica con i riferimenti degli enunciati logici), Russell annota: Ma sebbene tutte le proposizioni logiche (o matematiche) possano essere espresse interamente in termini di costanti logiche insieme con variabili, non è che, per converso, tutte le proposizioni che si possono esprimere in questo modo siano logiche. Abbiamo trova-
to fin qui un criterio necessario ma non sufficiente per le proposizioni matematiche.??®
Russell menziona l’assioma dell’infinito come esempio di proposizione che si può enunciare in termini logici, ma non si può considerare logica, e continua: Tutte le proposizioni della logica hanno una caratteristica che si usa esprimere dicendo che esse sarebbero analitiche, o che le loro contraddittorie sarebbero autocontraddittorie. Questo modo di esprimersi, tuttavia, non è soddisfacente. La legge di contraddizione è solamente una tra le proposizioni logiche; non ha una speciale preminenza; e la dimostrazione che la contraddittoria di qualche proposizione è autocontraddittoria è probabile che richieda altri principi di deduzione oltre alla legge di contraddizione.?”!
La caratterizzazione delle verità logiche come verità “analitiche” in senso kantiano, è dunque respinta. Tuttavia, Russell riconosce che «la caratteristica degli enunciati logici che stiamo cercando è quella che fu intuita, e s’intese definire, da parte di coloro che dicevano che essa consisteva nella deducibilità dalla legge di contraddizione»,””° e fa ancora ricorso al termine “tautologia”’: «Questa caratteristica, che, per il momento, possiamo chiamare tautologia, ovviamente non appartiene all’asserzione che il numero degli individui nell’universo è n, qualunque numero 288 Russell [1918-19], $ V, p. 240. 8 V. sopra, cap. 12,$ 2.5.
290 Russell [1919a], cap. 18, p. 202. 2°! Russell [1919a], cap. 18, p. 203. —#Ipid:
Il logicismo di Russell
n possa essere».
293
915
3 i, FO 2. IRR Per spiegare intuitivamente che cosa intende, Russell fa riferimento all’idea leibniziana di
“mondo possibile”: «Tra i mondi “possibili”, in senso leibniziano, ci saranno mondi aventi uno, due, tre,... indiReeonyi
vidui».°
;
;
;
È
ar
;
Ma Russell confessa di non essere in grado di fornire una definizione rigorosa:
È chiaro che la definizione di “logica” o “matematica” si deve cercare tentando di dare una nuova definizione della vecchia nozione di proposizioni “analitiche”. Anche se non possiamo più considerarci soddisfatti di definire le proposizioni logiche come quelle che seguono dalla legge di contraddizione, possiamo e dobbiamo ancora ammettere che esse sono una classe di proposizioni interamente diverse da quelle che veniamo a conoscere empiricamente. Tutte hanno la caratteristica che, un momento fa, abbiamo convenuto di chiamare “tautologia”. Questa, combinata con il fatto che esse si possono esprimere interamente in termini di variabili e costanti logiche (una costante logica essendo qualcosa che rimane costante in una proposizione quando tutti i suoi costituenti sono cambiati) — darà la definizione di logica o matematica pura. Per il momento, non so come definire “tautologia”. [...] A questo punto, quindi,
peitimomento, raggiungiamo la frontiera della conoscenza nel nostro viaggio all’indietro nei fondamenti logici della matematica.
Parlando di “mondi possibili”, sembra che Russell sia vicinissimo a scorgere la possibilità di caratterizzare la tautologicità come “verità in tutti i modelli”.°?° Ma non vede questa possibilità. Perché? Il problema è che — come abbiamo già avuto modo di osservare — Russell non concepisce la logica come un linguaggio, ma come una scienza, proprio come la fisica. La logica, per Russell, è un corpo di verità massimamente generali riguardo
all’universo. Un sistema formale in cui si esprimano queste verità è per Russell suscettibile di una sola interpretazione: il suo unico “modello”, per così dire, è l’intero mondo reale.??” Ecco perché egli ha tante difficoltà nel distinguere le verità logiche dalle verità contingenti esprimibili attraverso enunciati in cui si fa uso solo di variabili e costanti logiche: il problema è che entrambe le categorie di enunciati sono vere, per Russell, rispetto all’ unica interpretazione ammessa per il linguaggio logico. Poco dopo l’Introduction to Mathematical Philosophy, Russell giunse a considerare le proposizioni logicomatematiche come essenzialmente verbali, ma questo non risolse, ai suoi occhi, il problema che abbiamo menzio-
nato. Questo perché Russell continuava a pensare al linguaggio della logica come a un linguaggio interpretato — interpretato nell’unico modo legittimo, cioè in riferimento al mondo attuale. Ancora nel 1937, nell’introduzione alla seconda edizione dei Principles, Russell si blocca di fronte alla difficoltà di caratterizzare la tautologicità. E-
gli critica la definizione di matematica fornita in apertura dei Principles, ammettendo che essa non è sufficientemente restrittiva: che una proposizione (in senso linguistico) non contenga altre costanti tranne le costanti logiche «benché sia una condizione necessaria per il carattere matematico di una proposizione, non è una condizione sufficiente»;°’* Russell menziona ancora, come esempi, gli enunciati concernenti il numero d’individui esistenti al mondo e l’assioma moltiplicativo (assioma di scelta). Egli ribadisce quindi che: [...] una proposizione può soddisfare la definizione con cui si aprono i “Principles”, e tuttavia non essere suscettibile di una dimostrazione o di una confutazione logica o matematica. Tutte le proposizioni matematiche sono incluse nella definizione (con certe correzioni minori), ma non tutte le proposizioni che vi sono incluse sono matematiche. Affinché una proposizione possa appartenere alla matematica essa deve avere una proprietà ulteriore: secondo alcuni essa dev'essere “tautologica”, e secondo Carnap dev’essere “analitica”. Non è affatto facile ottenere una definizione esatta di questa caratteristica be]
Poche pagine dopo, Russell riprende l’ argomento: Definire la logica, o la matematica, non è quindi per niente facile se non in relazione a qualche dato insieme di premesse. Una premessa logica deve avere certe caratteristiche che si possono definire: essa deve avere una generalità completa, nel senso che non menzioni nessuna cosa o qualità particolare; e dev’essere vera in virtù della sua forma. Dato un insieme definito di premesse logiche, possiamo definire logica, in relazione ad esse, qualunque cosa esse ci permettano di dimostrare. Ma [...] è difficile dire che cosa renda una proposizione vera in virtù della sua forma [...].®
293 Ibid. 24 Ibid. 295 Russell [1919a], cap. 18, pp. 204-205. 2° Per una spiegazione della nozione di “modello”, v. sopra, cap. 2, nota 139. 27 Abbiamo già rilevato (v. sopra, cap. 9, $ 7.2) lo scetticismo di Russell nei confronti dei “mondi possibili”. Nell’ Introduction to Mathematical Philosophy, per es., Russell scrive: «Cè un solo mondo, il mondo “reale” [...]» (Russell [1919a], cap. 16, p. 169). 298 Russell [1937a], p.xi.
2° Russell [1937a], p. xii. 300 Russell [1937a], p. xvi.
916
capitolo 13
Russell respinge l’idea che la logica si riduca a ciò che può essere dimostrato a partire da un insieme di assiomi assunti convenzionalmente: Alcuni scrittori, per esempio Carnap nella sua “Logical Syntax of Language”, trattano tutto il problema come se fosse una questione di scelta linguistica più di quanto io possa credere che sia.[°°'] Nell’opera summenzionata, Carnap ha due linguaggi logici, uno dei quali ammette l’assioma moltiplicativo e l’assioma dell’infinito, mentre l’altro non li ammette. Non posso io stesso considerare
tale argomento come qualcosa da decidere per mezzo di una nostra scelta arbitraria. A me sembra che o questi assiomi hanno, oppure non hanno, la caratteristica della verità formale che caratterizza la logica, e che nel primo caso ogni logica deve includerli, mentre nel secondo ogni logica deve escluderli. Confesso, tuttavia, che non sono in grado di dare nessun resoconto chiaro di ciò che s'intende dicendo che una proposizione è “vera in virtù della sua forma”. Ma quest’espressione, inadeguata com'è, indica, io penso, il problema che dev'essere risolto se si vuole trovare una definizione adeguata della logica.?°°
Ancora una volta, Russell usa le parole ‘vero in virtù della sua forma” o “tautologico” in modo meramente evocativo, e — come egli stesso riconosce — ciò non costituisce nessun reale passo avanti nell’esatta delimitazione dell’ambito della logica.
30! In The Logical Syntax of Language (1937), Carnap sostiene il carattere totalmente linguistico e convenzionale della logica, e dunque la piena legittimità di logiche diverse: fissare una logica è per Carnap semplicemente fissare una forma di linguaggio — un prerequisito di ogni discorso razionale. In un celebre passo del libro, egli scrive: «In logica, non ci sono morali. Ognuno è libero di costruire la sua propria logica, cioè la sua propria forma di linguaggio, come vuole. Tutto ciò che gli si richiede è che, se vuole discuterne, egli debba esporre i suoi metodi chiaramente, e dare regole sintattiche invece che argomenti filosofici» (Carnap [1937], $ 17, p. 52; corsivo di Carnap).
302 Russell [1937a], pp. xvi-xvii.
CAPITOLO 14 ALCUNE OBIEZIONI GENERALI AL LOGICISMO
In questo capitolo considereremo alcune obiezioni generali al logicismo che si sono rivelate molto influenti. Una supposta confutazione definitiva del logicismo proviene, da più di mezzo secolo, dall’opinione predominante secondo cui l’ambito della logica sarebbe limitato alla cosiddetta “logica del primo ordine”, o “logica elementare” — con l’esclusione, quindi, sia della “logica di ordine superiore”, sia della teoria degli insiemi.' Esamineremo quest’obiezione al logicismo nella forma bene articolata che essa assume nell’opera matura di Quine. Nella seconda parte del capitolo, cercheremo di indagare se il logicismo soccomba o no alle obiezioni che gli sono frequentemente mosse in relazione con uno degli sviluppi filosoficamente più interessanti della logica formale successivi ai Principia Mathematica: il primo teorema d’incompletezza di GGdel.
1. L’OBIEZIONE DI QUINE È difficile sopravvalutare l'influenza del pensiero di Russell su Quine — in parte diretta, in parte mutuata attraverso l’empirismo logico. Fu la lettura dei Principia Mathematica ad attrarre quello che sarebbe diventato uno dei maggiori filosofi del Novecento verso gli studi di logica e filosofia della matematica. Laureatosi ventiduenne all’Oberlin College, Ohio, nel 1930, con una tesi sui Principia Mathematica, Willard Van Orman Quine vinse una
borsa di studio per un dottorato in logica matematica a Harvard, che conseguì nel giugno del 1932, sotto la supervisione di Alfred N. Whitehead e del pragmatista Clarence I. Lewis, con una tesi dal titolo “The logic of sequences: A generalization of Principia Mathematica” — poi rielaborata nel suo primo libro: A System of Logistic (v. Quine [1934]), del quale Whitehead scriverà una calorosa prefazione. Durante gli studi a Harvard, Whitehead
lo presentò a Russell — che si trovava in quell’università per un ciclo di lezioni — e, da allora, Quine tenne una corrispondenza con Russell. Conseguito il dottorato, Quine ebbe una borsa di studio che gli consentì di perfezionare i suoi studi in Europa. Nel settembre del 1932 giunse a Vienna, dove perfezionò il suo tedesco, seguì le lezioni di Moritz Schlick e, su invito di questi, partecipò regolarmente alle riunioni settimanali del Circolo di Vienna, incontrando,
tra gli altri, Hans Hahn, il giovane Kurt Gédel, Friedrich Waismann
e Alfred J. Ayer. Quine
scrisse a Carnap — che dal 1931 viveva e insegnava a Praga — e ne ricevette una risposta calorosa. I due si incontrarono durante una visita a Vienna di Carnap all’inizio del 1933 e, su invito di Carnap, tra l’inizio di marzo e l’inizio di aprile dello stesso anno Quine fu a Praga per seguire le lezioni in cui Carnap esponeva il suo libro Logische Syntax der Sprache (1934), che la moglie Ina stava allora battendo a macchina. Carnap permetteva a Quine di leggere il dattiloscritto a mano a mano che i fogli uscivano dalla macchina per scrivere di Ina, e, nei giorni liberi dalle lezioni, di discutere amichevolmente con lui le idee contenute nel libro. Dopo una vacanza in Italia, Quine
passò il mese di maggio a Varsavia, dove incontrò, tra gli altri, Jan tukasiewicz, Alfred Tarski e Stanislaw Lesniewski e ne frequentò le lezioni. Tornato negli Stati Uniti, Quine fu invitato a tenere alcune lezioni su Carnap per prepararne la vista a Harvard, prevista per la primavera del 1936 — in occasione del tricentenario di quell’università —, cosa che Quine fece con un ciclo di tre lezioni molto simpatetiche nei confronti di Carnap, tenute tra 18 e il 22 novembre del 1934. Quine divenne professore a Harvard nel 1936, lo stesso anno in cui Carnap
si trasferì definitivamente negli Stati Uniti per insegnare all’ Università di Chicago. Quine e Carnap rimasero amici, e tra loro continuò un intenso scambio culturale fatto di lettere e visite. Quine si considerò un discepolo di Car-
! Ricordiamo che una logica è del primo ordine se è un calcolo dei predicati espresso in un linguaggio del primo ordine, ossia in cui compaiono solo variabili individuali; una logica è di ordine superiore se è un calcolo dei predicati espresso in un linguaggio almeno del second’ordine — ossia in cui, oltre alle variabili individuali, compaiono anche variabili predicative, che variano su proprietà, o classi di individui (v. sopra, cap. 2, nota 131).
? Quine aveva voluto continuare gli studi a Harvard proprio perché sapeva che lì insegnava Whitehead (questi fu professore a Harvard dal 1924 al 1937). Tuttavia, all’epoca, Whitehead aveva mutato i suoi interessi, rispetto alla prima decade del Novecento. Quanto a Lewis, il grande sostenitore della logica modale non era congeniale a Quine. Per queste ragioni, in realtà, né Whitehead né Lewis contribuirono alla tesi di dottorato di Quine.
918
capitolo 14
nap fino al 1939, quando cominciarono a precisarsi alcuni tratti della sua filosofia che lo contrapponevano al mae-
stro. Nel 1970, l’anno della morte di Carnap, il terzo Biennial Meeting of the Philosophy of Science Association, che si tenne a Boston in ottobre, fu intitolato In Memory of Rudolf Carnap: Quine vi presentò un “Homage to Rudolf Carnap” in cui afferma: «Carnap è una figura gigantesca. Lo considero la figura dominante in filosofia dagli anni 30 in avanti, come era stato Russell nei decenni precedenti». Come ci si può aspettare dalla sua formazione, la filosofia di Quine prende le mosse dalla filosofia di Russell e dallo sviluppo che essa ebbe negli empiristi logici, la cui figura guida era senza dubbio Carnap. I sistemi fondazionali proposti da Quine in “New foundations for mathematical logic” (1937) e Mathematical Logic (1940) — di cui abbiamo parlato nel cap. 12, $ 2.8 — erano ancora presentati come sistemi logicisti. Quine caratterizzò però la sua filosofia matura (dagli anni Cinquanta del Novecento) in opposizione sia al logicismo, sia alla tesi centrale dell’empirismo logico: cioè la distinzione tra verità analitiche e sintetiche. Quello che c’interessa ora sviluppare sono le sue obiezioni alla tesi logicista, non solo per la loro influenza, ma anche perché provengono, per così dire, “dall’interno”, cioè da un terreno culturale comune e da un ex logicista. Nel corso di questo lavoro abbiamo visto che la derivazione della matematica dalla “logica” richiede la quantificazione su classi, o su proprietà e relazioni.* Se dunque la logica di ordine superiore e/o la teoria delle classi s0no considerate teorie extralogiche, la tesi logicista diviene banalmente falsa. Il nucleo dell’obiezione matura di Quine al logicismo è proprio questo: egli ritiene che l’ambito della logica sia limitato alla logica elementare (logica del primo ordine con identità), nel cui linguaggio non compaiono variabili per classi o proprietà, ma solo variabili individuali. Quine ammette che, per gli scopi della matematica, può rivelarsi necessario quantificare su entità astratte — su proprietà, o classi” —, ma ritiene che, quando si passa da una teoria che ammette unicamente una quantificazione su individui a una teoria che ammette una quantificazione su proprietà o — come egli preferisce — su classi, si passi da una teoria logica a una teoria matematica vera e propria. Il confine tra matematica e logica si situa, per il Quine maturo, precisamente al confine tra la logica elementare e la teoria degli insiemi (egli considera una logica di ordine superiore come una «teoria degli insiemi in veste di pecora»®). L’obiezione di Quine non è dunque volta, come altre, a particolari aspetti del logicismo russelliano — come, per esempio, il principio del circolo vizioso, la teoria dei tipi, l'assioma di scelta, l'assioma dell’infinito, ecc. Essa è diretta al fondamento stesso della costruzione logicista in qualsiasi forma possibile. Infatti, poiché la logica elementare è assiomatizzabile in modo che ogni verità logica esprimibile nel suo linguaggio sia dimostrabile, men-
tre non esiste un’assiomatizzazione dell’aritmetica tale che in essa siano dimostrabili tutte le verità aritmetiche,’ ne deriva che le verità aritmetiche non possono essere verità logiche. Per fare un esempio, anche se i paradossi non fossero esistiti e la teoria che Frege espone nei suoi Grundgesetze si fosse rivelata del tutto ineccepibile, l’obiezione di Quine resterebbe: la teoria di Frege non rappresenterebbe una riduzione dell’aritmetica alla logica, ma semmai una riduzione riuscita dell’aritmetica alla logica più la teoria (intuitiva) degli insiemi — quindi, una riduzione dell’intera aritmetica a una teoria matematica più fondamentale. Nel seguito, cercheremo di esaminare gli argomenti che Quine adduce a favore del suo punto di vista sui confini della logica.
1.1. Nel quinto capitolo di Philosophy of Logic (1970), intitolato “L'ambito della logica” (The scope of logic), dopo aver argomentato a favore della tesi secondo cui la teoria dell’identità fa parte della logica, Quine prosegue ponendo il problema dell’appartenenza alla logica della teoria delle classi: «Passiamo ora [...] alla teoria delle classi. Appartiene alla logica? Concluderò di no».* Quine nota, giustamente, che i pionieri della logica moderna: 3 Quine [19662], p. 40. * Nei Principia, come abbiamo visto nel capitolo 11, le classi sono ridotte a proprietà e le proprietà, a loro volta, sono considerate riducibili a universali. Questa complicazione non è qui pertinente, e può essere quindi tralasciata. ° «Che le classi siano universali, o entità astratte», scrive Quine, «è talora posto in ombra parlando di classi come di meri aggregati o collezioni, assimilando così una classe di pietre, poniamo, a un mucchio di pietre. Il mucchio è in effetti un oggetto concreto, tanto concreto quanto le pietre che lo costituiscono; ma la classe delle pietre del mucchio non si può identificare con il mucchio. Infatti, se potesse esserlo, allora per la stessa ragione anche un’altra classe si potrebbe identificare con lo stesso mucchio; cioè, la classe delle molecole delle pietre del mucchio. Ma di fatto queste classi si devono mantenere distinte, perché vogliamo dire che l’una ha poniamo solo un centinaio di elementi, mentre l’altra ne ha bilioni. Le classi, pertanto, sono entità astratte; possiamo chiamarle aggregati o collezioni volendo, ma sono universali. Cioè, se vi sono classi» (Quine [1947], $ 4, p. 79). V. anche Quine [1940] e [1951a], $ 22, p. 120, e Quine [1953b], $ 3, pp. 114-
SY)
° Quine [1970], cap. 5, p. 66. Ds sotto, $ 2.
* Quine [1970], cap. 5, p. 64.
Alcune obiezioni generali al logicismo
919
[...] consideravano la teoria delle classi come logica: così Frege, Peano, e diversi loro seguaci, in particolare Whitehead e Russell. Frege, Whitehead, e Russell si proposero lo scopo di ridurre la matematica alla logica; Frege dichiarò nel 1884 di aver provato in questo modo, in opposizione a Kant, che le verità dell’aritmetica sono analitiche. Ma la logica capace di questa riduzione era una logica includente la teoria delle classi.”
Come abbiamo già osservato di passaggio in precedenza," anche il primo Quine riteneva la teoria delle classi parte della logica. In “New foundations for mathematical logic” (1937), Quine scrive, a proposito della “logica” necessaria a realizzare il progetto logicista: Si deve ammettere che la logica che genera tutto questo [l’intera matematica pura tradizionale] è uno strumento molto più potente
di quella fornita da Aristotele. [...] [Si tratta di] una logica triplice di proposizioni, classi, e relazioni. Le notazioni primitive nei termini delle quali questi calcoli sono infine espressi non sono nozioni standard della logica tradizionale; tuttavia esse sono di un genere che non si esiterebbe a classificare come logico [corsivo mio].!!
Una posizione ancora conservata da Quine in Mathematical Logic ([1940], [1951a]), laddove il vocabolario
della logica è caratterizzato come quello essenziale a ogni discorso (v., introduzione, p. 2), e il simbolo “€”, che è inteso come una traduzione della copula “è” (v. $ 22, p. 119),'? è come quest’ultima considerato una costante logica (v. $ 23, p. Joy
proprio perché la copula è di uso universale (v. introduzione, p. 3) e universale è l’uso di
quella forma estensionale di proprietà che sono le classi (v. $ 22, pp. 120-121). Ora, invece, in Philosophy of Logic, Quine afferma che «la tendenza a vedere la teoria delle classi come logica è sempre dipesa dalla sopravva-
lutazione dell’affinità tra appartenenza e predicazione»,"'e continua: Nell’innocente “Fx? della logica della quantificazione, la lettera schematica “/? sta al posto di un predicato. O, più esplicitamente, la combinazione “Fy” sta al posto di un enunciato aperto in “x”; se l’enunciato abbia “x” da un lato e un predicato isolato dall’altro, non è importante. L'importante è che scrivendo “PF? e “Fy? noi stiamo solo simulando schematicamente gli enunciati e le loro parti; non ci stiamo riferendo a predicati o altre stringhe di segni, né ci stiamo riferendo ad attributi o classi. Alcuni logici, tuttavia, hanno scelto la direzione opposta, leggendo “F” come una variabile attributiva e “Fx? come “x ha /”?. Qualcuno, amante degli attributi, lo ha fatto in piena coscienza, altri vi sono stati irretiti a causa di una confusione."
Qui si tocca il nucleo dell’obiezione di Quine. Secondo Quine, le lettere “p”, “97, ecc., del calcolo proposizionale (o enunciativo), e le lettere “F?, “G”, ecc., del calcolo dei predicati del primo ordine devono essere intese come lettere schematiche, non come autentiche variabili, quali “x”, “y”, ecc. La differenza è che una lettera schematica, come “p’” o “PF”, sta al posto — nel senso letterale del termine — di un enunciato, o di un predicato (dove 66.39
66.99
per “predicato” s’intende un simbolo), non specificato, mentre una variabile designa un oggetto non specificato. Le lettere schematiche, al contrario delle vere variabili, non appartengono al linguaggio oggetto: esse servono solo a simulare autentici enunciati o predicati del linguaggio oggetto; in altre parole, servono a marcare le posizioni di un enunciato in cui si devono immaginare gli enunciati o i predicati del linguaggio oggetto.'° È importante sottolineare — con Quine — che le lettere schematiche, pur facendo parte del metalinguaggio, hanno uno statuto diverso dalle variabili del metalinguaggio che stanno al posto di nomi di espressioni del linguaggio oggetto e che assumono come valori espressioni del linguaggio oggetto. Le variabili del metalinguaggio che assumono come valori espressioni del linguaggio oggetto si comportano grammaticalmente come nomi, mentre le lettere schematiche per enunciati e predicati si comportano grammaticalmente come enunciati, o come predicati: le lettere schematiche non stanno al posto di nomi di alcunché, sono esse stesse pseudoenunciati, o pseudopredicati.'’ Coloro che trattano le lettere enunciative e predicative come autentiche variabili, sono autorizzati a far entrare queste lettere nei quantificatori; Quine sostiene però che, così facendo, essi s' impegnano ad ammettere nella loro ontologia delle entità come proposizioni (in senso non linguistico) e attributi:
? Quine [1970], cap. 5, pp. 65-66. !° V. sopra, cap. 12, note 421 e 422.
!! Quine [1937a], p. 81. 1? Come, per es., in Carnap [1942], $ 13, p. 57.
13 Ancora, come in Carnap [1942], $ 13, p. 57. !4 Quine [1970], cap. 5, p. 66. !5 Ibid. Un esempio di autore che assume in piena coscienza proposizioni e attributi come riferimenti delle lettere proposizionali e predicative è Frederic B. Fitch (v. Fitch [1952], soprattutto $$ 2, 3 e 16).
!6 v. Quine [1970], cap. 2, pp. 24-25. !? v. Quine [1953b], $ 2, p. 111.
920
capitolo 14
I quantificatori “(3)” e “(F)” sono il cuore del problema. [...] Consideriamo dapprima delle quantificazioni ordinarie; TEMA cammina)”, ‘“(x) (x cammina)”, “(@x) (x è primo)”. L’enunciato aperto dopo il quantificatore mostra “x in una posizione dove po-
trebbe stare un nome; il nome di uno che cammina, per esempio, o di un numero primo. Le quantificazioni non significano che dei nomi camminano o sono primi; ciò che si dice camminare o essere primo sono le cose che potrebbero essere denominate per mezzo di nomi in quelle posizioni. Mettere la lettera predicativa “/” in un quantificatore, allora, è trattare improvvisamente posizioni predicative come posizioni di nomi, e quindi trattare i predicati come nomi di entità di qualche sorta. Il quantificatore “(41)” o “(1)” non dice che alcuni o tutti i predicati sono così e così, ma che alcune o tutte le entità della sorta denominata per mezzo dei predicati sono così e così. Il logico che afferra questo punto, e ancora quantifica “/”, può dire che queste entità sono attributi; gli attributi sono per lui i valori di “F”, le cose sulle quali “F”” varia.!*
Come conseguenza da un lato del suo scetticismo nei confronti della nozione di “sinonimia” —
che sembra
proporsi come unico criterio d’identità tra entità intensionali — e dall’altro del suo principio ‘Nessuna entità senza identità” (cioè, non si devono ammettere entità per cui non si possano fornire dei criteri precisi d’individuazione) Quine, com’è noto, ritiene che tali entità — come proposizioni e attributi — siano da respingere: Gli attributi stanno ai predicati, o agli enunciati aperti, come le proposizioni stanno agli enunciati chiusi. Gli attributi sono come le proposizioni nell’inadeguatezza della loro individuazione. Le classi sono ben individuate dalla legge di estensionalità, che identifica le classi i cui membri sono gli stessi; ma questa legge non funziona per gli attributi [...]. Enunciati aperti che sono veri esattamente delle stesse cose non determinano mai due classi, ma possono determinare due attributi. Ciò che si richiede in più per l’identità degli attributi è la sinonimia, in qualche senso, degli enunciati aperti; e [...] noi abbiamo disperato di dare un senso soddisfacente a tale sinonimia."°
Ma il nocciolo dell’obiezione quineana all'assunzione di lettere enunciative o predicative nei quantificatori non è quello dell’intensionalità, ma quello che si è detto sopra: le lettere enunciative e predicative — per Quine — non si devono trattare come variabili, ma come lettere schematiche: non devono essere assunte nei quantificatori, neppure se come loro valori si prendono estensioni — come valori di verità, o classi — i cui criteri d'identità siano ben definiti: Alcuni logici [...] vedono i valori di “°° come classi. Ma io disapprovo l’uso di lettere predicative come variabili quantificate, anche quando 1 valori sono classi. I predicati hanno attributi come loro “intensioni”’ o significati (o li avrebbero se ci fossero attributi), e hanno classi come loro estensioni; ma non sono nomi né degli uni né degli altri. Le variabili adatte alla quantificazione quindi non vanno messe nelle posizioni dei predicati. Esse vanno messe nelle posizioni dei nomi.”
Altrove, Quine sottolinea che la sua proposta di trattare le lettere proposizionali e predicative come lettere schematiche non è dovuta a un preconcetto nominalista: Il lettore adesso penserà certamente che la raccomandazione di uno status schematico per “p”, ‘“g”, ecc. e per “F”, “G”, ecc. sia suggerita semplicemente dal rifiuto di ammettere entità quali le classi e i valori di verità. Ma ciò non è vero. Ci possono essere buone ragioni [...] per ammettere tali entità, e per ammettere nomi di esse, e per ammettere variabili vincolabili che prendano tali entità — le classi, in ogni modo — come valori. La mia obiezione presente è solo contro il trattare le asserzioni e i predicati stessi come nomi di queste o di qualsiasi entità, e l’identificare così i “p”, “9”, ecc. della teoria delle funzioni di verità e gli “#°?, “G”, ecc. della teoria della quantificazione con variabili vincolabili. [...] [...][I]] principale svantaggio dell’assimilare le lettere schematiche alle variabili vincolate è che conduce a un resoconto falso degli
impegni ontologici della maggior parte del nostro discorso. Quando diciamo che alcuni cani sono bianchi, (4) (Ax) (x è un cane . x è bianco), non c’impegniamo nei confronti di entità astratte come la caninità o la classe delle cose bianche. [...] È quindi fuorviante costruire le parole “cane” e “bianco” come nomi di tali entità. Ma facciamo proprio questo se rappresentando la forma di (4) con “(x) (Fx. Gx)” pensiamo “PF” e “G” come variabili di classe vincolabili. Possiamo naturalmente passare alla forma esplicita “(3x)(x € y.x € 2)” ogni volta che davvero vogliamo variabili di classe che si (190%)
€699
possano vincolare. (Potremmo anche usare, invece di “y” e “7”, uno stile distinto di variabili per le classi.)?!
Senza dubbio Quine simpatizza con il nominalismo, ma il suo punto di partenza non vuol essere un dogma nominalista. Piuttosto, il suo scopo dichiarato è quello di distinguere una parte del linguaggio che si può considerare
!8 '° 20 2!
Quine Quine Quine Quine
[1970], cap. 5, pp. 66-67. [1970], cap. 5, p. 67. [1970], cap. 5, p. 67. [1953b], $ 3, pp. 112-113.
Alcune obiezioni generali al logicismo
921
neutrale circa l’esistenza delle classi o degli attributi,’” da una parte del linguaggio in cui le classi o gli attributi sono indubbiamente assunti come entità: Io nego che i predicati siano nomi senza dover negare che vi siano cose come gli attributi. Questa è una questione distinta. Possia-
mo ammettere gli attributi includendoli nell’universo di oggetti che costituiscono i valori delle nostre variabili di quantificazione. Possiamo nominarli, anche, se ammettiamo nomi nel nostro linguaggio; ma questi nomi non saranno predicati. Saranno termini singolari, che possono essere messi al posto delle variabili; termini singolari astratti come “bianchezza” o “il camminare”, non predi-
cati come “è bianco” o “cammina”.
Come abbiamo visto, Quine respinge l’esistenza di attributi, ma non quella delle classi. Pur sottolineando che «[I]e classi sono abbastanza preoccupanti [...] se abbiamo delle apprensioni filosofiche sull’ammissione di entità
diverse dagli oggetti concreti», egli ritiene che teorie che assumono l’esistenza di classi siano necessarie in matematica, e debbano essere sviluppate. Quine, tuttavia, insiste che tali teorie non debbano essere formulate nel linguaggio di una logica di ordine superiore, ossia facendo entrare nei quantificatori le lettere predicative: I seguaci di Hilbert hanno continuato a quantificare lettere predicative, ottenendo ciò che essi chiamano un calcolo dei predicati di ordine superiore. I valori di queste variabili sono in effetti classi; e questo modo di presentare la teoria delle classi le conferisce un’ingannevole rassomiglianza con la logica. Si è portati a pensare che non sia stata fatta nessuna indebita aggiunta all’ordinaria logica della quantificazione; solo alcuni quantificatori in più, che governano lettere predicative già presenti. Al fine di apprezzare quanto questa linea possa essere ingannevole, si consideri l’ipotesi “4yVx(xe y. Fw”. Essa assume una classe {x :Fx} [la classe degli x tali che x è un F] determinata da un enunciato aperto nel ruolo di “Fx”. Questa è l’ipotesi centrale della teoria delle classi, e quella che dev'essere ristretta in un modo o nell’altro per evitare i paradossi. Questa stessa ipotesi è persa di vista nel cosiddetto calcolo dei predicati di ordine superiore. Otteniamo “4G Vx (Gx & Fx”, che evidentemente segue dalla banalità genuinamente logica “Vx (Fx & Fx)” mediante un’inferenza logica elementare.
Naturalmente, Quine non intende dire che una logica di ordine superiore debba essere incoerente: egli sapeva beAS e O ; a 5 p 9) RI 3 È MIE P nissimo che si può formulare una logica di ordine superiore coerente.’ Il punto è, piuttosto, che l'ammissione di lettere predicative all’interno di quantificatori mimetizza,
secondo Quine, le assunzioni
esistenziali della teoria
delle classi: Trattando le lettere predicative come variabili di quantificazione abbiamo fatto precipitare una fiumana di universali contro cui l’intuizione è impotente. Non possiamo più vedere ciò che facciamo, né dove la corrente ci porti. Le nostre precauzioni contro le contraddizioni sono degli espedienti ad hoc, giustificati solo perché, 0 finché, sembrano funzionare.”
Perché Quine parla di «fiumana di universali contro cui l’intuizione è impotente»? In fondo, egli riconosce che una logica di ordine superiore «sembrerebbe un modo estremamente naturale di proclamare un regno di universali che rispecchino i predicati o le condizioni che si possono scrivere nel linguaggio».?* Egli spiega il punto così: In realtà, tuttavia, risulta proclamare un regno di classi molto più vasto delle condizioni che si possono scrivere nel linguaggio. Questo risultato è forse sgradito, perché sicuramente l’idea intuitiva sta alla base della supposizione di un regno di universali è semplicemente quella di supporre una realtà dietro le forme linguistiche. Il risultato, tuttavia, è a portata di mano; possiamo ottenerlo come un corollario del teorema di Cantor [...]. La dimostrazione di Cantor si può effettuare nell’estensione della teoria della
quantificazione in considerazione, e dal suo teorema segue che devono esserci classi, in particolare classi di forme linguistiche, che non hanno forme linguistiche ad esse corrispondenti.”
22 Torneremo tra poco sul problema se la logica elementare, concepita al modo di Quine, sia effettivamente del tutto neutrale di fronte all’assunzione dell’esistenza di classi — cioè non richieda nessun’assunzione di esistenza di classi. 23 Quine [1970], cap. 2, p. 28.
24 Quine [1953b], $ 5, p. 122. 2° Quine [1970], cap. 6, p. 68. 26 Nella logica del second’ordine, le variabili predicative — chiamiamole “variabili predicative'” — sono vincolabili, ma possono comparire solo in posizione predicativa. Queste variabili predicative' possono comparire in posizione di soggetto nella logica del terz’ordine, ma come argomenti di variabili predicative? (vincolabili) che, a loro volta, non possono comparire altro che in posizione predicativa. E così via, in una gerarchia illimitata di logiche di ordine superiore. In questo modo, tali logiche non sono soggette al paradosso di Russell. Una logica che riunisca in sé tutta questa gerarchia di logiche — una logica di ordine ®© — è anch’essa coerente, ed è una versione di teoria
semplice dei tipi.
27 Quine [1953b], $ 6, p. 123.
28 Quine [1953b], $ 5, p. 121.
°° Ibid.
922
capitolo 14
La proposta di Quine è dunque quella di considerare la teoria delle classi come una teoria matematica, avente un proprio oggetto, costituito da certi universali: le classi, appunto, le quali non devono essere considerate come la
denotazione dei predicati di un linguaggio: questa teoria matematica dev'essere espressa, cioè, in un linguaggio del primo ordine. Ci si potrebbe domandare:
se si ammette la legittimità di una teoria delle classi, che differenza fa formulare
questa teoria come teoria del primo ordine o del secondo? Non è forse una differenza notazionale irrilevante scrivere, per esempio “X(x)”? — come si può fare in un linguaggio del second’ordine — o “x e X?° — come si può fare in un linguaggio del primo ordine con due stili di variabili? Certo, ci possono essere interpretazioni secondo le quali si tratta della stessa cosa; ma non è a queste interpretazioni che si riferisce Quine, bensì alle interpretazioni standard dei linguaggi del primo e del second’ordine. Fermiamoci un attimo su questo punto. Nell’interpretazione standard di un linguaggio del second’ordine, le variabili individuali variano su un dominio fissato di individui, le variabili predicative monadiche variano su tutte le proprietà di questi individui, o tutte le loro classi (vale a dire, sull’insieme potenza del dominio), le variabili predicative diadiche variano su tutte le relazioni diadiche tra gli individui del dominio, o su tutte le possibili classi di coppie ordinate di questi individui, e, in generale, le variabili predicative n-adiche variano su tutte le relazioni n-adiche tra gli individui del dominio, o su tutte le classi di nuple ordinate di questi individui. Nell’interpretazione di un linguaggio del primo ordine, invece, tutte le variabili variano su domini di entità; queste entità possono anche essere di generi diversi, per esempio, individui e insiemi, ripartite in domini diversi, cui si fa riferimento usando variabili differenti: per esempio, lettere minuscole per le
variabili individuali, e maiuscole per le variabili su insiemi. Si comprende qui la differenza tra teorie del primo ordine e teorie del second’ordine (in un’interpretazione standard): quantificando sugli insiemi in una teoria del primo ordine, quantificheremo sui tutti gli insiemi presenti nel dominio pertinente di un’interpretazione della teoria, mentre, quantificando su insiemi in una teoria del second’ordine (nell’interpretazione standard) quantificheremo su tutti gli insiemi, in assoluto, di oggetti presenti nel dominio di un’interpretazione della teoria. Così, il dominio su cui variano le variabili predicative in una teoria del second’ordine è del tutto fissato una volta che si sia fissato il dominio degli individui della teoria; al contrario, in una teoria del primo ordine, seppure sia fissato il dominio su cui variano le sue variabili individuali, non è affatto fissato, con ciò, il dominio su cui variano le va-
riabili predicative. Il carattere non logico di una teoria degli insiemi del primo ordine è esibito dalla presenza nel suo linguaggio del predicato diadico primitivo “e”. “e” è preso a denotare una relazione tra oggetti appartenenti al dominio (0 ai domini, se questi sono più d’uno) delle interpretazioni della teoria, e la teoria appare allora come una descrizione di questa relazione. Il problema, per il Quine maturo, non è di bandire ogni riferimento a classi, ma di riconoscere che non appena ammettiamo [...] le classi come valori delle variabili quantificabili, siamo impegnati in una vera e propria teoria matematica. Siamo ben al di là della portata delle procedure complete di dimostrazione, e anche in un campo di dottrine in competizione.?®
Le ragioni qui accennate da Quine a sostegno dell’esclusione di teoria delle classi e di logica di ordine superiore dall’ambito della logica sono due: (1) il calcolo dei predicati del primo ordine è semanticamente completo, mentre quelli di ordine superiore sono semanticamente incompleti; “a(2) le teorie delle classi esistenti sono diver-
se, e in competizione tra loro. Queste ragioni non appaiono però conclusive. Riguardo alla prima, R. Mark Sainsbury, nel suo libro su Russell
([1979]) obietta:”
[...] perché dovremmo considerare la completezza come una caratteristica adeguata del dominio della logica? Perché invece, per esempio, non considerare fissato questo dominio come quell’area per cui esiste una procedura di decisione? In base a questo criterio, neppure tutta la “logica” del primo ordine risulterebbe essere logica, ma una parte della logica del second’ordine risulterebbe essere logica [...]. [...] Se si dice che la nozione di completezza cattura l’idea preteorica che ciò che è logico è riconducibile a una dimostrazione, cosicché la completezza è parte dell’essenza della logica, si può replicare che c’è una nozione preteorica d’antica data secondo cui il fatto che una verità sia logica è una questione riconducibile a un trattamento meccanico. Tuttavia, se prendiamo l’esistenza di una procedura di decisione come il correlato tecnico della nozione di riconducibilità a un trattamento meccanico, si
20 Quine [1970], cap. 6, p. 72. °! Cioè, tutte le verità della logica dei predicati del primo ordine sono dimostrabili all’interno di essa. : Oi s È È a do note 7 È Cioè, esistono delle verità della logica di ordine superiore che non sono dimostrabili all’interno di essa. °° Un’obiezione analoga è accennata, quattro anni prima di Sainsbury, in Boolos [1975], pp. 50-51.
FIRE
Alcune obiezioni generali al logicismo
923
potrebbe altrettanto bene sostenere che la decidibilità fa parte dell’essenza della logica, cosa che, come abbiamo visto, porta a risultati che in effetti non vogliamo.?*
Sainsbury si riferisce qui al fatto che un noto teorema di Church (teorema d’indecidibilità di Church) stabilisce che la logica del primo ordine con identità non è nel suo complesso decidibile — cioè, non è possibile stabilire, con un procedimento finito di calcolo, se una qualsiasi formula della logica del primo ordine sia o non sia valida 0 soddisfacibile —, sebbene vi siano frammenti di essa che lo sono, come la logica del primo ordine monadica con identità.” D’altra parte, gli enunciati monadici della logica del second’ordine — nei quali cioè siano presenti solo
variabili e/o costanti individuali, e variabili e/o costanti predicative monadiche — sono anch'essi decidibili.** ? Confrontando la logica del primo ordine con una di ordine superiore da un punto di vista metateorico si può dire ancora molto, a difesa della seconda. Una logica di ordine superiore ha un potere espressivo maggiore di quella del primo ordine. Normalmente, si ritiene che la teoria dell’identità sia parte della logica (questa è anche l’opinione di Quine); eppure — al contrario di ciò che accade in una logica di ordine superiore —, nella logica del primo ordine l’identità non è definibile, e dev'essere introdotta come nozione primitiva, richiedente l’aggiunta di opportuni assiomi. Anche con l’aggiunta dell’identità, nella logica del primo ordine non sono definibili nozioni
matematicamente importanti, come quelle di progressione,” di relazione ancestrale," di relazione ben ordinata," che, invece, sono definibili in una di ordine superiore. L’aritmetica di Peano e l’analisi matematica,
formulate
come teorie di ordine superiore (cioè, come teorie che utilizzano una logica di ordine superiore), risultano categoriche: vale a dire che tutti i loro modelli sono isomorfi — ossia modelli tra gli oggetti dei quali è possibile stabilire una relazione uno-uno che conservi tutte le relazioni tra essi. Quindi, il teorema di compattezza e il teorema Lé6wenheim-Skolem* non si applicano più alle teorie di ordine superiore (nella loro interpretazione standard): in esse non esistono modelli non intesi dei numeri naturali (che invece risultano inevitabili nelle teorie aventi modelli infiniti formulate nella logica del primo ordine);* tutti i modelli della teoria dei numeri naturali sono infiniti
4 Sainsbury [1979], cap. 8, $ 2, p. 278. 3 V. Léwenheim [1915], Skolem [1919], $ 4, e Behmann [1922]. La logica del primo ordine non è più decidibile, invece, se si ammettono
predicati diadici nei suoi enunciati contenenti quantificatori.
°° V. Skolem [1919], $ 4, e Behmann [1922].
97 Sulla difficoltà di concepire la logica del primo ordine come una “unità naturale”, v. anche Ferreir6s [2001], pp. 448-454. CA
per es., Boolos
[1975] e Shapiro [1991] e [2005]. Si richiami (v. sopra, cap. 2, nota
131) che, con le locuzioni “logica del se-
cond’ordine” o “logica di ordine superiore” mi riferisco sempre alle interpretazioni standard dei linguaggi di queste logiche, laddove le variabili del second’ordine (cioè per proprietà o classi di individui, o relazioni tra essi) possono assumere come valori tutte le proprietà 0 tutte le classi, degli oggetti dell’universo di discorso (o dominio del modello) e tuzte le relazioni tra essi, e le variabili di ordine n-esimo, con n > 2, (ossia variabili per proprietà di proprietà o classi di classi, o relazioni tra proprietà o classi) possono assumere come valori tutte le proprietà o tutte le classi, delle entità su cui variano le variabili di ordine minore dell’ n-esimo (oppure, in una versione più limitativa, del solo ordine n — 1-esimo). 27
sopra, cap. 2, $ 5.3.1.
Savi sopra, cap. 2, $ 5.3.1. 4 V. sopra, cap. 2, $ 4.2.1. 4 La differenza fondamentale tra l’aritmetica peaniana di ordine superiore e quella del primo ordine risiede nella formulazione del quinto
assioma di Peano. Mentre in una formulazione di ordine superiore l'assioma afferma che tutte le proprietà che ha 0, e che ha anche il successore di x se le ha x, sono proprietà di tutti i numeri naturali (oppure che tutte le classi cui appartiene 0, e cui appartiene il successore di x se vi appartiene x, hanno per elementi tutti i numeri naturali), in una formulazione del primo ordine esso afferma che, data una qualsiasi espressione predicativa monadica del linguaggio del primo ordine in cui è formulata la teoria, se quest’espressione è vera di 0 e del successore di x quando è vera di x, essa è vera di ogni numero naturale. Qual è la differenza? Nella formulazione del primo ordine, l’assioma — che in realtà diviene uno schema d’assiomi — riguarda ciascuna espressione predicativa esprimibile nel linguaggio della teoria, mentre nella formulazione di ordine superiore, l'assioma riguarda tutte le proprietà (o tutte le classi), senza riguardo al fatto che esse siano o no specificabili attraverso espressioni predicative del linguaggio della teoria. 4 Il teorema di compattezza (dimostrato per la prima volta in Gédel [1930] come conseguenza del teorema di completezza per la logica del primo ordine) afferma che se ogni sottoinsieme finito di un insieme F finito o infinito numerabile di formule del primo ordine ha un modello, allora Y ha un modello. Il teorema di Liwenheim-Skolem dice che ogni sistema formale del primo ordine che ha un modello infinito ha un modello infinito numerabile, e che ogni sistema formale del primo ordine che ha un modello numerabile, ha anche un modello non nu-
merabile per ogni alef maggiore di No. 4 Come nota Boolos ([1975], p. 49) questa non è una faccenda che riguardi solo l’aritmetica. La validità del teorema di compattezza per le teorie del primo ordine implica non solo la non refutabilità, in esse, di una classe di enunciati come:
{x è un numero naturale”, “x non è 0”,
“x non è 1”, “x non è 2”, “x non è 3”... e così via}, ma anche la non refutabilità di classi di enunciati come, per es.: {Smith è un antenato di Jones”, “Smith non è un genitore di Jones”, “Smith non è un nonno di Jones”, “Smith non è un bisnonno di Jones”,... e così via}, che
appaiono inconsistenti al senso comune proprio come la classe di enunciati seguente (la cui inconsistenza è dimostrabile nella logica del primo ordine): {Smith è un antenato di Jones non superiore al terzo grado”, “Smith non è un genitore di Jones”, “Smith non è un nonno di Jones”, “Smith non è un bisnonno di Jones”}) — e che sono inconsistenti, nelle teorie d’ordine superiore. Che la logica del primo ordine
924
capitolo 14
numerabili e tutti i modelli della teoria dei numeri reali sono infiniti non numerabili (mentre al primo ordine vi
sono modelli infiniti non numerabili per la teoria dei numeri naturali e modelli numerabili per la teoria dei numeri reali). Dalla categoricità segue anche che, nelle teorie aritmetiche di ordine superiore, ogni verità matematica in esse esprimibile è una conseguenza logica degli assiomi (cosa che non si verifica al primo ordine). Le teorie matematiche che utilizzano una logica di ordine superiore sembrano quindi riflettere meglio ciò che realmente intendiamo dire, rispetto a quelle del primo ordine,* cosicché il confronto sulla base di metateoremi non è ineluttabilmente a favore della logica del primo ordine. Ma torniamo a Quine. L'osservazione secondo cui non c’è accordo su quale sia la teoria delle classi corretta è indubbiamente corretta; ma non è una ragione per escludere la teoria delle classi dall’ambito della logica. Non c’è accordo universale, per esempio, sulla validità del principio del terzo escluso, ma coloro che lo accettano (come Quine) lo considerano nondimeno un principio logico. D'altra parte, come vedremo tra poco, è lo stesso Quine, in altre occasioni, a sottolineare che la logica, anche nell’accezione ristretta del termine da lui proposta, non è immune da possibili revisioni — e dunque non può essere immune da possibili disaccordi. Il punto centrale della questione è che non si può negare che tra logica del primo ordine e logica di ordine superiore (e/o teoria delle classi) vi siano le differenze indicate da Quine: diverse implicazioni ontologiche, differenti proprietà metateoriche, diversi gradi di consenso. Ma questo non implica, di per sé, un’esclusione dal campo della
logica della teoria delle classi o di una logica di ordine superiore; non più di quanto le differenti proprietà della logica proposizionale e della logica del primo ordine poliadica giustifichino un’esclusione della seconda dall’ambito della logica. Si potrebbe semplicemente concludere, per es., che la logica proposizionale, quella del primo ordine monadica e poliadica, quella del second’ordine monadica e poliadica, ecc., siano diverse parti della
logica. Questa è precisamente la conclusione che lo stesso Quine traeva dalle sue argomentazioni nei ‘“Supplementary remarks”, del 1953, a “New foundations for mathematical logic” (1937). Quine sosteneva che vi siano [...] tre parti della logica [corsivo mio] che è opportuno sviluppare successivamente: la teoria delle funzioni di verità, la teoria della quantificazione, e la teoria delle classi. [...] Una ragione per preferire lo sviluppo separato delle tre menzionate parti della logica sta nei loro contrasti metodologici: la prima parte ha una procedura di decisione, la seconda è completabile ma non ha procedura di decisione, e la terza è incompletabile. [...] Una seconda ragione è che mentre le prime due parti si possono sviluppare in modo da non presupporre classi o nessun’altra sorta speciale di entità, la terza parte non lo può; [...] la separazione delle parti ha pertanto il valore di separare gli impegni ontologici. Una terza ragione è che mentre le prime due parti sono definite nei loro aspetti essenziali; la terza parte — la teoria delle classi — è in uno stato speculativo. Per il confronto delle numerose teorie delle classi alternative ora disponibili o ancora da concepire, è conveniente poter dare per scontata la base comune della teoria delle funzioni di verità e della teoria della quantificazione e concentrarsi sulle variazioni nella teoria delle classi vera e propria.*°
Già in Mathematical Logic (1940) Quine delineava chiaramente la differenza tra logica del primo ordine e teoria delle classi, e considerava la possibilità di chiamare “logica” solo la prima. Infine, tuttavia, preferiva respingere quest’opzione: Si potrebbe in effetti pensare la logica, in un senso ristretto, come comprendente solo la teoria della composizione dell’asserzione [statement] e della quantificazione [...]. Il livello nel quale stiamo entrando, allora, si potrebbe considerare come formante un secondo livello di matematica — la teoria delle classi, altrimenti nota come teoria degli insiemi, teoria degli aggregati, Mengenlehre. [...] Teoria delle relazioni, aritmetica, e altre branche della matematica trovano allora sistemazione come specializzazioni o suddi-
visioni della teoria delle classi. Da questo punto di vista, incidentalmente, le cosiddette “formule logiche” sarebbero più appropriatamente descrivibili come “formule matematiche”; tuttavia sarà mantenuta la prima designazione, e non sarà raccomandato il senso
ristretto di “logica” appena suggerito.‘
Il motivo per cui Quine considerava, all’epoca, la logica come inclusiva della teoria delle classi era una definizione del vocabolario della logica come quello essenziale a ogni scienza, oltre che al discorso comune, insieme con una constatazione della pervasività dell’apparente riferimento a classi, o a proprietà:
non sia in grado di riflettere l’inconsistenza delle prime due classi di enunciati, opina Boolos, «non mostra che esse sono dopotutto consistenti, ma che non tutte le inconsistenze (logiche) siano rappresentabili per mezzo di questa logica» ([Boolos [1975], p. 49).
* Questo è stato contestato da Skolem; ma si tratta di una posizione estrema che non ha molto seguito tra i matematici.
‘© Quine [1953a], p. 96.
4 Quine [1940], $ 23, pp. 127-128. Il brano è ripetuto nella seconda edizione del libro: Quine [1951a], stesso paragrafo e stesse pagine. SI Quine [1940], introduzione, p. 2.
Alcune obiezioni generali al logicismo
925
Il discorso in generale, matematico e altrimenti, implica un continuo riferimento a entità astratte di questa sorta — classi e proprietà. Si potrebbe preferire considerare le astrazioni come finzioni o modi di dire; si potrebbe sperare di trovare un metodo per mezzo
del quale tutti i riferimenti apparenti a entità astratte si possano spiegare come semplici abbreviazioni di un idioma più fondamentale che implichi un riferimento solo a oggetti concreti (in un senso o in un altro). [...] Un tale programma nominalistico presenta una difficoltà estrema, se molta della matematica e della scienza naturale standard si deve davvero analizzare e ridurre piuttosto che semplicemente ripudiare; tuttavia, non è riconosciuto come impossibile. Se si può raggiungere una teoria nominalistica di questo tipo, possiamo accettarla volentieri come il sostegno teorico del nostro attuale riferimento apparente alle cosiddette entità astratte; nel frattempo, tuttavia, non abbiamo altra scelta che ammettere queste entità astratte come parte del nostro oggetto [subject-matter] ultimo.
1.2. Come abbiamo visto, il Quine maturo preferisce invece chiamare “logica” solo la logica proposizionale e quella predicativa del primo ordine, lasciando la teoria delle classi alla matematica. Il contrasto con il logicismo russelliano è tuttavia meno drastico di quanto possa apparire. Ciò dipende dalla particolare concezione quineana del rapporto tra la conoscenza logico-matematica e il resto della conoscenza scientifica. Contrapponendosi alla tesi degli empiristi logici (di ascendenza wittgensteiniana) secondo cui gli enunciati logicamente veri sarebbero analitici —
cioè veri in virtù del significato delle parole —,
mentre gli enunciati veri
delle scienze empiriche sarebbero sintetici — cioè veri anche in virtù di caratteristiche extralinguistiche del mondo —, Quine sostiene che non vi è una differenza di principio tra le verità logiche, matematiche e le altre verità scientifiche, ma che tutte fanno parte di uno stesso sistema interrelato di conoscenze: La totalità della nostra cosiddetta conoscenza o delle nostre credenze, dalle più casuali questioni di geografia e di storia alle leggi più profonde della fisica atomica o persino della matematica pura e della logica, è un edificio fatto dall’uomo che urta contro l’esperienza solo lungo i margini. O, per cambiare immagine, la scienza totale è come un campo di forza le cui condizioni di confine sono l’esperienza.”
La differenza tra le conoscenze logiche e matematiche e le altre non è — per Quine — una differenza di genere, ma di grado: le asserzioni logiche e matematiche differiscono dalle altre solo per la posizione più centrale nella rete interconnessa delle nostre conoscenze: [Queste] si possono pensare come collocate in una posizione relativamente centrale nell’intera rete, intendendo con ciò che s’impongono poche connessioni preferenziali con particolari dati si senso.
Di fronte a un’esperienza che non si accorda con il nostro sistema di conoscenze —
sostiene Quine —, è sem-
pre l’intero sistema ad essere posto in discussione: Un conflitto con l’esperienza alla periferia provoca un riaggiustamento all’interno del campo. I valori di verità devono essere ridistribuiti su alcune delle nostre asserzioni. La rivalutazione di alcune asserzioni implica la rivalutazione di altre, a causa delle loro interconnessioni logiche — le leggi logiche essendo a loro volta solo certe altre asserzioni del sistema, certi altri elementi del cam-
po. Avendo rivalutato una certa asserzione dobbiamo rivalutarne alcune altre, che possono essere asserzioni logicamente connesse con la prima o che possono essere le asserzioni delle stesse connessioni logiche. Ma il campo totale è così indeterminato dalle sue condizioni di confine, l’esperienza, che c’è molto spazio di scelta riguardo a quali asserzioni rivalutare alla luce di qualunque singola esperienza contraria.”
Per Quine, nessuna delle conoscenze che fanno parte del sistema è, in linea di principio, immune da revisione di fronte all’esperienza, neppure le leggi della logica: Se questo modo di vedere è corretto, è fuorviante parlare del contenuto empirico di un’asserzione empirica — specialmente se è un’asserzione molto lontana dalla periferia esperienziale del campo. Inoltre diviene una follia cercare un confine fra asserzioni sintetiche, che valgono contingentemente sulla base dell’esperienza, e asserzioni analitiche, che valgono comunque sia. Qualsiasi asserzione si può ritenere vera comunque sia, se facciamo aggiustamenti abbastanza drastici in qualche altra parte del sistema. Persino un’asserzione molto vicina alla periferia si può ritenere vera di fronte a un’esperienza recalcitrante adducendo a pretesto un’allucinazione o correggendo alcune di quelle asserzioni del genere chiamato leggi logiche. Inversamente, per la stessa ragione, nessun’asserzione è immune da revisioni. È stata proposta perfino la revisione della legge del terzo escluso come mezzo per sem-
4° Quine [1940], $ 22, p. 121. 50 Quine [1951b], $ VI, p. 39 (Quine [1953a], p. 42).
5! Quine [1951b], $ VI, p. 41 (Quine [1953a], p. 44). 5 Quine [1951b], $ VI, pp. 39-40 (Quine [1953a], pp. 42-43).
926
capitolo 14 plificare la meccanica quantistica; e che differenza c’è in linea di principio fra un cambiamento del genere e il cambiamento per cui 7
S
;
7
È
a
Keplero ha rimpiazzato Tolomeo, 0 Einstein Newton, o Darwin Aristotele?
53
Nonostante queste tesi olistiche, Quine non nega che, nella pratica quotidiana, vi siano esperienze che sono prese a confutare un particolare enunciato, così come nella pratica scientifica si conducono esperimenti volti a confutare certi particolari enunciati piuttosto che altri; né ha nulla da obiettare a questa procedura: Per esempio, possiamo immaginare esperienze recalcitranti cui saremmo sicuramente inclini a conciliare il nostro sistema rivalutando solo l’asserzione che in Elm Street ci sono case di mattoni, insieme con asserzioni correlate sul medesimo argomento. Pos-
siamo immaginare altre esperienze recalcitranti cui saremmo inclini a conciliare il nostro sistema rivalutando solo l’asserzione che non vi sono centauri, insieme con asserzioni ad essa imparentate. Un’esperienza recalcitrante, ho già rilevato, si può conciliare per mezzo di una qualsiasi di varie revisioni alternative in vari settori alternativi del sistema totale; ma, nei casi che stiamo ora immagi-
nando, la nostra naturale tendenza a turbare il meno possibile il sistema totale ci condurrebbe a dirigere le nostre revisioni su quelle particolari asserzioni concernenti case di mattoni o centauri.*
Questo modo di procedere è, per Quine, un importante principio euristico, che egli chiama massima della mutilazione minima (maxim of minimum mutilation): Un caso interessante a questo proposito si è visto [...] nella proposta di cambiare la logica per venire incontro alla meccanica quantistica. I meriti della proposta possono essere dubbi, ma ciò che è rilevante ora è che tali proposte siano state fatte. La logica in linea di principio non è meno aperta alla revisione della meccanica quantistica o della teoria della relatività. Lo scopo è, per ciascuna, un sistema del mondo — per usare un’espressione di Newton — che sia il più comodo e semplice possibile e che sia bene in accordo con le osservazioni ai margini. Se raramente si propongono revisioni che incidano così a fondo da toccare la logica, la ragione è abbastanza chiara: la massima della mutilazione minima [...]. La massima è sufficiente a spiegare l’aria di necessità che accompagna le verità logiche e matematiche.”
La logica, quindi, per Quine, non è di diversa natura, rispetto alla matematica — così come, del resto, non è di diversa natura rispetto alla fisica. Tuttavia la logica, nella concezione di Quine, condivide con la matematica — e non con altre scienze — una posizione assolutamente centrale nella rete delle nostre conoscenze. È quest’ultima caratteristica, che —
secondo Quine —
fa apparire indubitabili la logica e la matematica, mentre, per esempio, gli
enunciati della fisica appaiono più chiaramente suscettibili di revisione. Ma, anche se nella teoria di Quine la distanza tra logica e matematica appare molto minore di quella che può sembrare all’inizio, resta il fatto che — secondo Quine — i due ambiti devono essere distinti. E questa distinzione è volta a non occultare le assunzioni ontologiche della teoria delle classi — sulla quale è costruita la matematica classica. 1.3. Se la teoria delle classi è parte della logica, e le classi non sono riducibili ad altre entità, allora l’esistenza di classi dev’essere una necessità logica. Ma può l’esistenza di un oggetto essere un fatto logico? Fino ai Grundgesetze la risposta di Frege era positiva:”° le classi erano per lui oggetti logici, e l'assioma (V) dei Grundgesetze garantiva l’esistenza di una classe per ogni concetto, in modo che due concetti non coestensivi corrispondessero a classi diverse. Ma la teoria delle classi dei Grundgesetze era presto risultata contraddittoria,” e il tentativo di cor-
rezione fatto da Frege per salvarla” si era rivelato inefficace.” Nei suoi ultimi scritti, Frege si mostrò pessimista sulla possibilità che la logica, da sola, possa implicare l’esistenza di qualche oggetto. In un breve scritto del 1924 o 1925, all’epoca non pubblicato, in cui revoca le sue precedenti tesi logiciste a favore di una fondazione dell’aritmetica basata sull’intuizione geometrica (in senso kantiano),° Frege distingue tre diverse fonti conoscitive per la matematica e la fisica: (1) la percezione sensibile, (2) la fonte conoscitiva geometrica, (3) la fonte conoscitiva logica.
°3 Quine [1951b], $ VI, p. 40 (Quine [1953a], p. 43). 24 Quine [1951b], $ VI, pp. 40-41 (Quine [1953a], pp. 43-44). °° Quine [1970], cap. 7, p. 100. SAVA Frege [1893-1903], vol. II, $ 74, p. 86; per un riscontro precedente, v. Frege [1884], $ 89.
°7 V. Frege [1893-1903], vol. II, postfazione. LV sopra, cap. 5, $ 2. sg sopra, cap. 5, $ 3.
° V_ Frege [1924-25].
Alcune obiezioni generali al logicismo
927
A proposito dell’ultima, Frege annota che essa «è implicata laddove si traggono inferenze, quindi è implicata quasi dappertutto. Ma sembra che attraverso questa soltanto non ci possa essere dato alcun oggetto [corsivo mio]».® Russell, per parte sua, adottò infine una “teoria senza classi”, che riduceva le classi a “funzioni proposizionali”. Quine, che interpreta le funzioni proposizionali dei Principia — nel senso rilevante alla riduzione delle classi a funzioni proposizionali — come attributi, ritiene che l’ammissione di attributi, da parte di Russell, fosse dovuta a una confusione; egli scrive: Ma perché Russell riteneva gli attributi un’assunzione più congeniale delle classi? Si trattò del mancato apprezzamento del punto in cui la logica elementare, nella sua innocente simulazione dei predicati, cedeva il passo al parlare di attributi. L'espressione “funzione proposizionale”, adattata da Frege, dissimulava la confusione; Russell la usava talvolta per riferirsi ai predicati e talvolta per riferirsi agli attributi. Il risultato fu che alcuni pensarono che Russell avesse derivato la teoria delle classi, e con essa la matematica in
generale, da un punto di partenza strettamente logico.
In un articolo del 1947 — “On universals” —, Quine menziona Hans Hahn quale esempio rilevante di coloro che videro la teoria senza classi dei Principia come «una liberazione della matematica dal platonismo; come una riconciliazione della matematica con un’ontologia esclusivamente concreta». Nell'articolo menzionato, il riferimento di Quine è a «Hans Hahn, Uberfliissige Wesenheiten (Vienna, 1930), p. 22». Nel luogo citato da Quine,
dopo aver brevemente sintetizzato come la matematica si possa ricostruire sulla base di un’ontologia di classi, Hahn afferma che le classi sono in realtà superflue, perché eliminabili con il metodo proposto da Russell: Russell ha mostrato come ogni asserzione significante in cui compare la parola “classe” si possa trasformare in un’asserzione che menziona solo oggetti e che non menziona più classi di oggetti. [...] Infine, anche le classi si dimostrano entità superflue, e non rimane nient’altro oltre alle entità del nostro mondo sensibile di cui possiamo fare esperienza.
Questa era la posizione di Hahn. Ma Russell non aveva preoccupazioni nominalistiche e — per quanto fosse incline a confondere tra uso e menzione dei segni — non pensava affatto la sua riduzione delle classi a funzioni proposizionali come una riconduzione della matematica a un’ontologia nominalista. Sebbene egli concepisse le funzioni proposizionali come simboli, egli riteneva anche che questi simboli fossero composti di parti implicanti sicuramente un riferimento a universali. Russell riconosceva apertamente l’esistenza di universali, e non solo ne-
gli anni dei Principles, ma anche all’epoca della prima edizione dei Principia, e in seguito. Per esempio, in “The philosophical importance of mathematical logic” (1911), egli scrive: La logica e la matematica ci obbligano [...] ad ammettere un genere di realismo nel senso scolastico, vale a dire, ad ammettere c’è
un mondo di universali e di verità che non si appoggiano direttamente su tali e tali esistenze particolari. Questo mondo di universali deve sussistere [subsist], sebbene esso non possa esistere [exist] nello stesso senso in cui esistono i dati particolari.
In “Le réalisme analytique” (1911) Russell scrive: La matematica pura, se non mi sbaglio, si occupa esclusivamente di proposizioni che si possono esprimere per mezzo di universali. Invece di avere termini dati per le relazioni [sc. costanti come termini delle relazioni], si hanno termini variabili too
Qualche anno dopo, in “The philosophy of logical atomism” (1918), Russell riassume così la sua visione del mondo: «Ci sono particolari e qualità e relazioni di vari ordini, un’intera gerarchia di diverse specie di [elementi] semplici, ma tutti, se siamo nel giusto, hanno in vari modi qualche genere di realtà che non appartiene a nient'altro».
°! Frege [1924-25], p. 299. © Quine [1970], cap. 5, p. 68.
°° Quine [1947], $ 4, p. 79; Quine [1953b], $ 5, p. 122. % Quine [1947], $ 4, p. 79, nota. Il riferimento all’opera specifica di Hahn è omesso in Quine [1953b].
Hahn [1930], pp. 17-18. °© Russell [1911c], p. 293. 9 Russell [1911b], pp.414-415. 9 Russell [1918-19], $ VIII, p. 270. Come ho sostenuto sopra, nel cap. 11, $ 1.2, la suddivisione in tipi delle entità di cui parla qui Russell non è quella proposta nei Principia. La teoria dei tipi dei Principia conduce a una gerarchia di simboli, non di entità: le entità dei Principia — gli individui, che comprendono sia i particolari sia gli universali — sono tutte dello stesso tipo. Questa è invece una partizione in tipi degli individui dei Principia.
928
capitolo 14
In effetti, la concezione russelliana della logica è diversa da quella di Quine: Quine vorrebbe che la logica fosse
esente da assunzioni esistenziali; Russell, al contrario, suppone che certe assunzioni esistenziali siano inevitabili fe logica: in poche parole, egli — proprio come il Frege dei Grundgesetze — ritiene che esistano oggetti logi° È interessante, a questo proposito, un passo che si trova all’inizio del cap. 15 dei Principles: Comincerò con qualche osservazione preliminare riguardo alla distinzione tra filosofia e matematica, e riguardo alla funzione della filosofia in una materia come i fondamenti della matematica. Le seguenti osservazioni non devono necessariamente essere considerate come applicabili ad altre branche della filosofia, poiché esse sono derivate specialmente dalla considerazione dei problemi della logica. La distinzione tra filosofia e matematica è in generale una distinzione di punto di vista: la matematica è costruttiva e deduttiva, la filosofia è critica, e in un certo senso impersonale, controversa. Dovunque abbiamo un ragionamento deduttivo, abbiamo la matematica; ma i principi di deduzione, il riconoscimento di entità [corsivo mio] indefinibili, e la distinzione tra queste entità [corsivo mio], sono affare della filosofia. La filosofia è, in realtà, principalmente una questione di intuito e percezione [insight and perception). Entità che sono percepite dai cosiddetti sensi, come colori e suoni, non sono, per qualche ragione, comunemente considerate come rientranti nell’ambito della logica, se non per quanto riguarda le più astratte delle loro relazioni; ma sembra assai dubbio che una tale esclusione possa essere sostenuta. In ogni caso, tuttavia, poiché il presente lavoro è essenzialmente disinteressato agli 0ggetti fisici, possiamo limitare le nostre osservazioni a entità che non sono considerate esistenti nello spazio e nel tempo. Anche tali entità, se possiamo conoscere qualcosa di esse, devono essere in un certo senso percepite [perceived], e devono essere distinte l’una dall’altra; anche le loro relazioni devono in parte essere comprese immediatamente. Un certo corpo di entità [corsivo mio] indefinibili e di proposizioni indimostrabili deve formare il punto di partenza per ogni ragionamento matematico; ed è questo punto di partenza che interessa il filosofo. Quando il lavoro del filosofo è stato perfettamente compiuto, i suoi risultati possono essere interamente incorporati nelle premesse da cui può procedere la deduzione.”
Russell parla qui dei principi della matematica; questi principi — come sappiamo — sono per lui principi logici. Ciò che è notevole, è che egli include, nell’ambito di quei principi del ragionamento deduttivo che è compito della filosofia scoprire e individuare, anche delle entità. Non si tratta di entità percepibili, ma di cose che non devono essere considerate esistenti nello spazio e nel tempo: non è difficile comprendere che Russell allude agli universali. Russell non aveva cambiato idea, a proposito della necessità di assumere universali come oggetti logici, nemmeno dieci anni dopo — ossia tre anni dopo i Principia. Per esempio — come avevamo accennato nel cap. 10, $ 2 —, in Theory of Knowledge (1913), Russell parla della «verità necessaria [corsivo mio] che appartiene a proposi-
zioni come “Qualcosa ha qualche relazione con qualcosa”».” Nei Principles non c’è un’argomentazione esplicita a favore dell’esistenza di universali: essa è semplicemente assunta. Neppure nei Principia si trovano argomenti a sostegno dell’esistenza di universali, ma ne troviamo uno in un’opera di Russell scritta poco dopo: The Problems of Philosophy (1912). Nel capitolo 9 di questo libro — dal titolo “Il mondo degli universali” — Russell afferma che se qualcuno volesse negare del tutto che vi siano cose come gli universali, riconosceremmo che non possiamo strettamente dimostrare che esistono cose come le qualità, ossia gli universali rappresentati da aggettivi e sostantivi, mentre possiamo dimostrare che . . . . è . è . . CO »72 ci devono essere relazioni, ossia la sorta di universali generalmente rappresentati da verbi e preposizioni.’?
L’argomentazione russelliana a favore dell’esistenza di relazioni è la seguente: Prendiamo ad esempio l’universale bianchezza. Se crediamo che vi sia un tale universale, diremo che le cose sono bianche perché possiedono la qualità della bianchezza. Questa tesi, in ogni caso, fu strenuamente negata da Berkeley e Hume, che in ciò sono stati seguiti dagli empiristi posteriori. La forma che prese la loro negazione consistette nel negare che vi siano cose come le “idee astratte”. Quando vogliamo pensare alla bianchezza, essi dicevano, formiamo un’immagine di qualche particolare cosa bianca, e ragioniamo riguardo a questa cosa particolare, badando di non dedurre nulla riguardo ad essa che non possiamo riscontrare essere ugualmente vero di qualsiasi altra cosa bianca. Come resoconto dei nostri reali processi mentali, ciò è senza dubbio in gran parte vero. In geometria, per esempio, quando vogliamo dimostrare qualcosa a proposito di tutti i triangoli, disegniamo un particolare triangolo e ragioniamo su di esso, badando di non utilizzare nessuna caratteristica che esso non condivide con gli altri triangoli. [...] Ma emerge una difficoltà appena ci chiediamo come sappiamo che una cosa è bianca o è un triangolo. Se vogliamo evitare gli universali bianchezza e triangolarità, dovremo scegliere qualche particolare macchia di bianco o qualche particolare triangolo, e dire che qualcosa è bianco o è un triangolo se ha la giusta sorta di rassomiglianza [resemblance] con il particolare che abbiamo scelto. Ma
°° Russell e il Frege dei Grundgesetze non condividono l’opinione kantiana che la logica debba essere interamente formale — cioè che non esistano oggetti logici.
70 Russell [1903a], $ 124, p. 129. 7! Russell [1913a], parte II, cap. 3, p. 134. 7? Russell [1912a], cap. 9, p. 149; corsivi di Russell.
Alcune obiezioni generali al logicismo
929
allora la rassomiglianza richiesta dovrà essere un universale. Poiché vi sono molte cose bianche, la rassomiglianza deve sussistere tra molte coppie di particolari cose bianche; e questa è la caratteristica di un universale. Sarebbe inutile dire che c’è una differente rassomiglianza per ogni coppia, perché allora dovremo dire che queste rassomiglianze rassomigliamo l’una all’altra, e così infine saremo SOSUet ad ammettere la rassomiglianza come universale. La relazione di rassomiglianza, pertanto, dev'essere un vero universale.
Fornita quella che ritiene essere una prova del fatto che deve esistere almeno un universale — la rassomiglianza
— Russell fa un passo avanti: Ed essendo stati costretti ad ammettere quest’universale, ci rendiamo conto che non vale più la pena di inventare teorie difficili e implausibili per evitare l'ammissione di universali come la bianchezza o la triangolarità.”*
Superata la diffidenza del nominalista, con l’ammettere un universale, non vi sono più remore — secondo Russell
— ad ammettere altri universali: nulla osta, in particolare, all’assunzione di qualità, oltre che di relazioni. In un articolo del 1911, “On relations of universals and particulars”, Russell sviluppa il medesimo argomento in modo un po” più analitico; in particolare, egli spiega che: [...] non è la relazione generale di somiglianza [likeness] che richiediamo [per confrontare due particolari macchie di colore bian-
che], ma una relazione più speciale, quella di colore-somiglianza [colour-likeness], poiché due macchie potrebbero essere esattamente simili in forma o grandezza ma differenti in colore. Quindi, per rendere fattibile la teoria di Berkeley e Hume, dobbiamo assumere una fondamentale relazione di colore-somiglianza, che valga tra due macchie che si direbbero comunemente avere lo stesso colore. Ora, prima facie, questa relazione di colore-somiglianza sarà essa stessa un universale o un’“idea astratta”, e così non saremo ancora riusciti a evitare gli universali. Ma possiamo applicare la stessa analisi alla colore-somiglianza. Possiamo prendere un particolare caso standard di colore-somiglianza, e dire che ogni altra cosa si deve chiamare colore-somiglianza se è esattamente simile al nostro caso standard. È ovvio, tuttavia, che tale processo conduce a un regresso senza fine: spieghiamo la somiglianza di due termini come consistente nella somiglianza che la loro somiglianza ha con la somiglianza di altri due termini, e tale regresso è chiaramente vizioso.”
La conclusione di Russell è identica a quella di Yhe Problems of Philosophy: «Almeno la somiglianza, pertanto, si deve ammettere come universale, e, avendo ammesso
un universale, non abbiamo più nessuna ragione di respin-
gere gli altri».”° Un argomento molto simile compare ancora, quasi trent'anni dopo, in An Inquiry into Meaning and Truth: Diremo, se adottiamo quest’alternativa [di negare che la similarità sia un universale]: se A e B si percepiscono simili, e anche C e D si percepiscono simili, questo significa che AB è un tutto [whole] di un certo genere [Kind]; cioè, poiché non vogliamo definire il genere per mezzo di un universale, AB e CD sono tutti simili [similar wholes; corsivo di Russell]. Non vedo come possiamo evitare un regresso senza fine del genere vizioso se tentiamo di spiegare la similarità in questo modo. Concludo, pertanto, sebbene con esitazione, che ci sono universali,
e non semplicemente parole generali.”
Nello stesso capitolo dell’/nquiry, Russell conclude un’immaginaria replica di un sostenitore degli universali a un nominalista con queste parole: []I tuoi trucchi e stratagemmi”, egli [il sostenitore degli universali] dirà, “possono sembrare eliminare gli altri universali, ma solo caricando tutto il lavoro su questo solo universale rimanente, la similarità; di esso non puoi fare a meno, e pertanto potresti anche ammettere tutto il resto.’
Ancora in My Philosophical Development (1959), Russell scrive:
73 74 7 7°
Russell Russell Russell Russell
[1912a], [1912a], [1912d], [1912d],
cap. 9, pp. 149-151. cap. 9, p. 151. pp. 111-112. p. 112.
7 Russell [1940], cap. 25, pp. 346-347. Il medesimo argomento compare nell’Inquiry in una versione epistemica: «Il significato di parole come “prima” o “colore-similarità” [colour-similarity] non può essere sempre derivato dalla comparazione, perché ciò porterebbe a un regresso senza fine. La comparazione è uno stimolo necessario all’astrazione, ma l’astrazione dev'essere possibile, almeno per quanto riguarda la similarità [simi/arity]. E se è possibile riguardo alla similarità, sembra inutile negarla altrove» (Russell [1940], cap. 2, p. 43).
78 Russell [1940], cap. 25, p. 344.
930
capitolo 14 si
‘L:
.
.
.
.
.
.
.
.
.
.
p
60]
e
2).
È possibile, attraverso vari espedienti artificiali, sostituire la parola “simile” a molte, se non a tutte, le parole-relazione. Ma “simile è ancora una parola-relazione, e non c’è nessun guadagno ovvio nell’eliminare altre parole-relazione se questa deve essere conservata. 79
Quine non accetta quest’argomento russelliano a favore dell’esistenza dell’universale somiglianza; egli sostiene, infatti, che «la conservazione del predicato a due posti “è simile a” non rappresenta un’evidenza dell’assunzione di una corrispondente entità astratta, la relazione di similarità, finché questa relazione non è invocata come valore di una variabile vincolata».*° Il disaccordo tra Russell e Quine riguarda qui una questione dibattuta ancora ai nostri giorni, cioè quali siano i modi di espressione che hanno implicazioni di esistenza. Quine accetta la teoria delle descrizioni di Russell che rende, in linea di principio, eliminabili tutti i termini singolari dal
linguaggio, di modo che non sono i termini singolari ad avere implicazioni ontologiche, ma gli enunciati con quantificatori che interpretano gli enunciati in cui compaiono termini singolari.*' Per esempio, il nome “Pegaso”, di per sé, non implica l’esistenza di nulla, potendosi interpretare, in un contesto come “Pegaso non esiste”, con ‘“-(3») (x è l’unico cavallo alato di Bellerofonte)”, oppure, in un contesto come
“Pegaso esiste”, con «964
l’unico cavallo alato di Bellerofonte)”: il nome “Pegaso” compare in entrambi gli enunciati, ma solo il secondo asserisce l’esistenza di un cavallo alato. Tuttavia, se concordano in alcuni casi, i criteri secondo cui Russell e Quine stabiliscono le implicazioni ontologiche dell’uso di una certa espressione divergono in generale: mentre per Russell un’espressione non implica l’esistenza di un referente solo se è eliminabile, per Quine nessuna espressione ha un importo esistenziale, tranne le variabili vincolate. I criteri portano a risultati identici per gli usuali nomi propri che, secondo entrambi i filosofi, si dissolvono in enunciati con quantificatori, ma divergono quando si considerino i predicati. Infatti, mentre per Russell si potrebbe essere agnostici circa l’esistenza di attributi solo se tutti i predicati potessero essere eliminati, Quine ritiene che si possa restare agnostici circa l’esistenza di attributi senza preoccuparsi minimamente dell’eliminabilità dei predicati, ma semplicemente prestando attenzione che nessuna lettera rappresentante un predicato entri in un quantificatore. Sebbene la posizione di Quine su questo punto sia controversa, ritengo che sia corretta. Supponiamo che “rosso” sia un predicato irriducibile. Questo implica forse che, dicendo che ci sono case, rose, o tramonti rossi, si asse-
risca l’esistenza dell’attributo della rossezza? Quine lo nega: Si può ammettere che vi siano case, rose e tramonti rossi, ma negare, se non in un modo di esprimersi popolare e fuorviante, che essi abbiano qualcosa in comune. Le parole “case”, “rose”, e “tramonti” sono vere di varie entità individuali che sono case rose e tramonti, e la parola “rosso” o “oggetto rosso” è vera di ciascuna delle varie entità individuali che sono case rosse, rose rosse, tramonti rossi; ma non c’è, in aggiunta, nessun’entità, individuale o no, che sia nominata dalla parola “rossezza”, né, quanto a questo, dalla 2»
parola “casità”, : 82 bile:
6
ELL)
“rossità”
Ss?
o “tramontità”. Che le case e le rose e i tramonti sono tutti rossi si può assumere come basilare e irriduci-
Ma si può davvero, considerando solo le esigenze della logica elementare, fare a meno di tutti gli universali? Supponiamo che Quine abbia correttamente individuato l’ambito della logica: è possibile definire la verità logica senza dover assumere l’esistenza di universali? Se, infine, risultasse che, per fornire questa definizione, è necessa-
rio assumere almeno un universale, l'argomento di Russell potrebbe essere replicato; si potrebbe cioè dire: “Essendo stati costretti ad assumere almeno un universale, non vale più la pena di inventare teorie intricate per evitare l’ammissione di universali come la bianchezza o la triangolarità”. Cercheremo ora di approfondire la questione. ?° Russell [1959], cap. 14, p. 172. Si deve però osservare che l’ultimo Russell è più esitante nell’ammettere l’esistenza di universali. Già nell’Inqguiry, la conclusione che ci sono universali è affermata «con esitazione» (Russell [1940], cap. 25, p. 347); una ventina di anni dopo, in My Philosophical Development, Russell è ancora più cauto: «Per parte mia, penso che sia certo quanto una cosa può essere che ci siano fatti relazionali come “A è prima di B”. Ma ne segue che ci sia un oggetto il cui nome è “prima”? È molto difficile stabilire che cosa si può intendere con questa domanda, e ancora più difficile vedere come si possa trovare una risposta. Ci sono certamente interi complessi che hanno una struttura, e non possiamo descrivere la struttura senza parole-relazione. Ma se cerchiamo di descrivere qualche entità denotata da queste parole relazione e capaci di qualche umbratile genere di sussistenza fuori dal complesso in cui è incorporata, non è affatto chiaro che possiamo avere successo» (Russell [1959], cap. 14, pp. 172-173).
50 Quine [1966b], p. 662. ' Diversamente da Quine, Russell ammette tuttavia l’esistenza di nomi logicamente propri, che non possono mancare di denotare, e che quindi implicano l’esistenza del loro referente. Come abbiamo osservato a suo tempo (v. sopra, cap. 7, $ 1 e $ 5.1), tale dottrina deriva dalla teoria russelliana dell’ acquaintance che, a sua volta, dipendeva originariamente da tre assunzioni: (1) che le proposizioni siano il riferimento degli enunciati, costituite dai riferimenti delle parole in essi contenute; (2) che il significato degli enunciati s’identifichi con il loro riferimento; (3) che le proposizioni siano l’oggetto degli atteggiamenti epistemici. Quine non accetta nessuno di questi presupposti teorici e dunque non ha nessuna necessità di assumere l’esistenza di nomi logicamente propri.
*2 Quine [1948], p. 10.
Alcune obiezioni generali al logicismo
931
1.4. Nel suo libro Philosophy of Logic," dopo aver caratterizzato, in generale, la nozione di “verità” seguendo la teoria di Tarski, Quine dedica un capitolo alla definizione della verità logica." Qui, partendo dagli schemi d’enunciati della normale logica predicativa del primo ordine senza identità,” egli elenca quattro possibili definizioni che — sulla base dell’assunzione che il linguaggio sia sufficientemente ricco in predicati per trattare l’aritmetica elementare” —
si rivelano estensionalmente equivalenti, cioè isolano lo stesso insieme di verità logi-
che: (1) in termini di struttura;
(2) (3) (4) (5)
in in in in
termini termini termini termini
di di di di
sostituzione; modelli; dimostrazione; grammatica.
Tralasciando la definizione in termini di dimostrazione, che dipende dalla completezza semantica della logica del primo ordine (dimostrata per la prima volta da Gédel), e poiché le definizioni (1), (2), (5) rappresentano varianti
di una stessa idea — quella sottoscritta da Quine — possiamo limitarci a contrapporre la definizione (2) alla definizione (3). Secondo la (2), una verità logica si definisce in due stadi a partire dalla nozione di schema logico valido.*” Uno schema logico è come un enunciato contenente solo costanti logiche, variabili (individuali) quantificate e predicati, tranne che ha lettere schematiche come “PF”, “G”, ecc., al posto dei predicati. In altri termini, uno schema logico si può considerare come costruito a partire da schemi enunciativi semplici, cioè espressioni quali “Fxy”, “Fzx”, “Gz”, facendo uso delle funzioni di verità (disgiunzione, negazione, ecc.) e dei quantificatori. La sostituzione negli schemi enunciativi — precisa Quine'* — deve, naturalmente, essere uniforme: se, per esempio, l’enunciato a-
perto: -(x galleggia A x è più denso di y) è ciò che abbiamo deciso di sostituire allo schema semplice “Fxy”, allora dobbiamo sostituire anche:
-(z galleggia A z è più denso di x) allo schema semplice “Fzx”. Uno schema logico è valido se ogni enunciato che si può ottenere da esso sostituendo enunciati aperti a schemi enunciativi semplici è vero. Infine, una verità logica, è una qualsiasi verità così ottenibile a partire da uno schema logico valido. La definizione di verità logica in termini della teoria dei modelli (3) è oggi la più familiare. Citiamo l’esposizione che ne fa Quine, perché da essa emerge molto bene il contrasto che egli intende stabilire tra teoria delle classi e logica. Possiamo intenderla meglio con l’aiuto di due nozioni preliminari. Una è la nozione di analogo insiemistico [set-theoretic analogue], come lo chiamerò, di uno schema logico. Questo è un certo enunciato aperto della teoria delle classi che formiamo dallo schema nel modo seguente. Cambiamo le predicazioni “Fx”, “Fy”?, “Gv”, ecc., in “xe
Q’, “ye Q’, “xe PB’, ecc., introducendo così
le variabili “@?, “8”, ecc., i cui valori devono essere classi. Trattiamo le lettere predicative a due posti con l’aiuto delle coppie ordi-
8° v. Quine [1970]. 84 v. Quine [1970], cap. 4. 85 Cioè l’insieme degli enunciati ottenibili a partire dagli enunciati aperti semplici (ossia esprimenti una predicazione) per mezzo di negazione, congiunzione e quantificatori, senza il segno di identità. 86 Con “aritmetica elementare”, o “teoria elementare dei numeri”, o semplicemente “aritmetica” (in una delle possibili accezioni del termine), s'intende ciò che si può asserire dei numeri naturali facendo uso — oltre che della logica del primo ordine — solo dei concetti aritmetici di zero, successore, addizione e moltiplicazione. I sistemi standard per l’aritmetica elementare includono la logica del primo ordine, gli assiomi di Peano formulati al primo ordine (quindi, con il quinto assioma che diviene uno schema d’assiomi), e assiomi che definiscono induttivamente somma e moltiplicazione.
87 Vv. Quine [1970], cap. 4, p. 50. 8 Vv. Quine [1970], cap. 4, p. 51.
933
capitolo 14 nate, cambiando così “Hxy” in “(x, y) e 7. In modo corrispondente facciamo per i predicati a tre posti o più. Lo schema logico “Ax(Fx. Gx)”, per esempio, ha l’enunciato aperto “Ax(x e @.x e 8)” come suo analogo insiemistico. Quest’ enunciato parla di insiemi e invita i quantificatori “Vd?, “A@?, “V8”, laddove le lettere schematiche “/” e “G” semplicemente simulavano dei predicati e non erano affatto variabili suscettibili di assumere dei valori. Lo schema è una sagoma [dummy], che presenta la forma di certi enunciati; il suo analogo insiemistico, d’altra parte, è uno degli effettivi enunciati di quella forma logica. E un enunciato aperto soddisfatto da certe sequenze di insiemi e non da altre."
Quine procede poi a spiegare la seconda nozione preliminare alla definizione di verità logica in termini di modelli, cioè la nozione di modello: Un modello di uno schema è una sequenza di classi; una sola classe corrispondente a ciascuna lettera predicativa schematica nello schema, e, come classe iniziale della sequenza, una classe non vuota U che gioca il ruolo di universo o campo di valori [range of values] delle variabili “x”, “y”, ecc. La classe del modello corrispondente a una lettera predicativa a un posto dello schema è una classe di membri di U; la classe corrispondente a una lettera predicativa a due posti è una classe di coppie di U; e così via. Un modello si dice soddisfare uno schema se, in breve, soddisfa l’analogo insiemistico dello schema. In modo più completo: il modello (INCL) soddisfa lo schema se, quando specifichiamo U come decorso di valori delle variabili “x”, “y”, ecc., e assegniamo le ulteriori classi del modello alle rispettive variabili di classe “@?, “#8”, ecc., l'analogo insiemistico dello schema risulta vero. Un modello (U, &, £8) soddisfa lo schema logico “4x (Fx . Gx)”, per esempio, se 3x(x e @. x € /); quindi se le due classi del modello si sovrappongono. Il modello soddisfa lo schema “-Ax (Fx . -Gx)” se la prima classe è una sottoclasse dell’altra.?®
Infine, Quine formula la definizione di verità logica in termini di modelli: uno schema è valido se è soddisfatto
da tutti i modelli; e una verità logica è — come prima — qualsiasi enunciato ottenibile per sostituzione in uno schema valido. È ovvio che la definizione di verità logica in termini di modelli presuppone una teoria degli insiemi; ma Quine argomenta che sia possibile cavarsela con una definizione in termini di sostituzione. Egli osserva che, se il linguaggio è abbastanza ricco da trattare la teoria elementare dei numeri, le definizioni di verità logica (2) e (3) sono equivalenti.” In parte ciò dipende — spiega Quine — da una parte del teorema di Lowenheim-Skolem che si può enunciare così: (A)
Se uno schema della logica elementare (senza identità) è soddisfatto da qualche modello, esso diviene vero per qualche sostituzione di enunciati della teoria elementare dei numeri ai suoi schemi semplici.”
Per contrapposizione, (A) equivale a dire che, se uno schema (della logica elementare senza identità) è falso per tutte le sostituzioni di enunciati della teoria elementare dei numeri, allora non è soddisfatto da nessun modello. Inoltre, se, invece di parlare di uno schema, parliamo della sua negazione, allora “falso”, nell’enunciato in corsivo
precedente, dev’essere mutato in “vero” e “non è soddisfatto da nessun modello” dev’essere mutato in “è soddisfatto da tutti i modelli”. (Non è invece necessario mutare “uno schema” in “la negazione di uno schema” perché, naturalmente, la negazione di uno schema è essa stessa uno schema.) Si ottiene così: (I)
Se uno schema della logica elementare (senza identità) è vero per tutte le sostituzioni di enunciati della teoria elementare dei numeri ai suoi schemi semplici, è soddisfatto da ogni modello.
La seconda parte della dimostrazione dell’equivalenza di (2) e (3), cioè:
(II)
Se uno schema è soddisfatto da ogni modello, risulta vero per tutte le sostituzioni di enunciati della teoria elementare dei numeri,
deriva immediatamente dal teorema di completezza per la logica del primo ordine, cioè:
(B)
Se uno schema è soddisfatto da ogni modello, può essere dimostrato.
*° Quine [1970], cap. 4, pp. 51-52. 20 Quine [1970], cap. 4, p. 52. °! Per quanto segue, v. Quine [1970], cap. 4, pp. 53-54. ?2 Il teorema si trova enunciato per la prima volta in Skolem [1923], punto 3, p. 293.
Alcune obiezioni generali al logicismo
933
Se si assume un metodo di dimostrazione che genera solo schemi che risultano veri per tutte le sostituzioni, da (B) s’inferisce (II). A questo punto, Quine osserva: In (1) e (II) io vedo una buona ragione per attenersi alla definizione di validità che abbiamo ottenuto per prima; cioè, verità per sostituzioni di enunciati agli schemi costituenti semplici. Questo significa attenersi alla definizione di verità logica ottenuta a quel punto. [...] I teoremi (1) e (II) ci garantiscono che questa definizione di verità logica si accorda con la definizione alternativa in
termini di modelli, purché il linguaggio oggetto non sia troppo debole per il modesto idioma della teoria elementare dei numeri.?®
Il vantaggio nell’adottare questa definizione — per Quine — è filosofico, e consiste in un risparmio ontologico, cioè in un risparmio riguardo alle entità di cui si deve ammettere l’esistenza: L’evidente vantaggio filosofico di attenersi a questa definizione sostituzionale, e di non introdurre la teoria dei modelli, è che risparmiamo in ontologia. Gli enunciati sono sufficienti, persino gli enunciati del linguaggio oggetto, invece di un universo di classi specificabili e non specificabili. In imprese diverse dalla definizione di verità logica continuano, in realtà, ad esservi ragioni per accettare alcuni degli eccessi ontologici della teoria delle classi. È nella teoria delle classi che si escogita una fondazione generale sistematica della matematica. Certe parti della matematica, tuttavia, richiedono risorse meno liberali nella teoria delle classi di altre parti, ed è una buona strategia tenere conto delle differenze. In questo modo, quando sorgono occasioni di rivedere le nostre teorie, siamo nella posizione di favorire le teorie le cui pretese sono più moderate. Così, ogni volta che troviamo un modo di tagliare i costi ontologici di qualche particolare sviluppo, abbiamo fatto un passo in avanti. Questo è ugualmente vero al di fuori della matematica, ed è vero in particolare per la definizione di verità logica.”
A parte le necessità della matematica, si deve osservare che dal novero delle verità logiche, come definite qui da Quine —
cioè in termini di sostituzione —, risultano escluse le verità che derivano, al primo ordine, dalla teo-
ria dell’identità, come “x = x”, o “x= y= y= x”. Quine, come abbiamo già accennato sopra, propende tuttavia per includere la teoria dell’identità nella logica — e dunque le verità che derivano dalla logica del primo ordine e dalla teoria dell’identità tra le verità logiche: le sue motivazioni sono essenzialmente la completezza della logica del primo ordine con identità, la definibilità del predicato di identità in ogni linguaggio del primo ordine che comprenda solo un numero finito di predicati,” e l’universalità del predicato di identità (cioè la sua applicabilità a qualsiasi oggetto). Tralasciamo però questo per concentrarci su un punto: considerando come verità logiche solo le verità esprimibili nella logica del primo ordine senza identità, si è davvero riusciti, con la definizione di verità logica proposta da Quine, a fare completamente a meno degli universali? Tocchiamo qui il nocciolo della questione che ci siamo posti al termine del paragrafo precedente. La risposta di Quine è interessante: Sarebbe inaccurato, tuttavia, dire che ritirandoci nelle definizioni sostituzionali di validità e verità logica abbiamo reso le nozioni di validità e di verità logica del tutto indipendenti dalle classi. Parlando di enunciati e sostituzioni si potrebbe ancora sostenere che stiamo parlando di classi; infatti, che cos’è un enunciato se non la classe delle sue occorrenze [tokens]? La situazione è anche peggiore; le classi di occorrenze non basteranno. Un enunciato che fosse destinato a non essere mai scritto 0 pronunciato sarebbe, come classe di occorrenze, la classe vuota. Due qualsiasi enunciati del genere si considererebbero identici. Così gli enunciati non esisterebbero, in qualunque senso utile, eccetto che non vengano infine scritti o pronunciati. D'altra parte chiunque abbia familiarità con il modo in cui è dimostrato il teorema (A) sa che non può esistere una tale limitazione per gli enunciati della cui sostituzione si parla in (A). In questi termini (A) cesserebbe di essere vero, e così pure (I), e in questo modo la stessa giustificazione della nostra ritirata nelle definizioni sostituzionali di validità e verità logica sarebbe buttata a mare. (A) dipende piuttosto da una teoria classica, infinita delle stringhe finite di segni. Ogni volta che x e y sono stringhe differenti, x seguita da z dev’essere considerata come una stringa differente da y seguita da z anche se mai scritta 0 pronunciata. Un modo di soddisfare questo requisito è prendere una stringa di segni non come una classe di occorrenze [tokens] ma come una sequenza, in senso matematico, dei suoi segni [...]. I singoli segni o fonemi componenti la stringa possono ancora essere considerati come gli insiemi delle loro occorrenze, poiché possiamo garantire l’esistenza di tali occorrenze. Così costruite, le stringhe di se-
5 Quine [1970], cap. 4, pp. 54-55. % Quine [1970], cap. 4, p. 55. Se, per esempio, il linguaggio comprendesse solo il predicato monadico “A”, i predicati diadici “B” e “C”, e il predicato triadico “D”, “x= y” potrebbe essere definito come un’abbreviazione di: Ax= Ay A (2)(Bzx= Bzy A Bxz= Byz A Czx= Czy n Cxz= Cyz A (w)(Dzwx= Dzwy A Dzxw = Dzyw n Dxzw= Dyzw)). (v. Quine [1970], cap. 5, p. 63).
9% Vv. Quine [1970], cap. 5, pp. 61-64.
934
capitolo 14 gni sono garantite nella disponibilità illimitata richiesta da (A). Ma invocando sequenze finite senza limite di lunghezza abbiamo
ulteriormente fatto appello alla teoria delle classi.”
Che le parole siano universali, e non particolari, è una tesi che fu sostenuta da Russell. Ne troviamo per la pri-
ma volta un accenno in The Analysis of Mind (1921): Consideriamo che sorta d’oggetto sia una parola quando sia considerata semplicemente come una cosa fisica, separata dal suo significato. Per cominciare, ci sono molti esempi di una parola, ossia tutte le differenti occasioni in cui è usata. Così una parola non è " ; î 100 È 98 qualcosa di unico e particolare, ma un insieme di occorrenze.
In An Inquiry into Meaning and Truth (1940), Russell spiega il punto in maggiore dettaglio: La parola “cane” è un universale, proprio come è un universale cane. Noi diciamo, imprecisamente, che possiamo pronunciare la stessa parola “cane” in due occasioni, ma in effetti pronunciamo due esempi della stessa specie, proprio come quando vediamo due cani vediamo due esempi della stessa specie. Non c’è quindi differenza di stato logico tra cane e la parola “cane”: ciascuno di essi è generale, ed esiste solo nelle sue istanze. La parola “cane” è una certa classe di emissioni verbali, proprio come cane è una certa classe di quadrupedi.”°
Nell’articolo “The problem of universals” (1946), Russell scrive: [...] il nominalismo autentico soffre dell’aver trascurato il fatto che una parola non è una singola entità, ma una classe. Ci sono molti gatti, ma ci sono anche molti esempi [instances] della parola “gatto”. Se non c’è un universale come la felinità, ne segue, per gli stessi argomenti, che non c’è una cosa come la parola “gatto”, ma solo esempi della parola, detta o udita, scritta o letta. La rela-
zione di una parola con il suo significato è quella di un insieme di particolari con un altro insieme di particolari: vedendo davanti a voi un esempio della specie gatto, pronunciate un esempio della specie “gatto” (la parola). Quindi c’è esattamente la stessa generalità riguardo alla parola come riguardo a ciò che essa significa. Ciò rende impossibile supporre che ci siano universali nel linguaggio, ma non nelle cose. Se la specie gatto è una finzione logica, allora lo è la parola “gatto”.!°
Nel saggio “The cult of ‘common usage”’” (1953), Russell ribadisce: Prendiamo la parola “gatto”, e per definitezza prendiamo la parola scritta. Chiaramente ci sono molti esempi [instances] della parola, nessuno dei quali è la parola. Se io dico “Discutiamo della parola “gatto’”, la parola “gatto” non compare in ciò che dico [cioò,
non compare nell’enunciato], ma solo un esempio della parola. La parola stessa non è parte del mondo sensibile; se è qualcosa, è un’entità eterna soprasensibile in un cielo platonico. La parola, possiamo dire, è una classe di forme simili, e, come tutte le classi, è una finzione logica.'®
La conclusione di Russell, poco più avanti, è che non possiamo definire una parola (una successione di segni) senza fare appello a una teoria delle classi. Infine, in My Philosophical Development (1959), Russell scrive: La parola parlata è una classe di rumori simili e la parola scritta è una classe di forme simili. Se si negano gli universali così vigorosamente come li negano alcuni nominalisti, non c’è una cosa come la parola “gatto”, ma solo esempi della parola.'°
Quine accetta dunque alcuni degli argomenti di Russell a favore dell’assunzione di qualche universale, ma respinge la conclusione russelliana che, una volta che si sia ammessa l’esistenza di un universale, non possono più esservi remore nominalistiche nel riconoscere l’esistenza di altre entità dello stesso genere. Il Quine maturo resta convinto dell’utilità di porre un confine tra una richiesta minimale di universali e una teoria delle classi, che riconosce l’esistenza di una quantità di universali ben maggiore: Il modo in cui questa ritirata [alla definizione sostituzionale di verità logica] va vista, dunque, è questo: essa rende le nozioni di validità e verità logica indipendente da tutta la teoria delle classi, tranne una piccola parte; indipendente dai voli più alti.!°*
2? Quine [1970], cap. 4, pp. 55-56. 9 Russell [1921a], lecture X, p. 188. 99 Russell [1940], cap. 1, p. 24. V. anche, ibid., cap. 3, p. 58.
100 Russell [1946a], p. 273. !0! Russell [1953], p. 306 (Russell [1956b], p. 170-171). !02 Russell [1959], cap. 14, p. 172.
‘65 Quine [1970], cap. 4, p. 56.
Alcune obiezioni generali al logicismo
935
Si potrebbe obiettare che qualora non sia possibile cavarsela, in logica, con un’ontologia totalmente nominali-
sta, sembra non esservi una solida base per negare agli universali lo statuto di oggetti logici. In fondo, non era molto diverso da questo l’argomento a favore dell’assunzione di universali che il primo Quine avanzava in Mathematical Logic (v. sopra, alla fine del $ 1.1). Naturalmente, la motivazione del Quine maturo è essenzialmente metodologica. Essa è legata alla sua concezione dello sviluppo della conoscenza scientifica e, in particolare alla sua “massima della mutilazione minima” — cioè l’idea che, quando un certo corpo di conoscenze è messo in crisi, si deve cominciare cercando di rivedere ciò che è meno centrale nella rete delle nostre conoscenze, salvaguardando ciò che è più centrale. Quine ora sostiene che [I]Ja maggior parte dei nostri ragionamenti logici ha luogo a un livello che non presuppone entità astratte. [...] Molto di ciò che si formula comunemente in termini di classi, relazioni, e perfino numeri, si può facilmente riformulare schematicamente nella teoria
della quantificazione più forse la teoria dell’identità. [...] Quindi, considero un difetto in una formulazione generale della teoria del riferimento se essa ci rappresenta come se ci riferissimo a entità astratte fin dal principio piuttosto che solo dove c’è uno scopo reale in tale riferimento.'°*
La logica elementare si rivela libera da paradossi, che sorgono invece soltanto in una logica di ordine superiore o nella teoria delle classi. Se sorgono dei problemi nella teoria delle classi è opportuno — secondo Quine —, almeno in prima istanza, cercare di rivedere questa teoria, invece di mettere in crisi la logica, nell’accezione ristret-
ta.195
Ma si potrebbe anche accettare quest’argomentazione di Quine senza trarne la conclusione che la teoria delle classi sia al di fuori del campo della logica: si potrebbe sostenere che questa appartiene alla logica, sebbene sia una parte della logica sulla quale non abbiamo ancora le idee chiare. Come abbiamo visto (alla fine del $ 1.1), questa era in effetti la posizione che lo stesso Quine sosteneva nei “Supplementary remarks”, del 1953, al suo articolo del 1937 “New foundations for mathematical logic”.
2. IL PRIMO TEOREMA
D’INCOMPLETEZZA
DI GODEL
Per delineare il contesto storico in cui apparvero le dimostrazioni originali del primo e del secondo teorema d’incompletezza di Gòdel è necessario dire qualcosa su quello che oggi è noto come programma di Hilbert. Negli anni Venti del Novecento, David Hilbert avanzò un proprio programma fondazionale per la matematica.'° Come 104 Quine [1953b], $ 3, p. 116. 107 Quine [1969a], $ 37, p. 267. Un’osservazione che va nella stessa direzione si trova già in von Neumann [1925], cap. 1, $ 1, p. 395.
196 Gi sono tracce di questo programma fondazionale già in un discorso che Hilbert tenne il 12 agosto 1904 al Terzo Congresso Internazionale dei Matematici, Heidelberg, 8-13 agosto 1904 (v. Hilbert [1905]) ma, come mostrato in Sieg [1999], il percorso attraverso il quale Hilbert giunse alla propria concezione definitiva fu piuttosto tortuoso. Certamente influenzato dalle ricerche sui Principia Mathematica del suo studente Heinrich Behmann, nel 1917 Hilbert espresse convinzioni logiciste, condivise il principio russelliano del circolo vizioso e considerò la teoria ramificata dei tipi con assioma di riducibilità una soddisfacente fondazione della matematica (v. G. H. Moore [1997],
pp. 78-79, e Sieg [1999], pp. 11-17). Dopo la pubblicazione dei Principia, Hilbert si era interessato al sistema fondazionale proposta do Russell e Whitehead. In una lettera a Lady Ottoline Morrell del 18 gennaio 1914, Russell scrive: «Littlewood [John Edensor Littlewood,
matematico di Cambridge] è andato in vacanza a Gòttingen, la principale università matematica del mondo. [...] Littlewood mi dice che Hilbert (là il principale professore di matematica) è interessato al lavoro di Whitehead e mio, e che pensano di chiedermi di tenere là un seminario il prossimo anno. Spero che lo facciano» (in Russell [1992b], p. 487; v. anche in Sieg [1999], p. 37). Dell’invito di Russell a Gòttingen non si fece poi nulla, a causa dello scoppio della prima guerra mondiale, ma nel dicembre del 1914 Behmann vi aveva tenuto un seminario simpatetico sui Principia (v. Mancosu [2003], pp. 63-65). Tornato nel 1916 dal fronte, dove era stato gravemente ferito, Behmann si pose a lavorare alla dissertazione di dottorato, sotto la supervisione di Hilbert, che fu presentata nel giugno del 1918. Come nel suo seminario, nella dissertazione — Die Antinomie der transfiniten Zahl und ihre Auflòsung durch die Theorie von Russell und Whitehead (non pubblicata) — Behmann difende la soluzione dei paradossi logici e la fondazione della matematica dei Principia, offrendo un’interpretazione della teoria ramificata dei tipi molto simile a quella che, secondo la nostra analisi (v. sopra, cap. 11), era intesa dallo stesso Russell — cioè con i predicati, le classi e le proposizioni interpretati nominalisticamente (v. Mancosu [1999], pp. 311-313, e Mancosu [2003], pp. 76-84). Nella trascrizione delle lezioni di Hilbert del semestre invernale 1917-18 (ora in Hilbert [2013], cap. 1, pp. 59-221), la teoria dei tipi (1a parte riguardante la teoria dei tipi è probabilmente opera di Paul Bernays, che all’epoca era appena divenuto assistente di Hilbert a Gottingen (v. Zach [1999], pp. 344-348)) è interpretata in modo simile (v. Sieg [1999], pp. 17-19). In seguito, però, Hilbert divenne sempre più critico nei confronti della prospettiva russelliana, a causa dell’assioma di riducibilità, che nel 1920 Hilbert pervenne a ritenere coerente con una prospettiva assiomatica, ma in contrasto con il tentativo di basare l’intera matematica sulla logica (v. G. H. Moore [1997], p. 79; Mancosu, Zach e Badesa [2009], $ 6.2, p. 390). Alla fine del 1920 Hilbert abbandonò il logicismo (ma continuò a servirsi di
936
capitolo 14
gli intuizionisti,"’” Hilbert negava l’esistenza di un infinito attuale, ravvisando l’origine dei paradossi nell’uso indiscriminato del concetto di infinito, ma, diversamente dagli intuizionisti, non era disposto a rinunciare alle parti della matematica in cui si fa uso di tale concetto, come l’analisi o la matematica cantoriana — è divenuta celebre
la sua frase: «Dal paradiso che Cantor ha creato per noi, nessuno deve poterci mai cacciare».'* Hilbert pensò allora a una soluzione formalistica: il suo programma era di ridurre ciascuna branca della matematica (geometria, aritmetica, analisi, teoria degli insiemi) a un sistema formale, del quale si sarebbero dovute dimostrare la coerenza e la completezza, in ultima analisi," con metodi “finitisti” — cioè senza far uso di apparati teorici che richiedano l’uso del concetto di infinito. In questo modo, Hilbert pensava di poter identificare l’esistenza di entità matematiche con la coerenza dei sistemi formali approntati per descriverle, e la verità matematica con la dimostrabilità all’interno di tali sistemi.!! Con sistema formale s'intende, in generale, un algoritmo finito!!! per produrre meccanicamente — vale a dire in modo puramente sintattico, senza riguardo al significato dei simboli — una classe di enunciati detti teoremi. Un sistema formale deve avere un linguaggio ben definito (cioè un insieme finito di simboli semplici e di regole di formazione per ottenere, da essi, tutti i simboli complessi del sistema), e una classe di assiomi, i quali saranno,
in quanto tali, anche teoremi; esso avrà anche delle regole sintattiche ben definite (regole di inferenza) che si potranno applicare ai teoremi per ottenere nuovi teoremi. In altri termini, possiamo dire che un sistema formale è un sistema di assiomi e di regole, in linea di principio codificabile in un programma per un computer, che fornisca come output la lista di tutte e solo le formule del sistema derivabili dagli assiomi applicando le regole — i teoremi. Un sistema formale si dice coerente, o consistente, se in esso non è possibile ottenere come teoremi tutti gli
enunciati esprimibili nel sistema; si dice sintatticamente completo (0 completo nel senso di Post) se ogni enunciato A del sistema è dimostrabile o refutabile (cosicché, aggiungendo agli assiomi un qualsiasi enunciato non dimostrabile nel sistema originario, si ottiene un sistema incoerente, nel quale, quindi, ogni enunciato del sistema è di-
mostrabile), altrimenti è sintatticamente incompleto; si dice semanticamente completo se tutti gli enunciati veri in una logica basata su una teoria ramificata dei tipi) e, dalle sue lezioni del semestre invernale 1921-22 (ora in Hilbert [2013], cap. 3, pp. 431527), tornò a volgersi al metodo assiomatico, proponendo quello che oggi è noto come “programma di Hilbert”. C’è però, come ha indicato Paolo Mancosu ([1999], p. 319), «un elemento di continuità tra la concezione di Russell (e di Behmann) e il pensiero fondazionale maturo di Hilbert», cioè l'assunzione «di una classe di individui concreti dati prima del pensiero astratto», sui quali l’intero pensiero astratto deve in ultima analisi fondarsi. Hilbert aggiunge tuttavia un elemento cruciale a questa concezione; nelle parole di Mancosu: «Hilbert pone grande enfasi sulla controllabilità degli oggetti e in generale sulle operazioni combinatorie (finitistiche) che dobbiamo essere capaci di condurre su di essi. Questo requisito, che è il vero nocciolo del finitismo di Hilbert, è assente nel resoconto degli individui di Behmann» (Mancosu [1999], p. 319). Per il modo in cui Hilbert concepiva gli individui in parola, v. sotto, nota 110. 107 Mj riferisco qui in particolare alla scuola di Brouwer. Nel cap. 8, $$ 4.2.2-4.2.3, abbiamo visto che anche Poincaré vedeva la radice dei
paradossi nell’ammissione dell’esistenza di un infinito attuale.
108 Hilbert [1925], p. 170 (in van Heijenoort (ed.) [1967], p. 376; in Hilbert [1985], p. 242). 199 La coerenza di alcuni sistemi può essere dimostrata rispetto ad altri, ma naturalmente la coerenza di questi altri deve essere dimostrata in modo diretto, pena un regresso all’infinito. Per esempio, Hilbert aveva dimostrato la coerenza della geometria rispetto all’analisi, attraverso la sua interpretazione analitica (v. Hilbert [1899], $ 9); ma la coerenza dell’analisi stessa deve, secondo Hilbert, essere dimostrata per via
diretta (v. Hilbert [1900b], $ 2, pp. 264-265 (in Hilbert [1932-35], vol. 3, p. 210; in Hilbert [1985], p. 156). !!° È qui opportuno sottolineare che il formalismo di Hilbert si differenzia in modo importante dal formalismo classico ottocentesco. Hilbert non considera tuta la matematica come derivante da assiomi arbitrari e priva di contenuto. Egli ammette che vi sia una parte privilegiata della teoria elementare dei numeri — quella finitaria — i cui enunciati e le cui dimostrazioni sono provviste di contenuto: si tratta, per Hilbert, di quella parte dell’aritmetica che ha a che fare con individui concreti la cui esistenza e le cui proprietà combinatorie sono controllabili (v. Hilbert [1925], pp. 170-172 (in van Heijenoort (ed.) [1967], pp. 376-377; in Hilbert [1985], p. 243-244), e Hilbert [1928], pp. 65-
66 (in van Heijenoort (ed.) [1967], pp. 464-465; in Hilbert [1985], pp. 267-268)). Hilbert identifica questi individui con ‘‘numerali”, cioè (1002) con rappresentazioni segniche di 1 come “|” (0, se si vuole “-”, o simili), 2 come “|[? (0 “-”), 3 come “III? (0 “--’’), ecc., che rendono controllabile, per es., che 2 + 3 = 3 + 2, perché si può verificare che la concatenazione di “|? con “||? dà lo stesso risultato, “|||”, della concatenazione di “|”? con “|)°. AI di là di questa aritmetica, ci sono le costruzioni matematiche che richiedono concetti (quantificazione su domini infiniti, insiemi infiniti, funzioni numeriche) e modi di ragionamento (terzo escluso, definizioni impredicative) che implicano l’assunzione di totalità infinite attuali. Per esempio, secondo Hilbert, l’asserzione “Per ogni n e ogni m, n+ m= m+ n”, non ha senso dal punto di vista
finitistico, perché equivale a “Non esistono un n e un m tali che
1+ m= m + n”, un’asserzione che si può verificare solo passando in rasse-
gna una totalità infinita di numeri; da un punto di vista finitistico, “n + m = m + n’ può essere interpretato solo come uno schema che diviene un’asserzione solo quando si sostituiscono numerali specifici a “n° e “m” (v. Hilbert [1925], p. 173 (in van Heijenoort (ed.) [1967], p. 378; in Hilbert [1985], p. 246)). E solo l’estensione infinitaria della matematica che, secondo Hilbert, è puramente formale, e dev'essere giustificata dimostrando, con i metodi sicuri dell’aritmetica fornita di contenuto, che non è contraddittoria, e quindi non induce contraddi-
zioni nell’aritmetica fornita di contenuto (v. Hilbert [1925], p. 179 (in van Heijenoort (ed.) [1967], p. 383; in Hilbert [1985], p. 253)).
!!! Un algoritmo finito (spesso si omette la qualificazione “finito”, considerandola implicita in “algoritmo”) è una procedura, in linea di principio implementabile sotto forma di programma per computer, che permette di ottenere certi risultati compiendo un numero finito di operazioni. Ne sono esempi i comuni procedimenti per il calcolo di un’addizione, di una moltiplicazione, o del massimo comune divisore di diversi numeri.
Alcune obiezioni generali al logicismo
937
tutte le interpretazioni possibili del sistema (cioè, tutte le sue formule valide) sono anche teoremi del sistema, altrimenti è semanticamente incompleto.!!* L’idea di Hilbert era di considerare i sistemi formali per le varie branche della logica e della matematica come
oggetti sintattici di cui indagare metateoricamente le proprietà: in particolare, completezza e consistenza. Il vantaggio di quest'idea, dal punto di vista di Hilbert, era che nei sistemi formali si ha a che fare solo con dimostrazioni costituite di un numero finito di formule, costituite, a loro volta, da un numero finito di simboli, cosicché per
indagarne completezza e consistenza non si deve supporre l’esistenza di un infinito attuale. Alla fine degli anni Venti si erano accumulati risultati che sembravano confermare la prossima realizzabilità del programma di Hilbert. Dal 1918 si possedevano dimostrazioni di coerenza e di completezza sintattica e semantica dei sistemi formali per la logica proposizionale'!* e, nelle lezioni di Hilbert del semestre invernale 1917-18, era dimostrata la coerenza dei sistemi formali per la logica del primo ordine. I sistemi formali per la logica del primo ordine sono sintatticamente incompleti,'!* ma il problema, posto per la prima volta da Hilbert nel 1928, se sia possibile dimostrarne almeno la completezza semantica"! fu risolto in positivo, nel 1929, dal ventitreenne Kurt G6del (teorema di completezza di Gòdel).!!° Il teorema di completezza di Gòdel implica che in ogni sistema formale coerente del primo ordine (inglobante la logica del primo ordine) i teoremi coincidono con le conseguenze logiche degli assiomi. Su queste basi, se si fosse dimostrato che qualche sistema formale coerente del primo ordine, inglobante un sistema di assiomi adeguato per l’intera aritmetica elementare, sia tale da essere sintatticamente completo nella sua parte aritmetica — cioè, tale che, per ogni enunciato aritmetico esprimibile nel linguaggio del sistema, sia sempre possibile dimostrare nel sistema stesso quest’enunciato o il suo contraddittorio —, non vi sarebbero stati ostacoli nell’identificare la verità aritmetica con la dimostrabilità; se, inoltre, si fossero potute dimostrare la coerenza e la
completezza sintattica del sistema ricorrendo solo alle risorse dell’aritmetica finitista, anche gli intuizionisti avrebbero dovuto riconoscerne la validità, e il programma di Hilbert per l’aritmetica si sarebbe realizzato. Supponiamo di avere un sistema formale per l’aritmetica elementare il cui linguaggio sia in grado di enunciare le verità e le falsità riguardo ai numeri naturali esprimibili usando solo i seguenti segni: numerali arabi, parentesi
!!2 La distinzione tra le due forme di completezza oggi dette “sintattica” e “semantica” risale alla dissertazione di abilitazione di Paul Bernays all’ Università di Gòttingen, del 1918 (v. Bernays [1918]), di cui alcuni anni dopo fu pubblicata una versione ridotta (v. Bernays
[1926]). (Nell’autunno del 1917, Bernays, che si era laureato nel 1912 a Gòttingen, ma aveva insegnato per i cinque anni seguenti all’ Università di Zurigo, aveva accettato la proposta di Hilbert di divenire suo assistente all’ Università di G6ttingen. Bernays rimase a Gòttingen, dove continuò a collaborare con Hilbert, fino al 1933, quando, a causa delle leggi antiebraiche naziste, perse la cattedra e poi, nono-
stante il tentativo di aiuto da parte di Hilbert, fu costretto a riparare in Svizzera.) La distinzione tra completezza sintattica e semantica è presente in Hilbert e Ackermann [1928] (cap. 3, $ 9, pp. 66-68): mentre in precedenza con “completezza” (Vollstindigkeit) Hilbert intendeva senz'altro “completezza sintattica”, ora distingue due sensi di “completezza”, e parla di «completezza in senso più stretto (schérferen)» (p. 68) per riferirsi alla completezza sintattica. 113 V. Post [1921], Bernays [1918] e [1926], e Hilbert e Ackermann [1928], cap. 1, $ 12, pp. 29-31, e $ 13, p. 33. Coerenza e completezza
sintattica e semantica della logica proposizionale sono dimostrate nella stesura fatta da Bernays delle lezioni di Hilbert del semestre invernale 1917-18, ma sembrano dovute ad aggiunte fatte da Bernays (v. Zach [1999], pp. 344-348). In Bernays [1918] e in Bernays [1926], si
distingue per la prima volta esplicitamente tra completezza sintattica e completezza semantica, dimostrando: (1) che ogni formula dimostrabile della logica proposizionale è valida (mostrando che gli assiomi sono validi e le regole di deduzione preservano la validità), cosa da cui — come osserva Bernays — consegue la coerenza della logica proposizionale; (2) che la logica proposizionale è sintatticamente completa (con il metodo di Hilbert) e che da ciò, insieme con la coerenza, consegue la sua completezza semantica. In Hilbert e Ackermann [1928] — che riprende in buona parte le lezioni di Hilbert del semestre invernale 1917-18 (ora in Hilbert [2013], cap. 1, pp. 59-221) e del
semestre invernale 1920 (ora in Hilbert [2013], cap. 2, pp. 298-341) — coerenza e completezza sintattica e semantica della logica proposizionale sono dimostrate seguendo il metodo usato nella tesi di abilitazione di Bernays. Gli analoghi risultati di Post [1921] — la dissertazione di dottorato alla Columbia University di Emil Leon Post, completata nel 1920 — sono indipendenti da quelli della scuola di Hilbert. !!4 Come già suggerito nelle lezioni di Hilbert del semestre invernale 1917-18 — e dimostrato in Hilbert e Ackermann [1928], cap. 3, $ 9, pp. 66-68 (la dimostrazione vi è attribuita ad Ackermann: v. p. 68, nota 1) — la logica del primo ordine è sintatticamente incompleta. Questo perché esistono in essa delle formule che non sono né vere in tutte le interpretazioni, né false in tutte le interpretazioni — per esempio, un enunciato come “(4x)Fx > (x) Fx”, dove F sta per una proprietà qualsiasi, che è vero nei domini costituiti da un solo individuo, ma è falso nei domini costituiti da più individui —, e queste formule non sono dimostrabili. La logica del primo ordine è invece completa nel senso (semantico) che tutte le formule esprimibili in essa che sono vere in tutte le interpretazioni, cioè valide, sono anche dimostrabili.
1!5 In Hilbert e Ackermann [1928], dopo aver dimostrato che la logica del primo ordine è (sintatticamente) incompleta, gli autori scrivono: «Se il sistema di assiomi sia completo almeno ne senso che tutte le formule logiche che sono corrette in ogni dominio di individui possano essere realmente derivate è ancora una questione irrisolta» (Hilbert e Ackermann [1928], cap. 3, $ 9, p. 68). Lo stesso problema è posto nel-
la versione emendata del discorso di Hilbert all’Ottavo Congresso Internazionale dei Matematici, Bologna, 3-10 settembre 1928, pubblicata nel 1929 sui Mathematische Annalen (v. Hilbert [1929], Problem IV, p. 8 (in Hilbert [1985], p. 299)).
!!© La dimostrazione fu offerta nella dissertazione di dottorato di Gòdel all’Università di Vienna, completata nell’estate del 1929. Gòdel conseguì il dottorato il 6 febbraio 1930 e nello stesso anno pubblicò una versione rielaborata della sua dissertazione come Gòdel [1930].
938
capitolo 14
(destra e sinistra), negazione, congiunzione, uguaglianza, addizione e moltiplicazione. Un sistema del genere può essere sintatticamente completo. Il sistema conterrà infatti solo enunciati aritmetici privi di variabili come, per esempio, ‘(2 + 2) x 3 = 12”, oppure “2+3= 5 A -(3 x 6 = 19)” che, per quanto complessi siano, potranno sempre essere decisi, cioè rubricati come veri o falsi, sulla base di un procedimento finito di calcolo meccanico. Se, tuttavia, si vuole avere un sistema formale adeguato per l’aritmetica elementare, cioè un sistema formale in cui siano derivabili tutti gli attuali teoremi dell’aritmetica elementare — ossia i teoremi che possono essere espressi facendo uso, oltre che dei simboli della logica elementare, dei segni di addizione e moltiplicazione — sarà necessario aggiungere al linguaggio del sistema precedente anche dei quantificatori e delle variabili che varino su numeri naturali, insieme con assiomi e regole che ne governino l’uso. Solo così sarà possibile, per esempio, esprimere relazioni come < tra numeri naturali,"!” assiomi come “Numeri uguali hanno lo stesso successore”, 0 verità aritmetiche come “Esiste un numero che moltiplicato per 2 dà 6”. Sorprendentemente, nel 1930 Gédel dimostrò un teorema che implica che qualunque sistema del genere, se coerente, è sintatticamente incompleto nella sua parte aritmetica (primo teorema d’incompletezza di Gòdel).!!* Basta cioè aggiungere, a un sistema formale per l’aritmetica elementare, la possibilità di usare variabili quantificate (universalmente ed esistenzialmente) che vari-
no su numeri naturali — e quindi la logica del primo ordine —, per ottenere un sistema in cui deve esistere almeno un enunciato aritmetico tale che né l’enunciato stesso, né il suo contraddittorio sono dimostrabili all’interno del sistema stesso; inoltre, supponendo che il sistema formale sia coerente, si dimostra che quest’enunciato aritmetico è aritmeticamente vero. Da questo risultato, Gòdel trasse un corollario, il secondo teorema d’incompletezza di Gòdel, affermante che la coerenza di un sistema formale coerente adeguato per l’aritmetica
non può essere dimostrata nel sistema stesso — e quindi non si può usare una parte (finitista) dell’aritmetica, per dimostrare la coerenza dell’intera aritmetica.!!° '?° Si può comprendere come i teoremi di Gòdel mettessero in crisi il programma hilbertiano — di fatto, essi ne mostrarono l’irrealizzabilità, nella forma originaria. A noi interessa qui però vagliare la consistenza di un’altra tesi, che si trova spesso in letteratura," secondo la quale il primo teorema d’incompletezza costituirebbe una definitiva refutazione del logicismo. Gli scritti russelliani non sono qui di molto aiuto. L'articolo di Gòdel in cui si dimostravano per la prima volta i teoremi d’incompletezza fu pubblicato sei anni dopo la seconda edizione dei Principia Mathematica e ben ventun anni dopo il completamento della prima edizione. All’epoca, Russell non si occupava più da tempo di logica e fondamenti della matematica. Alcune menzioni nei suoi scritti testimoniano che egli lesse l'articolo di Gédel,'?° ma non sono sufficienti a ricostruire con certezza la sua interpretazione di tale risultato — né a decidere se egli lo avesse davvero compreso. '°
!!7 Si può definire “ G1. Allora, per il teorema di completezza, il condizionale PA
> G! do-
vrebbe essere anche dimostrabile nella logica del primo ordine ma, se così fosse, G sarebbe poi dimostrabile in $S,
a partire da "PA! > G’, per modus ponens, contraddicendo il primo teorema d’incompletezza di Gédel. x
5
Der
2
E
5
Sei
:
Questo mostra che G non può essere sempre vera in S' (cioè vera in tutte le interpretazioni di S'). Sebbene G sia + DE 5 x È > LC 1 26 vera — come abbiamo osservato — nell’interpretazione aritmetica intesa di S' (ossia interpretando S' nel dominio dei numeri naturali) devono dunque esserci anche interpretazioni di S !. diverse da quella intesa, nelle quali G è D
na
5
SEE
È
5
È
"
x
1
x
5
falsa, e quindi è falso il condizionale "PA! > G1. Questo si esprime dicendo che il sistema S° non è categorico,
ossia non caratterizza univocamente insiemi isomorfi (rispetto alle operazioni aritmetiche) a quello dei numeri naturali,! ma ammette modelli che sono detti non intesi,
o non standard, i quali hanno domini che non sono iso-
morfi all’insieme dei numeri naturali (il dominio del modello standard). Non può esistere un sistema formale del primo ordine che caratterizzi univocamente (a meno di isomorfismi) i numeri naturali: ogni sistema di questo genere ammetterà anche modelli non intesi.‘ Riprenderemo questo discorso tra poco. Prima, consideriamo un importante rafforzamento del primo teorema d’incompletezza di Gòdel dovuto a J. Barkley Rosser. Il primo teorema d’incompletezza di GGdel si può enunciare così: Se un sistema formale per l’aritmetica è @-coerente, allora è sintatticamente incompleto. Facendo uso di un enunciato indecidibile un po’ diverso da quello di G6del, nel 1936 Rosser mostrò che la condizione della @-coerenza può essere sostituita dalla condizione, più debole, della semplice coerenza, ottenendo così la seguente enunciazione del teorema d’incompletezza:
; i IRA sro 144 Se un sistema formale per l’aritmetica è coerente, allora è sintatticamente incompleto. !4l Si osservi che, se il sistema è incoerente, allora G è dimostrabile (perché in un sistema incoerente sono banalmente dimostrabili tutti gli enunciati); ma poiché G, interpretata nel metalinguaggio, asserisce che G non è dimostrabile, G è falsa se il sistema non è coerente. Dunque G è equivalente a qualsiasi enunciato di S ! che asserisca la coerenza di S'. 14 Ricordiamo che due insiemi sono isomorfi, rispetto a una certa classe di relazioni, se tra i loro elementi esiste una relazione uno-uno che a ogni relazione della classe specificata che vale tra elementi dell’uno fa corrispondere una relazione che vale tra elementi dell’altro. 143 L'esistenza di modelli non standard per i sistemi formali del primo ordine per l’aritmetica si può dunque inferire, come abbiamo appena fatto, dai teoremi di completezza e d’incompletezza di Gòdel, ma questo non deve indurre a pensare che dipenda dall’incompletezza di tali sistemi. I modelli non standard sussistono anche per teorie aritmetiche del primo ordine complete (e quindi non assiomatizzabili) come
quella ottenibile prendendo come assiomi tutte e solo le verità dell’aritmetica. L'esistenza di modelli non standard dipende dal fatto che il quinto assioma di Peano non può essere formulato come tale in una logica del primo ordine — perché richiede una quantificazione su proprietà (o su classi) — e dev'essere quindi surrogato da uno schema d’assiomi il quale, però, lascia aperta la possibilità che non esista una formula ben formata che sia vera per tutti e solo i numeri naturali. 144 V. Rosser [1936], e Rosser [1939a], p. 59. La dimostrazione del teorema di Rosser è analoga a quella originaria di Gòdel. Vediamone i punti fondamentali. Si consideri la relazione triadica Dim”, esprimibile nel metalinguaggio del sistema formale S! (lo stesso che abbiamo usato per spiegare la dimostrazione di Gòdel), tale che “Dim (x, y, 2)” sia vero se e solo se y è il numero di Gòdel di una formula di $ ! con una sola variabile libera, e x è il numero di Gòdel di una dimostrazione in S' della negazione della formula che risulta dalla formula che ha numero di Gòdel y quando il numerale per il numero z è stato sostituito alla sua variabile libera. Poiché sappiamo che la relazione Dim (definita sopra, nel testo) è ricorsiva, è chiaro che sarà ricorsiva anche Dim ; pertanto essa è rappresentabile nel sistema $ . sia Dim” (x, y, 2) la formula che la rappresenta. Si consideri ora la formula di S*:
946
capitolo 14
È oggi usuale formulare l’enunciato del primo teorema d’incompletezza di Gòdel nella forma rafforzata da
Rosser. Soffermiamoci un po’ sul significato di quest’estensione. Si osservi, innanzi tutto, che i sistemi formali validi per l’aritmetica — cioè che non dimostrano enunciati aritmeticamente falsi — devono essere tutti non solo
coerenti, ma anche @-coerenti. Vediamo perché. Se aggiungiamo al nostro sistema formale S' (che supponiamo coerente) invece che l’enunciato G, l’enunciato '-G!, otteniamo un sistema
Si @-incoerente, ma —
come ab-
biamo visto — non incoerente, perché, se S' è coerente, in esso non si può dimostrare G. Per il teorema di comMe ; 145 pletezza di Gòdel, S i deve avere un modello (ogni sistema coerente del primo ordine deve avere un modello).
R' "(x)(Dim(x, z, 2) > (Ay)y Ay)y Ay)y G' sarebbe valido nella logica del primo ordine e dunque, per il teorema di completezza, sarebbe dimostrabile in essa, cosicché (per il teorema di deduzione) in S' sarebbe dimostrabile G, rendendo S' incoerente. 146 Si ha dunque che i sistemi formali per l’aritmetica, al primo ordine, non sono né categorici (perché, per un’estensione del teorema di Lòwenheim-Skolem,
essi hanno modelli sia numerabili, sia infiniti non numerabili, quindi non correlabili biunivocamente,
e quindi non
isomorfi), né Xy-categorici (si dice che un sistema è Ny-categorico se tutti i suoi modelli numerabili sono isomorfi). Per quanto segue in questo capoverso del testo, si veda Hatcher [1968], $ 37, pp. 327-331, e Hatcher [1982], $ 6.4, pp. 207-211.
147 Abbiamo appena dedotto l’esistenza di modelli non standard di S° dal teorema di Gòdel, ma si può dedurla anche dal teorema di compattezza (valido solo per i sistemi del primo ordine) — come fece per primo Leon Henkin nella sua tesi di dottorato del 1947 (v. Henkin [1950], p. 90). Attraverso il teorema di compattezza, si può mostrare anche che i modelli non standard di S' contengono elementi supplementari che sono sempre elementi infiniti. Infatti, dato l'insieme infinito di enunciati, esprimibili in $ 1.
0