236 104 20MB
Italian Pages 384 [385] Year 2021
Quality Paperbacks • 611
I lettori che desiderano informazioni sui volumi pubblicati dalla casa editrice possono rivolgersi direttamente a: Carocci editore Corso Vittorio Emanuele ii, 229 00186 Roma telefono 06 42 81 84 17 fax 06 42 74 79 31
Siamo su: www.carocci.it www.facebook.com/caroccieditore www.twitter.com/caroccieditore
Carlo Cosmelli
Fisica per filosofi Percorsi storico-filosofici di Paolo Pecere
Carocci editore
Quality Paperbacks
1a edizione, marzo 2021 © copyright 2021 by Carocci editore S.p.A., Roma Realizzazione editoriale: Omnibook, Bari Impaginazione: Luca Paternoster, Urbino Finito di stampare nel marzo 2021 da Lineagrafica, Città di Castello (PG)
isbn 978-88-430-0000-0 Riproduzione vietata ai sensi di legge (art. 171 della legge 22 aprile 1941, n. 633) Senza regolare autorizzazione, è vietato riprodurre questo volume anche parzialmente e con qualsiasi mezzo, compresa la fotocopia, anche per uso interno o didattico.
Indice
Prefazione 11
Elenco delle grandezze e dei simboli
15
Introduzione 19 I principi della fisica di Carlo Cosmelli
19
Sui Percorsi storico-filosofici 23 di Paolo Pecere 1.
Fisica: linguaggio, termini e definizioni
27
1.1. Il gioco delle parti: di cosa parleremo, come e perché
27
1.2. Linguaggio e ipotesi di base
33
1.3. Nota. Grandezze fisiche
42
1.4. Nota formale. Variazioni, derivate, somme
44
Percorso storico-filosofico 1. Fisica, meccanica, filosofia sperimentale 47
2.
Meccanica classica
53
2.1. La meccanica classica: introduzione
54
2.2. Il primo principio della dinamica: il principio di inerzia
55
8
fisica per filosofi Percorso storico-filosofico 2. Spazio, movimento naturale e inerzia
63
2.3. Il secondo principio della dinamica
67
2.4. Il terzo principio della dinamica
72
2.5. Relatività e invarianza galileiane
74
2.6. Principi, leggi, leggi fenomenologiche
77
2.7. Massa inerziale e massa gravitazionale: il principio di equivalenza 81 2.8. L’energia. 1
83
2.9. Compendio di meccanica classica
90
Percorso storico-filosofico 3. Meccanicismo e forza di gravità 92
3. Termodinamica 97 3.1. Introduzione: qual è il problema e quale la sua soluzione
97
3.2. I principi della termodinamica in breve
102
3.3. Definizioni di alcune delle grandezze utilizzate in termodinamica 103 3.4. Il primo principio della termodinamica
113
3.5. L’energia. 2
116
3.6. Il secondo principio della termodinamica
116
3.7. L’entropia
122
3.8. Entropia e probabilità
127
3.9. Il diavoletto di Maxwell
138
3.10. Entropia e informazione: un accenno
139
3.11. Il terzo principio della termodinamica: teorema di Nernst 145 3.12. Il principio zero della termodinamica
Percorso storico-filosofico 4. Unità della natura e conservazione dell’energia
146 147
indice
9
4. Elettromagnetismo
153
4.1. Introduzione 4.2. Una nuova proprietà: la carica elettrica 4.3. Il concetto di campo 4.4. Le equazioni di Maxwell 4.5. Il concetto di unificazione delle interazioni 4.6. Onde Percorso storico-filosofico 5. Moto assoluto, spazio assoluto ed etere
154 154 161 167 173 174
5.
189
Teoria della relatività speciale
183
5.1. 5.2. 5.3. 5.4. 5.5. 5.6.
Il punto della situazione in fisica agli inizi del Novecento 189 La teoria della relatività speciale 196 Il risultato matematico: le trasformazioni di Lorentz 200 Conseguenze delle trasformazioni di Lorentz 204 Lo spazio-tempo 213 La velocità della luce nel vuoto: è veramente la massima possibile, ma non raggiungibile, per un corpo di massa diversa da zero? 224 2 5.7. E = mc 226 5.8. Nota conclusiva sulla relatività speciale 229 Percorso storico-filosofico 6. Tempo assoluto, tempo relativo, tempo soggettivo 233 6.
Teoria della relatività generale
6.1. Introduzione 6.2. Struttura dell’articolo originale di Einstein del 1916 6.3. La gravità e altri problemi della meccanica classica 6.4. I due principi della relatività generale e il principio di Mach 6.5. Un nuovo concetto: lo spazio-tempo curvo è reale 6.6. Conseguenze delle equazioni del campo di Einstein
237 237 238 241 245 246 250
10
fisica per filosofi
6.7. L’ultima previsione verificata: le onde gravitazionali Percorso storico-filosofico 7. Spazio e geometria
253 254
7.
259
Meccanica quantistica
7.1. Introduzione 260 7.2. I principi della meccanica quantistica 272 7.3. Un esperimento famoso: le due fenditure 288 7.4. Come si utilizza la funzione d’onda; il gatto di Schrödinger e il tunneling quantistico 302 7.5. L’articolo di Einstein, Podolsky e Rosen: la meccanica quantistica è incompleta 313 7.6. Le disuguaglianze di Bell 325 7.7. La vita di un sistema quantistico interlacciato 333 7.8. La non località oggi. Crittografia quantistica 336 7.9. Il teorema di Noether 337 Percorso storico-filosofico 8. Determinismo, caso, libero arbitrio: la discussione sulla fisica quantistica 339 Percorso storico-filosofico 9. Atomi, particelle e onde: com’è fatta la materia 343 8. Oggi 349 8.1. Compendio 8.2. I mattoni: il modello standard e la relatività generale 8.3. Che cosa è la massa? 8.4. Cosmologia. Il principio cosmologico 8.5. Alcune delle domande a cui vorremmo rispondere
349 349 354 356 359
Note 361 Bibliografia 371
Indice analitico
377
Prefazione
Il seme di questo libro fu lanciato la sera del 12 luglio 2007. In quel periodo la Sapienza era aperta anche in serata per concerti, incontri e manifestazioni varie. Io avevo organizzato dei caffè scientifici in cui due persone di estrazione culturale differente, tipicamente un fisico e un filosofo, discutevano su un tema a loro scelta. E il pubblico poteva intervenire. Io (fisico) scelsi di discutere insieme a Emidio Spinelli (filosofo) su questioni riguardanti l’etica e il libero arbitrio. Spinelli parlando di Hans Jonas e del principio di responsabilità, io di alcune caratteristiche della termodinamica e del determinismo. Serata bella e interessante, con tanti studenti che ascoltavano e facevano domande. Ma c’era un problema: molti dei presenti erano studenti di Filosofia, preparati, intelligenti e dotati di un linguaggio appropriato, eppure da alcune domande e commenti si capiva che la maggior parte di loro non aveva la benché minima idea di cosa fosse la termodinamica, i suoi principi, le basi concettuali su cui si fondava. Questo mi preoccupava considerando anche che molti di loro avrebbero scelto l’indirizzo di Filosofia della scienza, bellissimo corso con docenti eccellenti. Ma come affrontarlo partendo da zero, senza avere alcuna nozione di fisica classica, relatività o meccanica quantistica? Perché era chiaro che, se avevano un problema con la termodinamica, a maggior ragione avrebbero avuto difficoltà con la cosiddetta “fisica moderna” (relatività e meccanica quantistica). Tornato a casa cominciai a pensare alla questione. In fondo era naturale, cosa ci si poteva aspettare da una società in cui frasi come “Ah, io la matematica (la fisica) non l’ho mai capita” venivano accettate anche da persone di cultura? E con una scuola in cui l’insegnamento delle materie scientifiche troppo spesso era limitato a nozioni, formule, studiate su volumi di centinaia e centinaia di pagine, con programmi sconfinati e un numero limitato di ore a disposizione?
12
fisica per filosofi
Questa situazione non mi piaceva. E, non essendo io il ministro della Pubblica istruzione e dell’Università (allora si chiamava così), decisi che l’unica cosa che si poteva fare era di provare a intervenire sugli studenti di Filosofia della Sapienza. Come? Ma era ovvio, provando a dare loro le nozioni di cui erano sprovvisti facendo un corso di Fisica per filosofi. Su tutta la fisica? Studiando su quali testi? Con quale formalismo? L’idea fu di fare un corso limitato ai principi della fisica, le affermazioni fondamentali che stanno alla base di tutta la costruzione scientifica. Con un minimo di formalismo matematico (fortunatamente i principi si leggono, non vanno dimostrati). Decisi di andare a trovare il presidente del corso di laurea in Filosofia, Carlo Cellucci, di cui nel 1979 avevo seguito, per puro piacere, le lezioni su Caso e necessità di Jacques Monod. A questo punto potete immaginare quale fu la sua reazione: fu d’accordo e credo di dovere a lui se poi l’istituzione del nuovo corso (di Fisica, tenuto da un fisico a Filosofia!) fu accettata dal Consiglio di corso di laurea in Filosofia. Nell’anno accademico 2008-09 si partì, all’inizio con una ventina di studenti, che scesero subito a una decina dopo aver capito che non si trattava di lezioni di Filosofia della scienza, ma che si parlava proprio di fisica. Il corso, tuttavia, cominciò a piacere e negli ultimi anni siamo arrivati a un numero variabile fra gli 80 e i 120 studenti l’anno (gli ordinamenti cambiano annualmente, sono i misteri della Sapienza). Ma c’era sempre il problema dell’assenza di testi. Venivano in aiuto agli studenti le dispense che avevo scritto e i video del corso di Relatività e Meccanica quantistica che proposi nel 2014 per la piattaforma on line Coursera, con 12 000 studenti di tutto il mondo. Da quell’esperienza in rete imparai che, benché l’insegnamento fosse condotto in italiano con sottotitoli in inglese (la piattaforma Coursera ha sede in California), solo il 60% degli studenti era di lingua italiana, gli altri erano stranieri. E scoprii anche (dalle centinaia di e-mail a cui risposi per dubbi, consigli e commenti) che a seguire erano studenti universitari, persone comuni, studenti singoli, docenti italiani di Matematica e Fisica, alcuni insieme a intere classi. Insomma, la cosa interessava e piaceva. Quindi, cominciai ad accarezzare l’idea di farne un libro da rendere disponibile a molte più persone di quelle che seguivano le lezioni. Questo che avete in mano non è altro che il volume scritto a partire dalle note del corso. Ma non solo. Una volta iniziato a mettere insieme il materiale mi resi conto che in fondo era diretto in primis agli studenti di
prefazione
13
Filosofia e che, dunque, non sarebbe stato male inserire alcune parti filosofiche che, per alcuni degli argomenti più importanti, raccontasse cosa dicevano in quel momento i filosofi. Qui entrò in gioco Paolo Pecere che si dichiarò entusiasta della proposta e che ha scritto tutte le sezioni filosofiche di questo lavoro. A questo punto in genere nelle prefazioni si scrive qualcosa del tipo “Ringrazio tutti coloro hanno letto e riletto le bozze del libro, ogni errore è dovuto solo all’autore e sarò grato a chi mi vorrà segnalare eventuali sviste, imprecisioni, omissioni” e così via. In questo caso la situazione è diversa. A parte il naturale ringraziamento dovuto a tutti coloro che hanno accettato di leggere il manoscritto segnalando errori e/o modifiche; primi fra tutti Paolo Pecere, che ha letto con attenzione e sufficiente distacco quanto avevo scritto, e Gianluca Mori di Carocci, che mi ha guidato nella stesura dal punto di vista del lettore. Il testo avrà sicuramente errori o imprecisioni, e questo credo sia scontato per una prima edizione; inoltre, ogni volta che lo rileggo vorrei cambiare qualcosa, vorrei riscrivere completamente alcuni paragrafi che mi sembrano oscuri o poco chiari, e spesso l’ho fatto. Ma prima o poi il lavoro definitivo va consegnato, quindi alla fine si decide di chiudere e quello che avete fra le mani ne è il risultato. Mi auguro che questo libro possa essere letto da molte persone di estrazione differente, che mi vengano fatte osservazioni, commenti e segnalazioni, di cui tener conto nelle future edizioni per migliorarlo. Roma, 31 gennaio 2021
Elenco delle grandezze e dei simboli
A destra sono indicate le grandezze a cui corrispondono i simboli scritti a sinistra. Alcuni simboli hanno più corrispondenze e significati diversi a seconda del contesto in cui vengono usati. Viene anche indicato il rimando alla pagina in cui la grandezza viene nominata/ definita per la prima volta o con significati diversi a seconda delle varie sezioni: meccanica classica, termodinamica, relatività speciale, relatività generale, meccanica quantistica, cosmologia. Simbolo Nome, pagina a Accelerazione, cfr. p. 46 B Campo magnetico (induzione magnetica), cfr. p. 164 c Velocità della luce nel vuoto, cfr. p. 170 (elettromagnetismo); p. 198 (relatività speciale) cdm Cold Dark Matter (“materia oscura fredda”), cfr. p. 359 ds Distanza spazio-temporale (Minkowski, spazio-tempo), cfr. p. 216 E Campo elettrico, cfr. pp. 153, 163 E Energia, cfr. p. 83 (meccanica classica); pp. 109, 116 (termodinamica); p. 226 (relatività speciale) epr Einstein, Podolsky, Rosen (esperimento mentale), cfr. p. 313 F Forza, cfr. pp. 28, 56 (meccanica classica) f Frequenza di un’onda, di un fenomeno periodico, cfr. p. 176 fem Forza elettromotrice, cfr. p. 195 g Accelerazione di gravità, p. 80 g Gluone, cfr. p. 355 g Fattore g, rapporto (momento magnetico/momento angolare), cfr. p. 354 G Costante di gravitazione universale, cfr. pp. 53, 78 h, ħ Planck, costante; ħ = h/2π, cfr. p. 264 i Corrente elettrica, cfr. p. 164 I Informazione, quantità di, cfr. p. 140 I Intensità della luce, cfr. p. 291 J Densità di corrente elettrica, cfr. p. 170 k Numero d’onda, k = 2π/λ, p. 176 k, k0 Costante nella legge di Coulomb, nei materiali, pp. 153, 155; nel vuoto, cfr. p. 365 kB Boltzmann, costante di, cfr. p. 106
16
fisica per filosofi
L Lavoro, cfr. pp. 85, 112 L Momento angolare, p. 268 L0 Lunghezza a riposo, cfr. p. 208 m, mi, mG Massa, massa inerziale, massa gravitazionale, cfr. pp. 67, 81, 242 n Indice di rifrazione di un mezzo, cfr. p. 173 O; x, y, z, t Origine; coordinate spaziali e temporali di un sistema di riferimento, cfr. p. 40 p Pressione, cfr. p. 107 p Quantità di moto, cfr. p. 69 P(E) Probabilità associata ad un evento E, cfr. p. 129 Q Quantità di calore scambiata, cfr. p. 111 Q, q Carica elettrica, cfr. p. 154 qft Quantum Field Theory (“teoria quantistica dei campi”), cfr. p. 353 R Costante universale dei gas, cfr. p. 108 R Distanza fra due corpi, raggio, cfr. p. 58 R Resistenza elettrica, cfr. p. 195 rs Schwarzschild, raggio, cfr. p. 251 S Entropia, cfr. pp. 122, 124 s Spazio, cfr. pp. 27, 37 (meccanica classica); pp. 204-13 (relatività speciale); p. 239 (relatività generale) S Superficie, cfr. p. 107 T Periodo di un’onda, cfr. p. 175 T Temperatura, cfr. p. 104 t Tempo, cfr. pp. 27, 37 (meccanica classica); pp. 201, 209 (relatività speciale); pp. 246, 250 (relatività generale) U Energia interna, cfr. p. 110 u Unità di misura, cfr. p. 42 utc Coordinated Universal Time (tempo universale), cfr. p. 254 V Volume, cfr. p. 107 V, v Velocità, cfr. p. 55 (meccanica classica); p. 205 (relatività speciale) W(A) Molteplicità della configurazione A, cfr. p. 130 γ Fattore relativistico, cfr. p. 202 ε0 Costante dielettrica del vuoto, cfr. pp. 171, 365 εr Costante dielettrica relativa, cfr. p. 365 η Rendimento (di un ciclo termodinamico), cfr. p. 119 Λ Costante cosmologica, cfr. p. 359 μ0 Permeabilità magnetica del vuoto, cfr. p. 164 μr Permeabilità magnetica relativa, cfr. p. 366 τ0 Durata a riposo (di un evento), cfr. p. 209 φ Fase (di un’onda), cfr. p. 177 Φ(B) Flusso del campo B, cfr. p. 195 ψ, ψ(r, t) Funzione d’onda, cfr. p. 274 ω Pulsazione di un’onda, cfr. p. 176 ρ Densità, densità di massa (per unità di volume), cfr. p. 25 ρ Resistività elettrica, cfr. p. 168 ρc Densità di carica elettrica (per unità di volume), cfr. p. 170
elenco delle grandezze e dei simboli
17
Simboli matematici E±n Equivale a: 10±n ≝ Definizione (a destra) del simbolo che sta a sinistra dell’uguale dg(x)/dx Derivata della grandezza g rispetto alla grandezza x, cfr. p. 46 ∂f/∂x Derivata parziale della grandezza f (x) rispetto alla grandezza x Δ Variazione di una grandezza, cfr. p. 44; incertezza di una misura, cfr. p. 35 (generale); p. 285 (meccanica quantistica) ln Logaritmo naturale, cfr. p. 128 log2 Logaritmo in base 2, cfr. p. 141 ∑ Somma di tanti termini, cfr. p. 47 ≅, ≃ Circa uguale a ≠ Diverso da ⊕ Somma non aritmetica, cfr. p. 207 ∝ Proporzionale a ~, ≈ Approssimativamente uguale a · Prodotto, prodotto scalare (fra vettori), cfr. pp. 160-1 × Prodotto vettoriale (fra vettori), cfr. pp. 160-1 A ≡ B A coincide con B, cfr. p. 43 Valore medio della grandezza g, cfr. p. 45 b
∫a f (t)dt ∮ f (x)dx –
Integrale della funzione f (t) calcolato fra t = a e t = b
Integrale di linea della funzione f (x) lungo una linea chiusa
∇ · A– Divergenza del vettore A– – ∇ × A– Rotore del vettore A–
Introduzione I principi della fisica
La fisica non è semplice, è inutile fingere che non sia così: la descrizione delle teorie, specie per quel che riguarda la fisica del xx secolo, utilizza spesso formalismi molto complessi. E anche avendo compreso il formalismo matematico, spesso è complicato capirne il significato. Eppure, conoscere la migliore descrizione che oggi possiamo avere del mondo che ci circonda è affascinante, è qualcosa di cui non potremmo fare a meno. In questo libro ci siamo proposti di presentare i principi e alcune delle leggi fondamentali della fisica che rappresentano una selezione abbastanza ristretta di tutta la fisica, per cui non basterebbero centinaia e centinaia di pagine e che richiederebbe l’utilizzo di formalismi avanzati. Abbiamo scelto di parlare quasi esclusivamente dei principi della fisica per due ragioni. La prima è dovuta al fatto che un principio, nell’ambito delle scienze sperimentali, non è nient’altro che un’affermazione su un aspetto molto generale della natura. Ci ritorneremo, ma una buona definizione del termine “principio” è questa: Un principio è una proposizione assunta come vera, non ricavata da altre proposizioni.
Sembra complicato, ma in realtà vuole solo dire che non stiamo parlando di un teorema. Un teorema deve essere dimostrato – in base a delle premesse – ed è logicamente vero. Un principio è l’espressione formale – quindi scritta in linguaggio scientifico – di un’osservazione riportata a regola universale. Se lo negassimo non avremmo nulla di contraddittorio dal punto di vista della logica. Un principio sta a capo di una teoria e non è ricavato da altre proposizioni (come nel caso di un teorema). Potrebbe dunque essere diverso? Certo, un principio
20
fisica per filosofi
sarà vero fin quando non si dimostrerà, con l’esperienza, che è falso o che la teoria derivata dal principio porta a delle osservazioni contraddittorie. E allora verrà sostituito da un altro principio o cancellato definitivamente. Facciamo un esempio. Nel mondo classico Aristotele affermava l’esistenza di una relazione di proporzionalità fra la velocità di un corpo e la forza a cui era sottoposto. Era sensata? Sì, poteva benissimo essere vera, solo che era sbagliata: misure e considerazioni accurate avrebbero mostrato che non era così. Ma ci sono voluti circa diciannove secoli per arrivare a una formulazione corretta del fenomeno. Nel 1687 Isaac Newton disse: la relazione di proporzionalità è fra l’accelerazione di un corpo e la forza impressa, e la proporzionalità è attraverso la massa. È il secondo principio della dinamica, espresso dalla formula che (quasi) tutti hanno trovato sui libri di scuola: F=m∙a È vera? Per l’epoca di Newton sì. Veniva confermata dai dati sperimentali, era un’ottima inferenza di una legge generale da alcuni dati sperimentali. Ma supponiamo che avessimo deciso che la relazione dovesse essere: —
F = √m ∙ a In essa abbiamo sempre una relazione di proporzionalità fra forza e accelerazione, solo che è attraverso la radice quadrata della massa. Ma non c’è nulla di logicamente sbagliato, potrebbe anche essere vera. In questo — caso la relazione F = √m ∙ a sarebbe stata altrettanto logicamente giustificata e accettabile della F = m ∙ a; e servono degli esperimenti e delle misure per mostrare che non è corretta. Ma anche la relazione F = m ∙ a si dimostrerà non corretta, nel senso di non avere validità universale. Albert Einstein nel 1905 con la sua relatività speciale mostrerà come andrà scritta, modificandola. E nel 1927 Erwin Schrödinger la sostituirà addirittura con un’altra formula, nell’ambito della meccanica quantistica. Questa nuova formula non solo sarà differente formalmente, ma avrà anche un significato del tutto diverso. La cosa essenziale è che i principi sono, quasi sempre, molto semplici. Non essendo dei teoremi non necessitano di dimostrazioni, possiamo parlarne senza riempire pagine e pagine di calcoli complessi, ciò che importa è capire il significato nascosto dentro le formule.
introduzione
21
La seconda ragione per cui abbiamo deciso di discutere i principi della fisica è che essi rappresentano veramente i fondamenti della nostra conoscenza; non sono tanti, ma ciascuno ha significati molto profondi che ci aiutano nel farci un’immagine complessiva della teoria fisica a cui si riferiscono. Di approcci possibili per trattare questa materia ce ne sono vari: da quello storico a quello che punta sugli sviluppi tecnologici, o sulle interpretazioni fisiche e/o filosofiche delle varie parti della fisica, a quello esclusivamente sperimentale. Abbiamo scelto quello che dal nostro punto di vista è il più semplice e anche il più sensato per un lettore con differenti provenienze e necessità: dagli studenti di facoltà non scientifiche (sebbene potrebbe forse essere utile anche a uno studente più esperto), a insegnanti e allievi delle scuole superiori che sovente hanno a che fare con libri di centinaia di pagine in cui si riporta quasi tutto lo scibile umano (tanto vasti da rendere spesso difficile una visione generale della disciplina), a lettori semplicemente amanti della scienza che non possiedono il bagaglio matematico necessario per leggere i testi fondamentali ma cercano qualcosa di diverso rispetto agli innumerevoli e ottimi volumi divulgativi che non hanno alcuna parte formale. L’approccio è quello utilizzato nel corso di Principi di fisica per filosofia tenuto alla Sapienza ed è essenzialmente uno sviluppo cronologico, che è sembrato il più semplice da trattare. L’ordine cronologico con cui sono state trattate le varie parti della fisica ha il vantaggio di introdurre termini, proprietà e concetti un poco per volta. Ogni capitolo utilizzerà quelli precedenti e ne introdurrà di nuovi. Talvolta anche negando o modificando idee e nozioni già espresse, ma mantenendo sempre come riferimento la costruzione di un sistema, per quanto possibile, coerente, completo, non contraddittorio, aderente alla realtà sperimentale. La scelta di seguire lo sviluppo cronologico non implica il parlare, per esempio, della termodinamica come se ne parlava nel xix secolo. Quando ce ne occuperemo introdurremo anche concetti sviluppati nel xx secolo (come la teoria dell’informazione). L’esposizione delle teorie fisiche, dopo un capitolo introduttivo su linguaggio, terminologia e definizioni della fisica, sarà divisa in sette capitoli; all’inizio di ogni capitolo troverete un riquadro in cui sono riassunti i principi e le leggi fondamentali relativi al capitolo: 1. la meccanica, dove si tratterà di corpi materiali (pochi per volta), forze e movimenti e dove verrà esposta la relatività galileiana;
22
fisica per filosofi
2. la termodinamica, dove si vedrà come insiemi di numerosi corpi materiali si comportano secondo nuove leggi che spiegano i fenomeni termici; tratteremo della direzione del tempo e introdurremo l’informazione come grandezza termodinamica; 3. l’elettromagnetismo, dove si vedrà la necessità di introdurre una nuova grandezza, la carica elettrica; tratteremo di alcune leggi a essa collegate, di come alcune siano in contrasto con la relatività galileiana, e di come la luce non sia altro che la manifestazione di una carica elettrica che si muove variando la sua velocità; 4. la relatività speciale, dove l’analisi dettagliata di alcune incongruenze teoriche e sperimentali nell’elettrodinamica porteranno a una rivoluzione nei concetti di spazio e di tempo; 5. la relatività generale, dove l’analisi di un semplice esperimento mentale condotto in un ascensore porterà a modificare di nuovo i concetti di spazio e di tempo, di relatività e all’abbandono della legge di gravitazione universale di Newton, spesso utile, ma solo approssimativamente vera; 6. la meccanica quantistica, dove si scoprirà che alcuni esperimenti fatti su sistemi microscopici non possono essere spiegati da alcuna delle teorie precedenti e che, quindi, va creata una teoria nuova; si vedrà come questa teoria sia controintuitiva, ontologicamente spiazzante, disperatamente limitativa della nostra possibilità di conoscere il mondo esterno, ma maledettamente giusta e precisa in tutte le sue previsioni; 7. oggi, dove, per concludere con la massima brevità, si mostreranno alcuni grafici e tabelle relativi a quello che sappiamo attualmente del mondo microscopico e della nascita e dell’evoluzione del nostro universo su scala intergalattica. Concluderemo con alcuni dubbi e problemi che ancora adesso si incontrano per una descrizione coerente del nostro universo. Tra questi capitoli si trovano i Percorsi storico-filosofici, scritti da Paolo Pecere, dedicati ai grandi scienziati, alle idee e alle discussioni che di volta in volta hanno fatto da sfondo alla formazione delle teorie fisiche. A questo punto va detto tutto quello di cui non si parlerà. Non parleremo dei liquidi, dei fluidi reali e di tutti quei fenomeni che venivano chiamati semplicemente “caotici”, ma che negli anni Settanta del secolo scorso vennero formalizzati da Edward Lorenz dando origine alle moderne teorie del caos. Si tratta di teorie che si applicano alla fisica di alcuni sistemi complessi, al moto delle nuvole, alle capriole di fuoco delle fiamme in un camino, agli attacchi epilettici, all’anoressia e alla bulimia, al battito del cuore in chi sta per avere un infarto, al comparto della finanza – forse –, a molti aspetti del mondo che c’è oltre la coper-
introduzione
23
tina di questo libro. Come non parleremo della fisica della materia e di come oggi si possano progettare materiali con le caratteristiche fisicochimiche volute. E non parleremo degli incredibili sviluppi che ha avuto la cosmologia nell’ultimo secolo. Sviluppi che hanno portato da un lato a chiarire una serie di dubbi che si avevano sull’origine e sull’evoluzione del nostro universo, ma che ci pongono anche nuove domande su misure parzialmente oscure o incomprensibili. Concluderemo accennando ad alcuni aspetti ancora problematici nella descrizione che abbiamo appena fatto del mondo che ci circonda. Perché il fatto è che abbiamo una costruzione molto funzionale e complessa, il cosiddetto “modello standard”, ma questo è ancora pieno di dettagli da chiarire, investigare e misurare. E anche la cosmologia ha alcuni dettagli di investigare. Dettagli? Sì, ma nel corso dei secoli sono stati sempre alcuni dettagli a far nascere le nuove teorie e a portare avanti la conoscenza. Quindi, non possiamo dire che tutto funziona e tutto va bene. Abbiamo dei problemi ma al momento non potrebbe andare meglio. Buon divertimento. carlo cosmelli
Sui Percorsi storico-filosofici Storicamente la fisica è nata come parte della filosofia dedicata all’indagine sulle cause dei fenomeni naturali. La rivoluzione scientifica del xvii secolo fu al tempo stesso una rivoluzione filosofica: Galileo Galilei si intestava il titolo di filosofo, poiché pretendeva di stabilire una verità alternativa a quella della fisica aristotelica e dell’astronomia tolemaica, e ancora Newton dedicava il suo capolavoro, fin dal titolo, ai Principi matematici della filosofia naturale (1687). La separazione tra fisica e filosofia naturale è successiva, ed è dipesa dalla specializzazione della parte matematica e sperimentale della fisica e dalla conseguente separazione dei percorsi di studio, ma l’unità d’intenti è rimasta: fisica e filosofia sono entrambe forme di ricerca della conoscenza, fondate su argomenti logici ed esperienze. La riflessione sui concetti fondamentali della fisica chiama in causa inevitabilmente nozioni e argomenti della tradizione filosofica, a partire dallo stesso uso di termini carichi di teoria e di storia, come “natura”, “fenomeno”, “materia”, “atomo”, “oggetto”, “principio”, “assioma”, “dimostrazione”, “spiegazione”. Per dare conto di questa dimensione storica e filosofica della fisica, abbiamo scelto di inserire, in margine alla trattazione delle teorie fisiche,
24
fisica per filosofi
diverse sezioni dedicate ai grandi scienziati, alle idee e alle discussioni che di volta in volta hanno fatto da sfondo alla formazione delle teorie fisiche. In queste sezioni si approfondisce il nesso storico e teorico tra fisica e filosofia, che nell’insegnamento scientifico è solitamente trascurato, analizzando di volta in volta concetti e problemi che hanno accompagnato lo sviluppo delle teorie fisiche, mostrandone il più ampio contesto e le relazioni con alcune indagini filosofiche tradizionali: l’idea di filosofia sperimentale e meccanicismo, i concetti di spazio e tempo e materia, di movimento relativo e assoluto, di gravità ed energia, il problema del determinismo. Inserire questi percorsi in un’esposizione dei principi della fisica è un modo di rispondere a un’esigenza più volte affermata dopo la nascita della fisica classica. Alla fine del Settecento, un filosofo come Immanuel Kant dedicò un’intera opera a mostrare il nesso necessario tra la sua filosofia, di cui aveva gettato le basi nella Critica della ragion pura (1781), e la fisica di Newton. Il titolo dell’opera kantiana – Principi metafisici della scienza della natura (1786) – ricalcava volutamente quello dei Principi matematici della filosofia naturale newtoniani. Kant (2003, pp. 107, 123), infatti, sosteneva che i fisici non possono non far uso («sebbene inconsapevolmente») di principi filosofici per stabilire le proprie teorie e definire i propri oggetti: i soli dati empirici non bastano a fare una teoria, questa presuppone sempre delle premesse che sono poste a priori. Quando trascurano questa componente filosofica i fisici si limitano a «postulare» i principi, e in certi casi possono male intendere il significato e le implicazioni delle proprie stesse teorie matematiche, su cui d’altra parte sono la massima autorità. Kant, quindi, auspicava che una «mano più abile», tra i «fisici matematici», prendesse spunto dalla sua opera per integrare i trattati matematici con una parte filosofica. Le cose andarono diversamente. Mentre i contenuti tecnici della fisica crescevano in quantità e complessità, la filosofia scomparve sempre di più dai trattati di fisica su cui si formarono generazioni di scienziati, tra Ottocento e Novecento. Eppure molti grandi fisici teorici, come Albert Einstein, Erwin Schrödinger, Werner Heisenberg e Niels Bohr hanno sottolineato il bisogno di collegare le teorie fisiche con la filosofia. Einstein (1949, pp. 673-4, trad. mia) diede esplicitamente ragione a Kant, parlando della sua «grande scoperta» del valore costitutivo dei concetti per la definizione dell’oggettività: soltanto mediante la «totalità dei concetti e delle relazioni concettuali che sono pensate indipendentemente dall’esperienza» – scriveva Einstein – noi «pensiamo
introduzione
25
fisicamente» e ci rappresentiamo un’oggettività. Procedere altrimenti sarebbe come «respirare nel vuoto». Einstein precisò di dissentire da Kant «solamente per il fatto che non concepiamo le “categorie” come inalterabili», ma come «libere convenzioni», storicamente mutevoli. In realtà, lo stesso Kant aveva riconosciuto l’importanza del mutamento teorico in fisica, interessandosi sempre alle ultime frontiere della ricerca. Tuttavia, l’immagine secondo cui la scienza progredisce e così facendo lascia indietro la filosofia, che invece sarebbe incapace di progresso, si è imposta nella cultura successiva. Per alcuni fisici di oggi la filosofia è scientificamente inutile o peggio fuorviante. Per esempio Stephen Hawking, in una conferenza sulla fisica di oggi, ha dichiarato: La filosofia è morta. I filosofi non si sono tenuti al passo con gli sviluppi della scienza, in particolare della fisica […]. Gli scienziati sono diventati i portatori della torcia della scoperta nella nostra ricerca della conoscenza. [Nuove teorie] ci portano a una nuova e diversa immagine dell’universo e del nostro posto in esso (cit. in Warman, 2011, trad. mia).
Simili opinioni sono diffuse nella comunità scientifica e sono incoraggiate dall’assenza della filosofia nella formazione scientifica. Come abbiamo visto, tuttavia, la pensavano diversamente grandi scienziati che hanno rivoluzionato la fisica moderna, da Galilei a Keplero ( Johannes Kepler), da Newton a Einstein, che davano grande importanza alle proprie conoscenze filosofiche e le usarono per creare le proprie teorie. Ieri come oggi, la filosofia può avere un ruolo considerevole nella ricerca scientifica: analizzare i principi e i concetti fondamentali delle teorie, individuarne gli eventuali aspetti problematici, immaginare ipotesi alternative sono attività tipicamente filosofiche, che servono a creare nuove teorie. Ma la difficoltà della comunicazione interdisciplinare dipende anche dalla filosofia attuale. Qualche filosofo, di fronte alla separazione disciplinare dalla scienza, ha effettivamente reagito svalutando l’intero sapere scientifico, per rivendicare l’autonomia e, in certi casi, il primato della pura indagine filosofica. Henri Bergson, per esempio, sostenne contro Einstein che la fisica non poteva comprendere la dimensione soggettiva del tempo e dell’esperienza vissuta in genere. Martin Heidegger asserì addirittura che la scienza in generale “non pensa”, cioè è un ragionamento meccanico incapace di accedere ai propri presupposti, e difese la necessità di tornare a un pensiero filosofico indipendente dalla scienza e pertanto più profondo. In effetti, anche tra i filosofi che ritengono pos-
26
fisica per filosofi
sibile e fruttuosa una collaborazione con la scienza, l’analisi filosofica tende a contestare la validità assoluta di quest’ultima, mostrando i limiti delle teorie attuali e sostenendo la possibilità di approfondire la nostra conoscenza, finanche di rivoluzionarla. Ma questo non deve costituire un ostacolo alla collaborazione tra scienziati e filosofi: riconoscere la rivedibilità delle teorie fisiche, che risulta dallo studio del loro susseguirsi nella storia, non indica una debolezza né contraddice l’idea di scienza. Al contrario, la scienza moderna nasce proprio in base all’assunto della rivedibilità e dell’incertezza delle conoscenze, conseguenza del fatto che si può dire “scientifica” soltanto un’affermazione che si sottopone a prove e si corrobora attraverso un processo pubblico, collettivo e possibilmente riproducibile. La scienza – come ha sottolineato di recente Carlo Rovelli (2014, pp. 225-30, cit. a p. 228) – «si nutre di una radicale mancanza di certezze», mentre la certezza assoluta appartiene piuttosto a certe forme di credenza religiosa. Le conoscenze fisiche accolte dalla comunità scientifica, in quanto sottoposte alle procedure sopra menzionate, devono essere senz’altro difese di fronte a chi le mette in dubbio senza opporre teorie altrettanto fondate e sperimentalmente controllabili, poiché rappresentano le migliori conoscenze disponibili nel presente. Ma la credenza di possedere una teoria infallibile, quando è fatta propria dai fisici, diventa un freno alla ricerca. Ecco perché i Percorsi storico-filosofici1 sono anche approfondimenti su diversi momenti di svolta della storia della fisica. L’importanza della dimensione filosofica e storica per l’educazione scientifica fu riconosciuta in modo efficace da Einstein, che in una lettera all’insegnante Robert Thornton del 7 dicembre 1944 la presentò come un modo di sviluppare la mentalità autenticamente scientifica e favorire l’ampliamento della conoscenza: Sono pienamente d’accordo con te sul significato e sul valore educativo della metodologia, così come della storia e della filosofia della scienza. Oggi molta gente – perfino scienziati professionisti – mi sembra come chi ha visto migliaia di alberi ma non ha mai visto una foresta. Una conoscenza dello sfondo storico e filosofico dà quel genere di indipendenza dai pregiudizi della propria generazione, di cui la maggioranza degli scienziati sta soffrendo. Questa indipendenza creata dallo sguardo filosofico – a mio parere – costituisce il tratto che distingue un mero artigiano o specialista dal vero ricercatore della verità2.
paolo pecere
1 Fisica: linguaggio, termini e definizioni
1.1. Il gioco delle parti: di cosa parleremo, come e perché Per poter parlare di un certo argomento deve essere chiaro l’oggetto di cui tratteremo, gli strumenti che utilizzeremo e perché vogliamo discuterne. Vediamo uno schema di massima di tutti i pezzi del gioco. Qui non daremo delle definizioni rigorose né complete, quelle verranno dopo; per ora ci limiteremo al significato dato dal buon senso o da quello che ci ricordiamo dall’esperienza. Molte di queste definizioni verranno modificate più volte nel corso dei secoli; nei capitoli successivi, quando sarà il caso, vedremo di raccontare come e perché debbano essere cambiate.
1.1.1. Palcoscenico: dove si svolge l’azione scenica Lo spazio: è quello che ci immaginiamo, una specie di contenitore in cui avvengono tutte le cose che succedono. Il tempo: è quello che “vediamo scorrere”, ciò che ci dà un’idea del prima e del dopo e che ha una direzione ben precisa, dal passato verso il futuro.
1.1.2. Attori (chi è di scena) e con cosa comunicano (i linguaggi) – La materia comprende tutti gli oggetti che possiamo o potremmo idealmente toccare, dai più piccoli – gli atomi e i loro componenti, elettroni, protoni e neutroni – ai più grandi: i pianeti, le stelle, le galassie. Cosa intendiamo con “toccare” e cosa per “pensare di toccare”? È solo
28
fisica per filosofi
un problema di dimensioni relative. Noi, come esseri umani, abbiamo una scala di dimensioni, quella umana appunto, tipicamente dalla frazione di millimetro al metro. Se diciamo di accorgerci di una mela perché possiamo toccarla è abbastanza chiaro cosa si intende: toccarla vuol dire che se, per esempio, avviciniamo una mano alla mela a un certo punto avremo una reazione, la mano sentirà una resistenza. E questo è dovuto al fatto che la mela è composta di atomi, che gli atomi della mano si accorgono degli atomi della mela ecc. Ma non potremmo accorgerci, utilizzando una mano, di un pezzetto di mela che contenesse mille miliardi di molecole della mela (sulla Terra peserebbe molto meno di un miliardesimo di grammo). In questo caso, però, il problema è solo dovuto al fatto che siamo troppo grandi. Un microrganismo si accorgerebbe della presenza di una frazione microscopica di mela. Quindi noi non possiamo toccare un atomo o una molecola, ma possiamo immaginare di essere abbastanza piccoli per toccarli, cioè di andarci abbastanza vicino e di avere una reazione che ne dimostri la presenza. Mentre non possiamo essere sicuri di attribuire la proprietà di avere una massa a un oggetto visto con i nostri occhi, oppure fotografato. Chi ha visto i riflessi di acqua sopra una strada asfaltata molto calda d’estate sa bene che quell’acqua è solo un’illusione ottica. Sulla strada non ve n’è nessuna molecola. Dunque, il vedere è un’esperienza particolare che, da sola, non è sufficiente a definire senza ambiguità la natura di quello che osserviamo. Ma ora non è il caso di entrare in queste sottigliezze. Torniamo agli oggetti che possiamo pensare di toccare, con cui possiamo avere esperienze sensibili; ciò che accomuna tutte queste particelle è che hanno una certa massa, e che, in ogni istante di tempo, possiamo pensarle localizzate in un certo punto dello spazio. Questa definizione va benissimo nell’ambito della fisica classica, quella di Galilei e di Newton per intenderci. – Le forze fondamentali (o meglio: le interazioni fondamentali) sono gli strumenti utilizzati dalla materia, quindi dalle particelle, per scambiarsi informazioni, per accorgersi le une delle altre, per interagire. Sono le interazioni a permettere che accada qualsiasi cosa. Un’interazione può essere definita come la causa che provoca un cambiamento nell’oggetto con cui interagisce. Le interazioni note sono quattro, a cui se n’è aggiunta di recente una quinta1: 1 . l’interazione gravitazionale: si esercita fra le masse, è descritta dalla legge di gravitazione universale di Newton, ed è sempre attrattiva;
fisica: linguaggio, termini e definizioni
29
2 . l’interazione elettromagnetica: si esercita fra particelle con una carica elettrica diversa da zero, è descritta dalla legge di Coulomb e dalla forza di Lorentz2; può essere attrattiva o repulsiva; 3. l’interazione forte: anche questa è sempre attrattiva; si esercita, fra l’altro, fra protoni e neutroni, il che giustifica perché il nucleo sia stabile (se non ci fosse, i protoni si respingerebbero a causa dell’interazione elettromagnetica); 4. l’interazione debole: è responsabile del decadimento radioattivo; non è collegata all’immagine che abbiamo usualmente della nozione di forza o di interazione. Essa spiega, per esempio, come mai un neutrone ogni tanto si trasformi in altre particelle (un protone, un elettrone e altro). Questa interazione, insieme a quella forte, ha un raggio d’azione molto piccolo: entrambe diventano praticamente nulle per distanze maggiori dei nuclei atomici, quindi, in sostanza, non contribuiscono alla descrizione del mondo “macroscopico”. In questa sede non ne parleremo. Per descrivere (quasi) tutto l’universo che ci circonda su una scala appena più grande di quella atomica saranno sufficienti l’interazione gravitazionale e quella elettromagnetica; 5. l’interazione di Higgs: è l’ultima interazione nota, la cui esistenza è stata verificata sperimentalmente nel 2012. È un’interazione particolare, associata a un campo (il campo di Higgs) che permea tutto l’universo. È l’interazione responsabile del fatto che le particelle possono avere una massa. – Le particelle materiali si “parlano” utilizzando le varie interazioni come avverrebbe in un gruppo di persone che conoscessero linguaggi differenti e che parlassero contemporaneamente fra di loro. Alcune persone possono parlare e capire la lingua italiana, quella inglese e quella francese. Altre solo quella francese. Altre il francese e l’inglese. Quello che succede è che ognuno parla la lingua che conosce e ogni singolo individuo interagisce (cioè, può parlare e capire) con le persone che parlano una delle lingue da lui conosciute. E domina l’interazione più “forte”. In questa metafora le persone corrispondono alla materia e i linguaggi sono le interazioni fondamentali. Vedremo poi come si definisce la “forza” delle interazioni fondamentali. Le interazioni e la materia quando si “parlano” si scambiano le particelle che trasportano l’interazione. Questo tipo di particelle, i vettori delle interazioni, hanno alcune caratteristiche simili a quelle delle parti-
30
fisica per filosofi
celle materiali e altre diverse. Per esempio, nel caso dell’interazione elettromagnetica la particella che trasporta questa interazione è il fotone, che ha massa nulla, mentre le altre interazioni sono trasportate da particelle con massa diversa da zero.
1.1.3. Le regole del gioco Le regole del gioco sono stabilite dai principi della fisica: alcune saranno sempre valide, altre dipenderanno dall’ambiente, cioè dalle condizioni in cui si trova l’osservatore, che sta osservando (misurando) il fenomeno in esame. L’elenco di queste regole, ricostruito dagli scienziati che osservano lo spettacolo della natura, è cambiato più volte nel corso della storia.
1.1.4. Gli strumenti La matematica: verrà utilizzata per assegnare dei valori numerici a tutto ciò che vorremo misurare e per descrivere formalmente i principi e tutte le leggi che ne derivano. Quindi per descrivere, attraverso le formule, le relazioni tra i diversi sistemi fisici che interagiscono. Avere delle formule permette di fare delle previsioni numeriche e di confrontarle con l’esperienza. – Almeno un sistema di riferimento: vale a dire, un sistema di coordinate spazio-temporali, che serve a rispondere a domande come le seguenti: dove si trova un oggetto in un certo istante? E dopo un certo intervallo di tempo? L’autovelox che fa la multa per eccesso di velocità è uno strumento che sta fermo in un sistema di riferimento (il bordo della strada solidale con la Terra), che ha un misuratore di posizione (tarato in chilometri) e un misuratore di tempo (tarato in ore). Può quindi calcolare, utilizzando due valori della posizione e del tempo, a quale velocità sta andando una macchina che è appena passata. Associando a ogni evento una posizione e un tempo è possibile descriverne l’andamento temporale, studiarne la storia passata e quella futura (non sempre, spesso con una certa imprecisione o indeterminazione).
fisica: linguaggio, termini e definizioni
31
1.1.5. Le teorie che verranno messe in scena nell’ordine temporale in cui furono scritte – La meccanica classica: è la teoria le cui basi furono gettate da Galilei (1564-1642); la sua prima formulazione compiuta è di Newton (16421727). Gli oggetti in gioco sono la materia “sensibile” ferma o in movimento, come palline, piani orizzontali o inclinati, pendoli, ruote, corde, molle, proiettili, razzi, pianeti, stelle e tanti altri. L’unica interazione che ai tempi di Newton si sapeva descrivere quantitativamente era la forza di attrazione gravitazionale esistente fra tutti i corpi che hanno una massa diversa da zero3. – La termodinamica: dove entra in gioco la temperatura. A prima vista questa teoria sembra simile alla meccanica: in fondo parla di palline che si muovono (atomi e molecole) e che si scontrano seguendo le leggi della meccanica; eppure è fondamentalmente diversa: studia quello che succede quando abbiamo tanti “oggetti” molto piccoli che hanno un movimento “disordinato”, caotico, non calcolabile singolarmente. Per descriverli bisogna usare la statistica fatta su miliardi di miliardi di miliardi di oggetti. Il risultato è parzialmente inaspettato: solo per il fatto di avere “tanti” oggetti che interagiscono dobbiamo scrivere nuovi principi, le leggi di Newton non bastano più. Vedremo che una delle conseguenze della termodinamica sarà di poter dare una direzione al tempo. In termodinamica, inoltre, si definisce per la prima volta correttamente la grandezza “energia”. – L’elettromagnetismo: si stabilisce che oltre alla massa i corpi possono avere anche una carica elettrica. Fra i corpi che hanno una carica elettrica diversa da zero si esercita una nuova interazione: quella elettromagnetica. Il problema sarà che questa interazione dipende non solo dalla posizione relativa delle cariche elettriche, ma anche dalla loro velocità relativa. L’elettromagnetismo spiega egregiamente tutti i fenomeni elettrici, (quasi) tutti i fenomeni magnetici e addirittura la luce! – La relatività speciale è la parte della relatività, detta anche “ristretta”, che studia quello che succede quando abbiamo dei sistemi che si muovono con velocità costante l’uno rispetto all’altro. La relatività speciale, elaborata da Einstein (1879-1955) risolve alcune gravi incongruenze dell’elettromagnetismo, che erano state elegantemente messe sotto il tappeto da molti fisici della fine del Novecento. Ridefinisce lo spazio e
32
fisica per filosofi
il tempo rispetto a quelli utilizzati da Galilei e Newton, introducendo il concetto di spazio-tempo, e ridefinisce anche il concetto di energia associata a un corpo materiale. Per velocità piccole rispetto a quella della luce si riduce alla meccanica classica. – La relatività generale è una delle più grandi costruzioni mentali mai realizzate da un solo uomo: Einstein, che fu aiutato in questo da molti matematici. Mostra che lo spazio-tempo viene curvato4 dalla presenza di masse. Il buon vecchio spazio euclideo (uno spazio piatto) è, quindi, solo un’approssimazione. La relatività generale è essenziale per prevedere correttamente il moto di alcuni corpi celesti, il funzionamento del gps, l’esistenza delle onde gravitazionali e dei buchi neri. – La meccanica quantistica. Alcune parti delle teorie precedenti falliscono miseramente se andiamo a vedere cosa succede nel mondo microscopico (gli atomi, i suoi costituenti e tutte le particelle cosiddette “elementari”). In queste particolari condizioni le teorie “classiche” non danno solo risultati un po’ sbagliati, rispetto alle misure o alle osservazioni: le previsioni sono totalmente diverse da quello che si osserva. La meccanica quantistica è una teoria elaborata da decine di scienziati a partire dal 1900, formalizzata nel 1927 e che continua a essere sviluppata ancora oggi, con alcuni punti oscuri o poco intuitivi, ma con una caratteristica indiscussa: funziona benissimo per spiegare quello che vediamo e per prevedere nuovi effetti con una precisione straordinaria. Nota. Tutte queste teorie non sempre possono essere messe in scena (utilizzate) contemporaneamente. Per esempio, se abbiamo a che fare con oggetti microscopici e molto veloci avremo la meccanica quantistica relativistica, ma se abbiamo oggetti microscopici in un campo gravitazionale non sappiamo cosa fare: o li descriviamo con la relatività generale oppure con la meccanica quantistica; non abbiamo una teoria unitaria che descriva come si comporta la materia microscopica in presenza di gravità. E questo è un bel problema, che ancora non ha trovato soluzione. L’ambizione di qualunque fisico teorico è di scoprire una teoria che unifichi le varie teorie oggi utilizzate in un corpo unico che, con poche e semplici relazioni, sia in grado di descrivere la parte del mondo che conosciamo, e magari anche quella a noi ancora ignota.
Non abbiamo detto perché vogliamo fare tutta questa fatica per comprendere il mondo che ci circonda. Sia concesso di non dirlo, per ora; oppure immaginatelo.
fisica: linguaggio, termini e definizioni
33
1.2. Linguaggio e ipotesi di base Quando si dice che la scienza moderna nasce con Galilei si intendono in particolare due aspetti (fra i tanti) che lo studioso pisano discusse nei suoi scritti e che possono essere considerati come il punto di partenza di un qualunque approccio scientifico: 1. la combinazione di esperimenti e dimostrazioni o, come dice Galilei in una lettera del 1615, di «sensate esperienze» e «necessarie dimostrazioni» (Galilei, 1932, p. 316): Galilei espone chiaramente come il cammino per arrivare a una descrizione del nostro mondo debba passare attraverso una serie di prove sperimentali, fatte, ripetute, rigettate o validate, e attraverso «sensate esperienze», ossia esperimenti “intelligenti”. In altre parole, si tratta di estrarre leggi e/o principi universali da esperimenti pensati e disegnati in modo intelligente, tali, cioè, da rendere trascurabili, o facilmente identificabili, tutti quegli effetti che tendono a mascherare il comportamento ideale che stiamo cercando. Questo comportamento ideale è quello che prevediamo in base a dimostrazioni matematiche, precedentemente svolte, che si riferiscono appunto a casi ideali (per esempio, il moto di un punto materiale nel vuoto). Trattandosi di matematica, queste dimostrazioni – come dice Galilei – avranno validità necessaria; 2. l’idea secondo cui la matematica è il linguaggio dell’universo (matematizzazione della natura). Come scrive Galilei in un celebre passo del Saggiatore (1623): La filosofia è scritta in questo grandissimo libro che continuamente ci sta aperto innanzi agli occhi, io dico l’universo, ma non si può intendere se prima non s’impara a intender la lingua, e conoscer i caratteri ne’ quali è scritto. Egli è scritto in lingua matematica, e i caratteri son triangoli, cerchi ed altre figure geometriche, senza i quali mezi è impossibile a intenderne umanamente parola; senza questi è un aggirarsi vanamente per un oscuro laberinto (Galilei, 1933c, p. 232).
Galilei stabilisce che il mondo naturale può, anzi deve, essere descritto in forma matematica, ossia quantitativa. Vedremo (con il caos deterministico o la relatività generale) come nel corso dei secoli, in particolar modo nell’ultimo secolo, sia stato necessario estendere la matematica dei tempi di Galilei per descrivere altre geometrie, altre “matematiche”
34
fisica per filosofi
non esistenti a quell’epoca, ma che si sono dimostrate necessarie proprio per dare una forma quantitativa a una serie di fenomeni allora sconosciuti, o non trattabili con la matematica del xvii secolo. Questo secondo punto è importante: i principi della fisica, o anche le leggi più semplici, sono scritti con il linguaggio della matematica, non è pensabile poterli capire e comprenderne il senso più profondo se non si conosce il significato del linguaggio matematico, quello dei simboli utilizzati, delle formule. Come per ogni altra lingua, per poterla usare o anche solo per capirne una frase è necessario conoscere prima l’alfabeto, poi il significato delle parole, la grammatica, la sintassi e così via. Nel paragrafo successivo richiameremo brevemente i significati di alcuni termini fisici e matematici di uso universale. È una descrizione formale e forse noiosa per chi già la conoscesse – e che, quindi, in tal caso può essere saltata – ma sarà utile per mettere le basi sul significato di quello che scriveremo in seguito.
1.2.1. Teoremi, principi, leggi fisiche, leggi fenomenologiche Deve essere chiara la differenza fra un teorema e una legge fisica. Prendiamo, per esempio, il teorema di Pitagora. Pitagora parte dall’ipotesi di trovarsi in uno spazio euclideo, in cui, cioè, valgono i principi di Euclide: vale a dire, uno spazio “piatto”. Vedremo, a proposito della relatività generale (cfr. cap. 6), che lo spazio tridimensionale in cui ci muoviamo solo approssimativamente può dirsi euclideo e che lo spazio in realtà è “curvo”. Data l’ipotesi di trovarsi in uno spazio piatto il teorema di Pitagora afferma che in un triangolo rettangolo il quadrato dell’ipotenusa5 (a) è uguale alla somma dei quadrati dei due cateti (b, c): a2 = b2 + c2 Questo è un teorema, vale a dire dalle ipotesi di partenza segue logicamente il teorema, tramite una dimostrazione rigorosamente valida. La conclusione è vera, ma attenzione: è vera se ai numeri a, b e c sostituiamo i valori assegnati alle lunghezze di un triangolo rettangolo ideale, perfetto. Se disegnassimo su un foglio un triangolo rettangolo e poi misurassimo con uno strumento (uno qualunque) le lunghezze dei tre lati a, b e c,
fisica: linguaggio, termini e definizioni
35
troveremmo che la formula appena citata vale solo approssimativamente: questo perché la misura ottenuta per ogni lato non è una rappresentazione esatta del valore “vero” della lunghezza del lato, che non possiamo conoscere con esattezza (e al limite non è detto che esista), ma un’approssimazione legata al fatto che la misura ha un’incertezza dovuta alla precisione dello strumento, che non può mai essere zero, e al fatto che la grandezza misurata non è detto che sia costante nel tempo; potrebbe fluttuare, anzi vedremo che lo farà nella quasi totalità dei casi. O addirittura potrebbe non essere definita per alcune classi di oggetti (per esempio, per alcune grandezze riferite a oggetti microscopici). Quindi, per ogni misura di lunghezza L otterremo un valore che scriveremo come: Misura di lunghezza = L ± ∆L dove L è il valore ottenuto per la misura della lunghezza, mentre ∆L rappresenta l’incertezza con cui è stata effettuata la misura L; questo sta a indicare che l’unica cosa che possiamo dire è che la lunghezza reale del corpo avrà, con una certa probabilità, un valore compreso fra (L – ∆L) e (L + ∆L)6. Un principio (della fisica o di qualunque altra disciplina), invece, non viene “dimostrato” a partire da un’ipotesi o da altre proposizioni, non è il frutto di un ragionamento deduttivo, quindi non è necessariamente vero. È solo un’affermazione la cui negazione è non contradditoria (nel senso che dice qualcosa che non necessariamente è vero) e su cui si basano tutte le proposizioni di una certa teoria fisica. Un principio è un’elaborazione mentale di chi l’ha espresso, che potrebbe benissimo risultare falsa oppure vera solo in parte, e vedremo quante volte sia successo nel corso della storia. Consideriamo un esempio che tratteremo più a fondo in seguito, il secondo principio della dinamica di Newton (scritto per un moto in una sola dimensione): F=m∙a Questo principio afferma che se prendiamo un corpo puntiforme di massa m, e ne misuriamo l’accelerazione a (ancora non l’abbiamo definita, ma per ora non importa, si assuma per “accelerazione” il significato che proviene dal buon senso), e poi misuriamo la forza F che agisce sul corpo, allora il numero che otteniamo per il prodotto m ∙ a sarà (circa,
36
fisica per filosofi
per la solita ragione dell’imprecisione nella misura) uguale al numero che avremo ottenuto per la forza F. Non c’è nulla di necessariamente vero in questo. Nell’antichità e nel Medioevo, tra chi accettava la fisica aristotelica, per esempio, si pensava che la proporzionalità fosse fra la forza e la velocità (Aristotele), non fra la forza e l’accelerazione. La differenza la fanno le misure: utilizzando la relazione F = m ∙ a possiamo descrivere e fare delle previsioni sul moto dei corpi che, invece, non possiamo fare se scriviamo F = m ∙ v. La prima funziona, la seconda no. Vedremo come oltre ai principi della fisica utilizzeremo delle espressioni che descrivono le interazioni possibili fra i vari corpi, che in realtà, come scopriremo, sono solo quattro7. Oltre ai principi si possono scrivere leggi fenomenologiche, delle leggi, cioè, che non sono per nulla generali, descrivono solo il comportamento di alcuni sistemi in determinate condizioni, senza la pretesa di spiegare perché funzionano. È il caso delle leggi di Keplero che possono descrivere il moto di due corpi liberi che ruotano uno intorno all’altro, da lui applicate al moto dei pianeti intorno al Sole. Nel momento in cui Keplero le scrisse aveva delle ipotesi sulle cause di quel moto (parlava di una forza motrice del Sole), ma nelle leggi si limita a descrivere quest’ultimo senza riferimenti alla causa. Le leggi di Keplero, dunque, descrivevano molto bene il moto dei pianeti intorno al Sole, ma una volta scritta – da Newton – la legge di gravitazione universale si è visto come esse fossero delle naturali – e necessarie – conseguenze delle leggi della meccanica e della gravitazione universale, appunto. Quindi, le leggi fenomenologiche si possono formulare anche al di fuori di una teoria fisica. Ma, una volta che una teoria viene elaborata in maniera completa, le leggi che ne derivano possono fornirne la spiegazione.
1.2.2. Ipotesi di base In una trattazione moderna della fisica, come di qualunque altra teoria, è importante definire l’ambito in cui ci si muove e le ipotesi che si prendono come vere nella descrizione dei sistemi in esame. Questa parte era talvolta sottintesa nei lavori iniziali di Galilei, di Newton e degli altri fisici. La sua caratterizzazione, tuttavia, si è rivelata essenziale man mano che la descrizione dell’universo progrediva, contemporaneamente al nascere di nuovi problemi.
fisica: linguaggio, termini e definizioni
37
I concetti essenziali da definire sono solo apparentemente semplici. Prima di tutto dobbiamo definire lo spazio in cui ci muoviamo e il tempo. Le definizioni di spazio e tempo, che nella loro formulazione classica possono sembrare ovvie, saranno proprio quelle che Einstein, con la sua relatività, scardinerà. Ora descriveremo le ipotesi fatte sullo spazio e sul tempo, e come fossero necessarie per scrivere correttamente le leggi di Newton e tutte le leggi fisiche scritte fino alla fine del xix secolo. 1. Lo spazio è euclideo: lo spazio è descritto dalla geometria euclidea (esso è, perciò, “piatto”). Valgono i principi della geometria di Euclide e tutti i teoremi derivati da essi. Per cui, per esempio, dato un triangolo nello spazio, la somma degli angoli interni deve dare sempre 180°. Se lo spazio fosse curvo la somma degli angoli interni di un triangolo sarebbe minore, oppure maggiore di 180° (geometrie non euclidee). Uno spazio euclideo è una buona approssimazione per descrivere il mondo che ci circonda. Vedremo che secondo la relatività generale (1916) lo spazio in presenza di materia è sempre curvo, ma gli effetti sulla Terra sono quasi sempre trascurabili, pertanto per ora li tralasceremo. 2. Lo spazio è isotropo e omogeneo: le proprietà fisiche dei corpi non dipendono dalla posizione (omogeneità) o dalla direzione del corpo nello spazio (isotropia), quindi non cambiano se si sposta il corpo da un punto a un altro o se si ruota un corpo cambiando la sua direzione nello spazio. Queste ipotesi valgono ovviamente solo se tutte le altre condizioni restano identiche. Se si misura il proprio “peso” sulla Luna si troverà un valore diverso da quello misurato sulla Terra, ma questo effetto non è dovuto alla non omogeneità dello spazio, bensì alla presenza di corpi con masse differenti che generano una diversa forza di attrazione gravitazionale. Lo spazio, dunque, è identico a sé stesso in seguito sia a traslazioni che a rotazioni. 3. Il tempo è isotropo e omogeneo: l’omogeneità consiste nell’invarianza delle leggi fisiche8 per traslazioni da un istante all’altro del tempo considerato nel suo divenire naturale, dunque verso il futuro, mentre l’isotropia riguarda la
38
fisica per filosofi
direzione nel tempo, intesa come quella verso il passato e verso il futuro. Perciò, supponendo che le condizioni esterne rimangano costanti, le proprietà di una grandezza non dipendono da quando si misurano, se non si ha a che fare con grandezze che dipendono esplicitamente dal tempo9. Detto in modo formale vuol dire che le leggi fisiche che si scriveranno per descrivere i fenomeni dovranno essere invarianti per traslazioni nel tempo. Questo è un punto fondamentale: se non si ipotizzasse l’omogeneità del tempo non si potrebbero fare previsioni sul moto, essendo variabili le durate dei fenomeni, e quindi anche gli spostamenti, le velocità, le accelerazioni. 4. Esistono uno spazio assoluto e un tempo assoluto, indipendenti uno dall’altro10. Ecco come ne parla Newton (1965, pp. 101-6): Fin qui è stato indicato in quale senso siano da intendersi, nel seguito, parole non comunemente note. Non definisco, invece, tempo, spazio, luogo e moto, in quanto notissimi a tutti. Va notato tuttavia, come comunemente non si concepiscano queste quantità che in relazione a cose sensibili. Di qui nascono i vari pregiudizi, per eliminare i quali conviene distinguere le medesime cose in assolute e relative, vere e apparenti, matematiche e volgari. i. Il tempo assoluto, vero, matematico, in sé e per sua natura senza relazione ad alcunché di esterno, scorre uniformemente, e con altro nome è chiamato durata; quello relativo, apparente e volgare, è una misura (accurata oppure approssimativa) sensibile ed esterna della durata per mezzo del moto, che comunemente viene impiegata al posto del vero tempo: tali sono l’ora, il giorno, il mese, l’anno. ii. Lo spazio assoluto, per sua natura senza relazione ad alcunché di esterno, rimane sempre uguale ed immobile; lo spazio relativo è una dimensione mobile o misura dello spazio assoluto, che i nostri sensi definiscono in relazione alla sua posizione rispetto ai corpi, ed è comunemente preso come lo spazio immobile; così la dimensione di uno spazio sotterraneo o aereo o celeste viene determinata dalla sua posizione rispetto alla Terra. Lo spazio assoluto e lo spazio relativo sono identici per grandezza e specie, ma non sempre permangono identici quanto al numero. Infatti se la Terra, per esempio, si muove, lo spazio della nostra aria, che relativamente alla Terra rimane sempre identico, sarà ora una parte dello spazio assoluto attraverso cui l’aria passa, ora un’altra parte di esso; e così muterà assolutamente in perpetuo.
fisica: linguaggio, termini e definizioni
39
iii. Il luogo è la parte dello spazio occupata dal corpo, e in relazione allo spazio può essere assoluto o relativo. […] iv. Il moto assoluto è la traslazione del corpo da un luogo assoluto in un luogo assoluto, il relativo da un luogo relativo in un luogo relativo. […] Definiamo, infatti, tutti i luoghi dalle distanze e dalle posizioni delle cose rispetto a un qualche corpo, che assumiamo come immobile; ed in seguito con riferimento ai luoghi predetti valutiamo tutti i moti, in quanto consideriamo i corpi come trasferiti da quei medesimi luoghi in altri. Così, invece dei luoghi e dei moti assoluti usiamo i relativi; né ciò riesce scomodo nelle cose umane: ma nella filosofia occorre astrarre dai sensi.
Ed ecco un acuto commento di C. Casadio e O. Levrini: Newton utilizza il termine “assoluto” per indicare spazio e tempo, etimologicamente, come “sciolti” da ogni legame con oggetti o fenomeni («per loro natura senza relazione ad alcunché di esterno»), a differenza di spazio e tempo del pensiero comune che sono “relativi”, “sensibili”, “apparenti”, “volgari” e “misurabili”. Lo spazio di Newton è, dunque, assoluto in quanto: – esistente indipendentemente dall’esistenza di corpi materiali (esiste in sé, non è un sistema di relazioni fra corpi); – dotato di proprietà indipendenti dall’interazione con la materia (non ha, cioè, caratteristiche dinamiche); – definito indipendentemente dalle misure e dalle osservazioni che si possono fare sugli oggetti sensibili (non è cioè relativo, a differenza di quello che viene “comunemente” concepito come spazio e rispetto al quale “conviene” distinguere). Si tratta di uno spazio sostanziale, dotato di realtà, un contenitore vuoto, indifferente alla materia in esso contenuta e all’osservatore che in esso analizza i movimenti della materia. Analogamente, il tempo assoluto indica un fluire eterno, sciolto dallo spazio ed esistente indipendentemente dalla sua misura volgare in ore, giorni e anni. […] La fiducia di Newton nella semplicità e invarianza della natura (cfr. le “Regole del filosofare”) si traduce nella generalizzazione alla totalità dello spazio delle proprietà geometriche (topologiche, affini, metriche) percepite e valide in ambito locale e, dunque, nell’ipotesi di uno spazio omogeneo, uniforme, continuo, così come continuo, uniforme ed eterno è lo scorrere del tempo. L’immobilità dello spazio è invece garantita dal fatto che esso è detto essere incernierato attorno ad un centro fermo (il «comune centro di gravità della Terra e del Sole e di tutti i pianeti»). Fra tante ipotesi implicite questa è l’unica ipotesi esplicita presente nei Principia che Newton si trova costretto ad imporre per garantire forse l’unicità del contenitore e lo fa “fingendo” un’ipotesi che non sembra obbedire né al criterio di uniformità della natura, né di semplificazione delle cause, contravvenendo così al “rasoio” che si era autoimposto nelle “Regole del filosofare” (Casadio, Levrini, 2006).
40
fisica per filosofi
Lo spazio in cui ci muoviamo, quello in cui “esistiamo”, è uno, assoluto e serve come riferimento per qualunque evento di cui voglia misurare la posizione. Analogamente per il tempo: noi viviamo in un “tempo” che scorre a una certa “velocità” immutabile e fissata. Qualunque orologio, costruito in maniera identica, misurerebbe lo stesso intervallo per un certo evento.
1.2.3. Sistemi di riferimento Un sistema di riferimento è un insieme di coordinate (di numeri) utilizzabili per definire la posizione di un punto nello spazio, ed eventualmente nel tempo. Un sistema di riferimento spaziale è composto usualmente da un’origine e da tre assi “graduati”. Che gli assi siano tre è legato al fatto che lo spazio che ci circonda ha tre dimensioni spaziali, sia a livello intuitivo che formalmente (nel senso che le teorie accettate oggi descrivono uno spazio a tre dimensioni). Se poi vogliamo non solo definire la posizione dei punti nello spazio, ma anche in quale istante questi punti si trovano in quella posizione, dobbiamo assegnare anche un tempo a ogni sistema di riferimento. Questo lo facciamo supponendo di porre un orologio solidale con ogni sistema, e di poter leggere il tempo in un qualunque istante. Dato che per Newton il tempo era unico e assoluto in realtà sarebbe sufficiente avere un solo orologio: ogni osservatore leggerà il suo tempo, che sarà uguale per tutti. Nel cap. 5 sulla relatività speciale vedremo che non sarà così semplice. Quindi, per ora limitiamoci a inserire un orologio in ogni sistema di riferimento, dando per scontato che tutti gli orologi misurino lo stesso tempo. Un sistema di riferimento cartesiano è un sistema di riferimento, riferito a uno spazio tridimensionale, in cui si definisce un’origine O, da cui partono tre assi fra loro perpendicolari (in genere chiamati x, y, z). Questo sistema (ideale) viene considerato infinitamente rigido e indeformabile (cfr. fig. 1.1). In questo sistema la posizione del punto P è definita da tre coordinate P (xo, yo, zo). I tre valori (xo, yo, zo) sono le lunghezze delle proiezioni del segmento OP misurate lungo i tre assi x, y, z. Nella fig. 1.1 è mostrato un secondo sistema di riferimento O’(x’, y’, z’ ) con l’origine nel punto P. Le coordinate del punto (i tre numeri che individuano la sua posi-
fisica: linguaggio, termini e definizioni
41
figura 1.1 Due sistemi di riferimento cartesiani O(x, y, z) e O’(x’, y’, z’) z’ z
y’
x’ x0 x
P(O’: 0,0,0; t’) ≡ P(O: x0, y0, z0; t) t = t’
O’
t
t’
O y0
z0 y
Il punto P ha coordinate diverse nei due sistemi di riferimento O e O’: P ≡ (O: x0, y0, z0) ≡ (O’: 0, 0, 0). Sono stati aggiunti anche due orologi che misurano i due tempi t e t’ nei due sistemi di riferimento. Le coordinate del punto P sono relative al sistema di riferimento scelto (da noi). La posizione di P, invece, è assoluta secondo Newton.
zione) sono differenti a seconda del sistema in cui vengono misurati. La posizione del punto è una sola, ma la sua rappresentazione dipende dal sistema di riferimento utilizzato. Vedremo in seguito come sia possibile passare da un sistema di riferimento a un altro. Il tempo misurato dai due orologi sarà lo stesso se i due orologi saranno stati regolati in modo da partire nello stesso istante: t’(0) = t(0). Gli intervalli di tempo, invece, saranno gli stessi indipendentemente dall’istante scelto come origine dei tempi. Fra gli infiniti sistemi di riferimento che possiamo immaginare, una classe preferenziale è quella dei sistemi inerziali. Un sistema di riferimento inerziale (detto anche “riferimento inerziale” o “sistema inerziale” o “sistema di riferimento galileiano” o “spazio inerziale”) è un sistema di riferimento che descrive lo spazio come omogeneo, isotropo e indipendente dal tempo. Vedremo poi meglio i dettagli; per ora si può assumere che esista nell’universo almeno un sistema inerziale, solidale con lo spazio assoluto. Un buon esempio di sistema inerziale può essere (approssimativamente) quello costituito dal Sole (l’origine O) e da tre stelle fisse che individuano la direzione dei tre assi x, y, z.
42
fisica per filosofi
1.2.4. Lo stato di un sistema Quando vogliamo descrivere un sistema dal punto di vista fisico-matematico diciamo che vogliamo descrivere lo stato del sistema. Con “stato” intendiamo il valore di tutte le variabili necessarie per una descrizione completa del sistema. Nel caso di una particella di dimensioni trascurabili avremo che lo stato della particella sarà descritto da sei variabili spaziali (le tre coordinate spaziali x, y, z e le tre coordinate della velocità vx, vy, vz) e dal tempo t. Dovremo poi conoscere il valore delle altre grandezze che possono caratterizzare il corpo in esame. Per esempio, la sua massa e la carica elettrica. Una volta fissate queste grandezze avremo definito lo stato del sistema e potremo utilizzare le leggi della fisica per prevederne il comportamento futuro, sia che rimanga isolato sia che interagisca con altri sistemi. Quando vorremo parlare di un qualunque oggetto fisico, quello che dovremo fare sarà definire il suo stato: serviranno poche grandezze se l’oggetto è semplice, moltissime (al limite quasi infinite) se è complicato. Talvolta dovremo indicare anche la storia che ha portato a quello stato. In ogni caso quello che servirà sarà una serie di numeri che indichino i valori delle diverse grandezze al variare del tempo.
1.3. Nota. Grandezze fisiche Per “grandezza fisica” si intende una qualunque grandezza che possa, in linea di principio11, essere misurata. Per “misurata” si intende la possibilità di assegnare un valore numerico a tale grandezza. Una grandezza fisica misurata o calcolata, la più semplice possibile, si scrive in genere in questa forma: G=n∙u dove G rappresenta il simbolo che abbiamo deciso di assegnare alla grandezza, n il numero che rappresenta il suo valore e u l’unità di misura utilizzata per la grandezza. Le grandezze fisiche non sono tutte così semplici come quella appena descritta; possono essere più complicate se un solo numero non è sufficiente a descriverle completamente. Vediamo una classificazione – elementare e parziale – dei vari tipi di grandezze fisiche. 1. Grandezze scalari: sono quelle descritte solo da un numero, come abbiamo visto. Hanno la forma G = n ∙ u. Per esempio:
fisica: linguaggio, termini e definizioni
43
m = 12 g; L = 13 cm; T = –20 °C. Una grandezza può essere anche “adimensionale”, cioè senza unità di misura, come nel conteggio del numero di oggetti (per esempio, il numero di persone presenti in una stanza), oppure quando si ha la misura di una grandezza in rapporto a un’altra (per esempio, la densità relativa dell’oro è 19,3 con il che si intende che la densità dell’oro, in determinate condizioni, è 19,3 volte quella dell’acqua). 2. Grandezze vettoriali: sono quelle che necessitano di più di un numero per essere descritte completamente. A questa classe appartengono tutte quelle per cui dobbiamo dare anche una “direzione” oltre al valore della grandezza stessa. Un esempio è quello della velocità: se si dice che un’automobile sta andando a 100 km/h, essendo partita da Roma, va anche detto in quale direzione si sta muovendo, altrimenti l’informazione non sarà completa e, per esempio, non si potrà stabilire se dopo due ore si troverà vicino a Firenze o a Napoli o a Teramo. In questo caso servono più informazioni, quindi la notazione sarà leggermente più complessa. Esaminiamo proprio il caso della velocità che scriviamo con tre simboli diversi: v– = v ∙ ˆv a) v–: il simbolo di una grandezza vettoriale è quello assegnato alla grandezza (in questo caso la v di velocità) con sovrapposto un trattino; il trattino sopra il simbolo sta a indicare che si sta parlando di una grandezza vettoriale e non di una grandezza scalare. b) v: è il valore numerico che assegniamo alla grandezza, il cosiddetto “modulo”; è la grandezza – scalare – che ci dice quanto vale numericamente, in questo caso la velocità. c) ˆv: è il cosiddetto “versore”, una grandezza che ha modulo 1 e che indica la direzione e il verso del movimento. C’è una differenza fra direzione e verso: la direzione indica la retta a cui appartiene il movimento (per esempio, la direzione può essere lungo un meridiano, come nord-sud); il verso indica quale dei due versi possibili è effettivamente percorso (quindi, per esempio, da nord verso sud oppure da sud verso nord). Un vettore in uno spazio tridimensionale può essere descritto in maniera completamente equivalente anche fornendo tre numeri che rappresentano le tre componenti del vettore lungo le tre direzioni dello spazio: v– ≡ [vx, vy, vz]
Il simbolo ≡ sta a indicare che il vettore v– è “rappresentato” dalle tre grandezze vx, vy, vz; se si volessero fare delle operazioni con un vettore si dovranno impiegare delle regole particolari che utilizzano tutte e tre queste grandezze.
44
fisica per filosofi
Molto spesso un vettore v– verrà scritto semplicemente come v quando ci interesserà solo la grandezza, tralasciando la direzione. Per esempio, quando si vorrà dare il valore della forza con cui il Sole attrae la Terra si scriverà semplicemente F=G
M S · mT R2
con ovvio significato dei simboli. 3. Grandezze tensoriali: sono quelle per la cui definizione non sono sufficienti tre valori e servono più numeri per caratterizzarle completamente, spesso nove o sedici. Per esempio, nella meccanica dei corpi continui possiamo studiare cosa succede a un corpo se gli applichiamo una forza e vogliamo vedere come si deforma. Le deformazioni nello spazio possono essere descritte da nove numeri, il cosiddetto “tensore delle deformazioni”. Non verranno utilizzate in questo testo.
1.4. Nota formale. Variazioni, derivate, somme Nei paragrafi successivi esamineremo per semplicità solo la variazione dei moduli delle grandezze considerate, tralasciando, dunque, nel caso si parlasse di vettori, la parte di variazione dovuta a cambiamenti di direzione.
1.4.1. Il significato di variazione di una grandezza Con il simbolo ∆g si indica la variazione della grandezza g. Se scriviamo ∆x, per esempio, intendiamo la variazione della posizione del punto P, indicata dalla grandezza x. Per “variazione” si intende, se non specificato altrimenti, il valore nello stato finale meno il valore in quello iniziale. Quindi, se il corpo descritto si è spostato dal punto x1 al punto x2, la variazione della grandezza x sarà quella che segue (cfr. fig. 1.2): ∆x = xf – xi = x2 – x1 figura 1.2 Variazione della posizione lungo l’asse x dal punto x1 al punto x2 (∆x = x2 – x1) O
x1
x2 ∆x
x
fisica: linguaggio, termini e definizioni
45
1.4.2. Il significato di variazione di una grandezza in funzione di un’altra Se abbiamo due grandezze che variano contemporaneamente, potremmo voler sapere come varia la prima al variare della seconda. Molto spesso, ma non necessariamente, la seconda variabile è semplicemente il tempo. Il caso più semplice è quello della posizione di un corpo in movimento, in cui potremmo essere interessati non solo alla variazione della posizione, ma anche a quella del tempo in cui essa è avvenuta. Con “variazione del tempo” si intende la misura dell’intervallo di tempo trascorso, quindi la differenza fra l’istante iniziale e l’istante finale. Per “tempo” intendiamo convenzionalmente il numero letto su un orologio immobile nel sistema di riferimento usato. Se inseriamo anche la variabile tempo possiamo considerare, dunque, il corpo che si trovava nel punto x1 all’istante t1, e nel punto x2 all’istante t2 (cfr. fig. 1.3). In questo caso la variazione di x sarà: ∆x = xf – xi = x2 – x1. La relativa variazione di t, invece, sarà: ∆t = tf – ti = t2 – t1.
1.4.3. La velocità media La velocità, la grandezza che ci dice quanto siamo “veloci”, è una misura di quale sia la variazione della grandezza “posizione” in funzione della grandezza “tempo trascorso” per un corpo che si muove nello spazio. Per esempio, se ci spostiamo di 5 km in un’ora, diremo di essere andati a 5 km/h (in media). In maniera più formale, supponendo di essere passati dalla posizione x1 al tempo t1, alla posizione x2 al tempo t2 (cfr. fig. 1.3), possiamo scrivere l’espressione della velocità media , cioè la variazione dello spazio percorso diviso per il tempo trascorso: =
spazio percorso x2− x1 ∆s = = tempo trascorso t2− t1 ∆t
Questa è una velocità media (quando si vuole indicare il valore medio di una grandezza g la si scrive così: ) effettuata nell’intervallo di tempo ∆t: per esempio, se abbiamo percorso 5 km in un’ora, potremmo esserci mossi sempre a 5 km/h, figura 1.3 Variazione di una grandezza x in funzione del tempo t O
x1 , t1
x2 , t2 ∆x
x
46
fisica per filosofi
oppure essere andati per la prima mezz’ora più veloci, poi più lenti; calcolando un valore medio in genere si perde una parte dell’informazione originaria. Se, invece, si desidera un’indicazione della velocità istantanea, vale a dire della velocità che un corpo ha in un certo istante t, bisogna utilizzare l’operazione matematica di “derivata”.
1.4.4. Il significato di derivata di una grandezza. La velocità istantanea La derivata di una grandezza (per esempio, la posizione x) in funzione di un’altra grandezza (per esempio, il tempo) indicata con dx/dt, è il valore del rapporto ∆x/∆t calcolato quando l’intervallo ∆t diventa molto piccolo, al limite quando questo intervallo ∆t tende a zero. Il punto essenziale è che il rapporto di due grandezze che tendono a zero può essere un numero diverso da zero. In questo caso il rapporto fra lo spostamento e il tempo è la velocità istantanea dell’oggetto. Formalmente si scrive: ∆x dx v = lim = ∆t→0 ∆t dt Notare che se la grandezza a numeratore (quella da derivare) è costante nel tempo, allora la sua derivata rispetto al tempo sarà uguale a zero. Cioè, se il corpo non si muove la sua velocità sarà nulla. E vale anche il viceversa: se la derivata rispetto al tempo di una grandezza vale zero, allora si ha che quella grandezza è costante, nel tempo.
1.4.5. L’accelerazione Come la velocità è una misura di quanto velocemente vari la posizione di un corpo in funzione del tempo, analogamente l’accelerazione a è una misura di quanto velocemente vari la velocità in funzione del tempo: =
v2− v1 ; t2− t1
∆v dv a = lim = ∆t→0 ∆t dt
Se la velocità v è costante, l’accelerazione a sarà uguale a zero.
1.4.6. Somme Spesso si usa il simbolo ∑ per indicare la somma. Questo simbolo è un modo compatto per indicare che si sta effettuando una somma di tutti i termini di
fisica: linguaggio, termini e definizioni
47
una certa grandezza. Per esempio, supponiamo di avere 5 pesci ognuno con una massa diversa; si può scrivere la massa totale di tutti i pesci come: MT = m1 + m2 + m3 + m4 + m5 in cui mi è la massa del pesce identificato con l’indice i = 1… 5. In forma compatta questa somma si scrive: 5
MT = ∑ 1 mi con cui si intende che MT sarà uguale alla somma di tutti i termini mi facendo variare i da 1 a 5.
Percorso storico-filosofico 1. Fisica, meccanica, filosofia sperimentale La separazione disciplinare tra fisica e filosofia è un aspetto centrale della cultura contemporanea, che dà spesso luogo a discussioni: molti scienziati sostengono la piena autonomia del sapere scientifico e considerano la filosofia una disciplina obsoleta e inconcludente; molti filosofi, per contro, sottolineano la ristrettezza e i limiti della conoscenza scientifica di fronte a molti importanti aspetti della realtà, e sostengono che la filosofia, oggi come in passato, ha il compito di esaminare le basi concettuali della fisica. La separazione tra le due discipline nella formazione e nella ricerca è spesso data per scontata, eppure alcuni tra i più grandi fisici teorici moderni e contemporanei hanno sostenuto l’importanza della filosofia per la fisica e l’esigenza di un riavvicinamento tra le due discipline nell’insegnamento. Per esempio, secondo Einstein l’eccessivo tecnicismo dell’insegnamento può danneggiare la ricerca scientifica, penalizzando la capacità degli scienziati di esaminare la basi della propria teoria e concepire alternative e innovazioni teoriche. La conoscenza della filosofia e della storia della scienza, per Einstein, serve a sviluppare questa capacità. Come abbiamo visto (cfr. p. 26), Einstein raccomandava l’insegnamento della storia e della filosofia della scienza per liberare gli scienziati dai “pregiudizi della propria generazione”, e avviarli quindi a un esame critico delle teorie scientifiche in un’epoca in cui la formazione scientifica aveva già perduto il legame tra fisica e filosofia12. Ma quando si è prodotta la radicale separazione tra filosofia e fisica a cui si riferisce Einstein? All’epoca della rivoluzione scientifica del xvii
48
fisica per filosofi
secolo, quando si forma la meccanica classica, questa distinzione non esiste. La disciplina scientifica che indaga le cause dei fenomeni naturali si chiama “fisica” o “filosofia naturale”. Ma in quest’epoca cambia profondamente la concezione di tale disciplina: personaggi come Galilei, Cartesio (René Descartes), Keplero ( Johannes Kepler) e Newton propongono metodi e principi radicalmente alternativi rispetto a quelli del modello dominante nelle università, la filosofia aristotelico-scolastica. Questi metodi e principi si sviluppano in parte al di fuori delle università, mediante la collaborazione di matematici, ingegneri e artigiani, che mirano a elaborare tecniche dotate di valore pratico per conoscere e modificare la natura. Ma la nuova scienza non vuole avere un valore meramente strumentale, quale mezzo per descrivere più precisamente alcuni fenomeni e realizzare innovazioni tecnologiche. Essa ambisce, invece, a un valore di verità, come un’indagine sulle cause dei fenomeni naturali capace di modificare un’immagine del cosmo millenaria e, pertanto, si presenta al tempo stesso come una filosofia. Per questo motivo Galileo insiste per essere nominato “matematico e filosofo” dal granduca di Toscana e sostiene apertamente la verità dell’astronomia copernicana «contro a qualunque filosofo» (Galilei, 1934, p. 349). Per lo stesso motivo Cartesio pubblica un trattato, I principi di filosofia (1644), che include la nuova fisica meccanicistica con le sue leggi del moto e mira apertamente a sostituire i trattati scolastici. Lo stesso Newton dà compimento alla meccanica del xvii secolo intitolando il suo capolavoro Principi matematici della filosofia naturale, e includendo in esso una serie di “regole del filosofare” (cfr. Newton, 1965, pp. 603-7) che stabiliscono il metodo della nuova scienza. Con la diffusione della scienza newtoniana, nel Settecento, il nuovo modello prende definitivamente il sopravvento e, a causa delle crescenti ampiezza e complessità matematica della nuova fisica, determina anche la graduale separazione di fisica e filosofia. Per comprendere la novità della nuova filosofia naturale bisogna indicare almeno tre elementi generali: 1. la matematizzazione della natura; 2. l’affermarsi del metodo sperimentale; 3. la concezione meccanicistica della natura. Questi aspetti non sono stati accolti sempre, né allo stesso modo, da tutti i protagonisti della rivoluzione scientifica. Ma almeno i primi due hanno giocato un ruolo fondamentale per l’affermarsi, rispettivamente, della nuova meccanica e dell’idea di “filosofia sperimentale”, componen-
fisica: linguaggio, termini e definizioni
49
ti fondamentali della dottrina newtoniana (sul meccanicismo, cfr. Percorso storico-filosofico 3). Lo studio matematico della natura ha un ruolo marginale nella fisica aristotelica. Questa scienza, infatti, si occupa delle cause dei mutamenti naturali, riconducendole a diverse proprietà essenziali dei quattro elementi fisici: aria, terra, fuoco e acqua, a cui si aggiunge, per i corpi celesti, l’etere (cfr. Percorso storico-filosofico 2). Nelle spiegazioni aristoteliche non rientrano le proprietà quantitative del movimento, come la grandezza, la velocità e l’accelerazione dei corpi, che sono considerate astrazioni ricavate dai sensi e non proprietà essenziali delle sostanze naturali. Galilei e altri scienziati, invece, si rifanno a una diversa tradizione, quella di Archimede e altri matematici antichi, recentemente riscoperta grazie alle ricerche degli umanisti. In particolare, essi approfondiscono la meccanica, cioè la disciplina matematica che si occupa dell’equilibrio e del movimento delle macchine attraverso principi come quello della leva. L’ipotesi destinata a conferire un significato filosofico a questa tradizione è che le proprietà e i processi meccanici, propri delle macchine, ossia di oggetti artificiali, siano identici a quelli dei corpi naturali: la meccanica diviene così una nuova scienza del movimento, alternativa a quella aristotelica e formulata in un linguaggio matematico. Per sottolineare questa nuova immagine dell’universo, e insieme la necessità che il fisico conoscesse la matematica per comprenderlo, Galilei usa una celebre metafora nella sua opera Il Saggiatore: La filosofia è scritta in questo grandissimo libro che continuamente ci sta aperto innanzi agli occhi, io dico l’universo, ma non si può intendere se prima non s’impara a intender la lingua, e conoscer i caratteri ne’ quali è scritto. Egli è scritto in lingua matematica, e i caratteri son triangoli, cerchi ed altre figure geometriche, senza i quali mezi è impossibile a intenderne umanamente parola; senza questi è un aggirarsi vanamente per un oscuro laberinto (Galilei, 1933c, p. 232).
Si tratta evidentemente di un presupposto metafisico, per il quale lo stesso Galilei si richiama al modello della filosofia di Platone, che nel Timeo aveva immaginato un “demiurgo” che costruisce l’universo secondo proporzioni matematiche. Seguendo la stessa ispirazione, Keplero crede che le leggi dei movimenti planetari rispecchino un’armonia matematica concepita da Dio. E anche Newton si richiama alla saggezza di un “Dio geometra” per giustificare la ricerca scientifica di leggi matematiche semplici e universali, capaci di descrivere e prevedere i fenomeni naturali.
50
fisica per filosofi
Questa dimensione metafisica, associata all’idea di creazione, svolge una funzione importante per l’affermazione della nuova scienza, ma in seguito rimarrà sullo sfondo, lasciando spazio a diverse giustificazioni dell’efficacia della matematica per la descrizione della natura. Tuttavia, bisogna ricordare che già gli scienziati citati, a dispetto delle proprie opinioni metafisiche, sottopongono ogni affermazione matematica a rigorose procedure di controllo sperimentale. La matematica, quindi, non è intesa come un linguaggio arcano, capace di trasmettere verità metafisiche tramandate dagli antichi filosofi pitagorici e platonici, ma come uno strumento d’indagine sperimentale. Galilei, ancora una volta, mostra una profonda consapevolezza della novità della nuova scienza rispetto alla speculazione metafisica, affermando che la conoscenza matematica permette all’intelletto umano di conoscere con la massima certezza soltanto alcune proprietà degli oggetti naturali – quelle quantitative, come posizione e velocità – senza comprendere la loro essenza: questa rinuncia a una conoscenza metafisica dell’essenza delle cose è una condizione della capacità della scienza di conoscere proprietà che appartengono a tutti i corpi, dalle particelle microscopiche fino ai più grandi e remoti corpi celesti. Il nesso tra l’uso della matematica e il metodo sperimentale, nella nuova scienza, è sovente espresso attraverso la stessa immagine del “libro della natura”, che va “letto” con l’esperienza, ed è contrapposto ai libri della tradizione, portatori di pregiudizi ed errori. Galilei la usa, appunto, per contrapporre il proprio metodo a quello degli aristotelici, che si rifanno all’autorità del maestro (ai “libri di carta”) piuttosto che sottoporre le proprie affermazioni all’esperienza. Anche il richiamo all’esperienza conosce fondamentali innovazioni nel xvii secolo. Prima di tutto Francesco Bacone (Francis Bacon) insiste sia sull’importanza di condurre osservazioni ripetute degli stessi fenomeni, sottolineando la rilevanza di procedure volte a eliminare ipotesi false e di avvicinarsi a quelle vere, sia sulla natura collettiva dell’impresa scientifica. In ciò il metodo sperimentale baconiano si contrappone al concetto di esperienza assunto da maghi e alchimisti medievali e rinascimentali, che non richiede protocolli di controllo delle teorie e permette di attingere a profondi segreti della natura, che il sapiente deve custodire gelosamente e tramandare in forma cifrata. Ma l’aspetto fondamentale della nuova metodologia fisica è la fusione tra metodo sperimentale e matematizzazione, sintetizzata dalla formula galileiana: «sensate esperienze» e «necessarie dimostrazioni» (Galilei,
fisica: linguaggio, termini e definizioni
51
1932, p. 316). L’indagine scientifica, per Galilei, non procede semplicemente con la raccolta di osservazioni. L’esperimento è preceduto dalla preparazione di schemi matematici, nei quali le proprietà del moto sono analizzate con rigore dimostrativo. L’esperienza, quindi, costituisce la messa alla prova di un’ipotesi matematica e delle deduzioni che da essa sono state tratte. Per esempio, poste alcune condizioni iniziali di un sistema fisico, si fa una previsione matematica sulle proprietà della caduta dei gravi; in seguito si osserva un caso concreto e – tenendo conto di tutte le condizioni (come l’altezza da cui cade il corpo, la sua forma, l’attrito dell’aria e così via) – si valuta se la descrizione matematica fatta in precedenza corrisponde ai fenomeni. La conoscenza scientifica, pertanto, possiede un aspetto puramente teorico, ma è sempre sottoposta al controllo sperimentale. Newton riprende questo modello nella sua “filosofia sperimentale”. Rispetto a Galilei, egli sottolinea maggiormente l’aspetto di costitutiva incertezza della conoscenza sperimentale che, tuttavia, in quanto basata sull’induzione (cioè, sulla generalizzazione delle osservazioni sperimentali), fornisce la sola verità che deve essere ammessa. La quarta delle sue “regole del filosofare”, nei Principi matematici della filosofia naturale, afferma: Nella filosofia sperimentale le proposizioni ricavate per induzione dai fenomeni, malgrado le ipotesi contrarie, devono essere considerate vere o rigorosamente o quanto più possibile, fino a che non si presentino altri fenomeni mediante i quali o sono rese più rigorose o fatte suscettibili di eccezioni (Newton, 1965, p. 607).
Se così non fosse, secondo Newton, qualsiasi ipotesi potrebbe opporsi indiscriminatamente alle conoscenze ricavate in precedenza dagli esperimenti. Il metodo sperimentale, così inteso, viene presto generalizzato e diviene un caposaldo del sapere scientifico. Gli scienziati cominciano allora a guardare con diffidenza la filosofia che non rispetta il criterio dell’induzione, considerandola come un sapere fondato su ipotesi ingiustificate, diverso da quello propriamente scientifico.
2 Meccanica classica Hypotheses non fingo. Isaac Newton
meccanica classica Spazio e tempo Spazio e tempo sono assoluti, omogenei, isotropi e indipendenti. Lo spazio è euclideo. Relatività galileiana Le leggi della meccanica hanno la stessa forma in tutti i sistemi di riferimento inerziali. Leggi di Newton 1. In un sistema inerziale un corpo non soggetto a forze esterne ha velocità costante. 2. In un sistema inerziale l’accelerazione di un corpo di massa m è proporzionale alla forza esterna applicata al corpo. La proporzionalità è tramite la massa inerziale: – F =m∙ā 3. In un qualunque sistema di riferimento, se esiste una forza fra due corpi, la forza esercitata dal primo sul secondo è uguale a meno la forza esercitata dal secondo sul primo. Legge di gravitazione universale Fra due corpi di massa gravitazionale m1 e m2 a distanza R si esercita una forza di attrazione F: F=G
m1 · m2 R2
dove G è la costante di gravitazione universale: G ≅ 6,67 · 10–11 Nm2/kg2
54
fisica per filosofi
2.1. La meccanica classica: introduzione La meccanica classica è la parte della fisica che si basa sui principi enunciati da Galilei, Cartesio, Newton e altri nel xvii secolo. Questi principi furono sviluppati successivamente con l’utilizzo del calcolo infinitesimale e le relative elaborazioni analitiche, principalmente da parte di Joseph-Louis Lagrange (1736-1813), Siméon-Denis Poisson (1781-1840) e William R. Hamilton (1805-1865). La meccanica classica, quindi, descrive il moto di oggetti dotati di massa e sottoposti a forze. In particolare, si parla di corpi rigidi – per esempio, sfere, sbarre, proiettili, corpi celesti e altri oggetti la cui descrizione non creava grossi problemi matematici – e del moto dei fluidi – per esempio, l’acqua che scorre – la cui trattazione matematica moderna avverrà a partire dal xviii secolo. Tra gli sviluppi successivi ci sarà il comportamento dei gas e degli oggetti “caldi” o “freddi”, che darà origine alla termodinamica, e lo studio dell’elettromagnetismo (inizialmente ritenuto effetto di moti di particelle o fluidi) che porterà all’introduzione delle forze di natura elettrica e magnetica. Tutte queste teorie costituiranno la cosiddetta “fisica classica”. In quasi tutti i libri di fisica si trattano in capitoli diversi le leggi della meccanica con la forza di gravità (che si esercita fra le masse dei corpi) e le leggi dell’elettromagnetismo (in cui la forza elettrostatica si esercita fra le cariche elettriche dei corpi). In realtà è solo una questione storicodidattica. Una volta introdotto il concetto di forza, e una volta che si sia scritta formalmente l’espressione della forza (sia gravitazionale o elettrica), non c’è nessuna differenza su come si debba utilizzare quest’ultima per ricavarne il comportamento del corpo. Il problema, semmai, può riguardare il formalismo più o meno avanzato che si decide di utilizzare. Tuttavia, in questo testo tratteremo l’elettromagnetismo dopo la meccanica e la termodinamica per semplicità e come premessa essenziale per la teoria della relatività speciale. Alla fine del xix secolo sorgeranno alcuni fatti inspiegabili, alla luce delle teorie esistenti e alcune incongruenze che daranno origine a due nuove teorie: la relatività speciale (1905), che risolverà le incongruenze dell’elettromagnetismo e i problemi legati al moto di corpi con velocità prossime a quelle della luce, e la relatività generale (1916), che darà una nuova visione degli effetti dovuti alla presenza di masse nello spazio. I problemi legati alla descrizione di corpi molto piccoli, di dimensioni atomiche, e del loro movimento, invece, verranno affrontati e risolti dalla meccanica quantistica in un percorso che, iniziato nel 1900, troverà la
meccanica classica
55
sua prima formalizzazione nel 1927, ma che ancora oggi continua a essere modificato e migliorato in seguito a nuovi risultati sperimentali e nuove elaborazioni teoriche.
2.2. Il primo principio della dinamica: il principio di inerzia Il primo principio della dinamica ci dice cosa succede a un corpo se questo è libero, cioè se a esso non è applicata alcuna forza (esterna). Un corpo non soggetto a forze esterne ha velocità costante (in un sistema di riferimento inerziale)1: – Fe = 0 ↔ v– = costante
L’oggetto di cui si parla è un corpo, un oggetto materiale, per il momento approssimato a un oggetto simmetrico e “piccolo”. Una piccola sfera, per semplificare2. È necessario, quindi, definire due termini: la “velocità” e la “forza”. Come detto nel par. 1.3, molte grandezze fisiche sono vettoriali. Nel corso del libro spesso semplificheremo il formalismo indicando solo il modulo. Per esempio, utilizzeremo solo v per la velocità senza scrivere l’espressione completa v–. 2.2.1. Definizione di velocità La velocità v ci dà una misura di quanto sia lo spazio percorso dal corpo in un certo tempo, cioè di quanto “velocemente” il corpo si sta spostando, e anche della direzione in cui si sta muovendo (in altre parole, la velocità è un “vettore”, concetto che raccoglie tutte queste informazioni). In formule, e per un moto in una sola direzione, per esempio la x, abbiamo (cfr. anche parr. 1.4.3-1.4.4): ∆x x − x v = ∆t = t2− t 1 2 1 Nota 1. La velocità dipende dal sistema di riferimento; è calcolata, infatti, tramite misure della posizione (x) in funzione del tempo (t) che dipendono dal sistema di riferimento rispetto a cui si fa la misura. La velocità è una grandezza relativa al sistema di riferimento in cui viene misurata.
56
fisica per filosofi
La velocità è un vettore (cfr. par. 1.3) scritto nella sua forma estesa così: v– = v ∙ ˆv Il primo principio ci dice che se non abbiamo forze esterne la velocità non cambia né in modulo né in direzione: F–e = 0 → v– = v ∙ ˆv = costante ⇒
{
v = costante: non cambia il modulo e ˆv = costante: non cambia la direzione
Nota 2. Un corpo che si muove con velocità costante si muove di moto rettilineo uniforme. Nota 3. Una velocità costante può essere anche uguale a zero. Il primo principio della dinamica è valido sia se v = 0 (ossia se il corpo è fermo), sia se v ≠ 0 (ossia se il corpo è in movimento), purché ovviamente tale velocità sia costante nel tempo. Un corpo fermo, quindi con velocità zero, è un caso particolare di moto rettilineo uniforme.
2.2.2. Definizione di forza Possiamo chiamare “forza” qualunque causa che produca una variazione dello stato meccanico di un corpo, definito (per ora) dalla sua posizione nello spazio al variare del tempo. Quindi, nell’ipotesi di applicare una forza esterna a un corpo: – se il corpo, che supponiamo puntiforme, sta fermo, allora comincia a muoversi con una certa velocità; – se il corpo, che supponiamo puntiforme, si sta muovendo, allora la sua velocità viene variata, o in modulo, o in direzione o in entrambi; – se il corpo è esteso, ma è bloccato da qualche vincolo, allora può deformarsi, cioè può dilatarsi o accorciarsi, o piegarsi, a seconda che la forza sia una trazione o una compressione, e può anche ruotare. Nota. Per “variazione dello stato” non si intende una variazione dello stato termico, ossia dei parametri di pressione, volume e temperatura (p, V, T) che definiscono lo stato termodinamico del sistema (cfr. par. 3.3.4).
meccanica classica
57
Quando si parla di “forze”, o meglio di “interazioni”3, si potrebbe pensare che le interazioni possibili siano molte, che magari alcune ci sono ignote, nel senso che abbiamo dei fenomeni che osserviamo ma che non sappiamo ricondurre ad alcuna delle interazioni conosciute. Non è esattamente così. Oggi sappiamo, nel senso che abbiamo verificato sperimentalmente, che le interazioni che coinvolgono qualunque oggetto del nostro universo sono solo cinque, riconducibili a quattro. Potrebbero essercene delle altre, ma al momento non abbiamo evidenze sperimentali o elaborazioni teoriche che ne prevedano di nuove. Questo non esclude che non possano esisterne di altre; diciamo che al momento sembra poco probabile. Le interazioni note sono le seguenti (cfr. tab. 2.1; cfr. anche par. 1.1.2): 1. tre interazioni a corto raggio4, che agiscono solo per distanze minori di quelle atomiche e che, quindi, sono nulle per distanze maggiori: a) l’interazione forte, una forza attrattiva che si esercita fra i quark (i quark sono sei particelle elementari con carica elettrica frazionaria; cfr. cap. 8) che si trovano, per esempio, all’interno di protoni e neutroni e che esiste tra gli stessi protoni e neutroni. L’interazione forte spiega, per esempio, come mai i protoni restino confinati all’interno del nucleo, senza che tutto “esploda” a causa della repulsione coulombiana. Il raggio tipico di questa interazione è di circa 10–15 m; b) l’interazione debole, che spiega i decadimenti radioattivi; per esempio, il cosiddetto “decadimento β” per cui un protone decade spontaneamente in un neutrone, un antielettrone e un neutrino. Ha un raggio di circa 10–18 m; c) l’interazione di Higgs, che spiega come mai alcune particelle hanno una massa. Dovrebbe avere un raggio d’azione inferiore a 10–18 m; 2. due interazioni a lungo raggio, che, cioè, continuano ad agire anche a grandi distanze: a) l’interazione gravitazionale, la forza di attrazione che si esercita fra corpi con massa; b) l’interazione elettromagnetica, una forza che può essere attrattiva o repulsiva e che si esercita fra i corpi dotati di una carica elettrica diversa da zero. Entrambe queste due interazioni dipendono da 1/R2, R essendo la distanza fra i due oggetti, e diminuiscono rapidamente per oggetti
58
fisica per filosofi
tabella 2.1 Interazioni note* Interazione
Intensità relativa
Andamento con la distanza R
Raggio d’azione
Interazione forte
1038
e–βR/R2
~ 10–15 m
Interazione elettromagnetica
1036
1/R2
∞
Interazione debole
1025
e–αR/R
~ 10–18 m
Interazione gravitazionale
1
1/R2
∞
Campo di Higgs
−
−
0 ÷ 10–18 m
* Sono illustrate con l’indicazione dell’intensità relativa, avendo assunto come 1 l’intensità dell’interazione gravitazionale (la più debole), dell’andamento con la distanza e del raggio d’azione, che per le interazioni elettromagnetica e gravitazionale è infinito. L’interazione elettromagnetica e quella debole sono state unificate come espressioni della stessa interazione.
lontani, ma non vanno mai completamente a zero, ossia non sono mai completamente nulle. I pianeti molto lontani dal Sole continuano a sentire la forza di attrazione di quest’ultimo (che è molto grande!) e a ruotarci intorno anche se sono distanti miliardi di chilometri. Nella fig. 2.1 abbiamo riportato, in funzione della distanza relativa, le intensità di due interazioni a cui sono sottoposti due protoni: quella forte (attrattiva) e quella elettromagnetica (repulsiva). Dal grafico si può capire quello che si intende quando si dice che le interazioni forti sono a corto raggio (la loro intensità diventa praticamente trascurabile per distanze appena dieci volte maggiori di quelle dei nuclei atomici) mentre le interazioni elettromagnetiche sono a lungo raggio (continuano a essere debolmente diverse da zero anche per distanze galattiche). Quindi, per qualunque oggetto macroscopico abbiamo solo due forze da considerare, quella gravitazionale e quella elettromagnetica, che hanno una sorgente ben precisa: corpi con massa oppure corpi con carica elettrica. Finora abbiamo parlato sempre di forze “esterne” (Fext). Questo presuppone che possano esistere anche delle forze “interne” (Fint) che non consideriamo. Le forze interne sono quelle che nascono e si eser-
meccanica classica
59
figura 2.1 Interazione forte ed elettromagnetica fra due protoni in funzione della distanza relativa 1014 Interazione forte: attrattiva Interazione e.m.: repulsiva Interazione repulsiva per r < 5 10–16 m
Forza (unità arbitrarie)
1010 106 102 10–2 10–6 10–8 10–16
10–15
10–14
10–13
10–12
Distanza (m) Intensità indicativa delle interazioni fra due protoni. Per distanze superiori a circa 10-14 m l’interazione elettromagnetica (repulsiva) è maggiore di quella forte. Al di sotto di circa 10-14 m e fino a 4 · 10-16 m l’interazione forte (attrattiva) prevale su quella elettromagnetica. I due protoni posso esistere in uno stato legato. Al di sotto di circa 4 · 10-16 m entra in gioco il principio di esclusione di Pauli (cfr. par. 7.2.4) che crea un nucleo repulsivo: i due protoni non possono più avvicinarsi.
citano internamente al corpo (che, dunque, non viene più considerato puntiforme): per esempio, quelle fra un atomo e l’altro in un corpo macroscopico. Queste forze sono sempre presenti, ma la loro somma vettoriale è nulla (questo sarà il terzo principio della dinamica che vedremo nel par. 2.4), perciò non contribuiscono alla forza totale che agisce sul corpo. L’espressione formalmente completa della forza totale che agisce su tutte le parti di un corpo è, allora, la somma delle forze interne e di quelle esterne: – – – – – FTOT = ∑ Fj = ∑ Fext + ∑ Fint = ∑ Fext j
Per semplicità, e dove sia chiaro che la forza di cui si parla è la somma di tutte le forze che agiscono su un corpo, scriveremo: – – – FTOT = ∑ Fext = F
60
fisica per filosofi
2.2.3. Rispetto a quale sistema di riferimento sono misurate le grandezze presenti nel primo principio della dinamica? Il sistema deve essere un sistema di riferimento inerziale, definito talvolta come un sistema in cui vale il primo principio della dinamica. Attenzione! Questa è una tautologia o, se vogliamo, un loop logico: definire il primo principio come un’asserzione che vale in un sistema inerziale, definendo poi il sistema inerziale come quello in cui vale il primo principio. Soluzione 1 (sperimentale) Si utilizza l’informazione sperimentale che tutte le interazioni conosciute diminuiscono con la distanza fra i corpi interagenti: infatti, le interazioni deboli o forti sono nulle a distanze maggiori di quelle interatomiche, le interazioni gravitazionali e quelle elettriche diminuiscono con il quadrato della distanza, quindi tendono ad annullarsi se aumenta a sufficienza la distanza fra i corpi che interagiscono. Dunque, se consideriamo un corpo abbastanza lontano da altri (per esempio, un corpo nello spazio intergalattico, non uno nel sistema solare, che è ancora troppo vicino al Sole) possiamo supporre con ottima approssimazione che le forze esterne agenti sul corpo siano nulle o trascurabili e possiamo fare un test per vedere se il sistema di riferimento che stiamo considerando sia o no inerziale (per una discussione su questo punto delicato, cfr. Bridgman, 1961; Kittel, Knight, Ruderman, 1970). Tanto per avere un’idea: si consideri che la distanza media fra due galassie è dell’ordine di circa 3 ∙ 106 anni luce (un anno luce ≅ 9,461 ∙ 1015 m). Supponiamo di mettere fra due galassie una massa m di 1 kg, e che questa massa sia sottoposta alla forza di gravità causata da tutta la massa di una sola galassia. A questa distanza la massa m sarebbe attirata dalla galassia con una forza di circa 3 ∙ 10–13 N. Il calcolo è questo: Mgalassia ~ 1 ∙ 1042 kg F(G, m) = G
42 MG ∙ m –11 1 ∙ 10 ∙ 1 ~ 6,7 ∙ 10 ~ 3 ∙ 10–13 N 2 ∙ 1044 R2
Questa forza corrisponderebbe (sulla Terra) alla seguente variazione di massa: ∆m =
F(G, m) 3 ∙ 10−13 ≈ 3 ∙ 10−14 kg = g 9,8
meccanica classica
61
figura 2.2 Test sperimentale per verificare se un sistema di riferimento è inerziale z mz x
mx
my
y
Ecco lo schema di un principio di un sistema di riferimento cartesiano su cui fare un test su tre masse mx, my, e mz lanciate rispettivamente nella direzione dei tre assi (x, y, z), e una per volta, per verificare se il sistema sia o no inerziale. È necessario che il sistema di riferimento sia abbastanza lontano da ogni sorgente di forza per supporre che la forza esterna totale sia nulla. Le tre masse, lanciate una per volta, dovranno muoversi di moto rettilineo uniforme, quindi con velocità costante, lungo i tre assi cartesiani.
Tale variazione è praticamente trascurabile per un corpo di 1 kg, quindi possiamo dire che il corpo è praticamente isolato. Il test sperimentale per vedere se ci troviamo in un sistema di riferimento inerziale (cfr. fig. 2.2) consiste in questo: prendiamo tre masse mx, my e mz che vengono lanciate – una per volta – con vx, vy, vz ≠ 0 a partire dall’origine e in direzione dei tre assi x, y, z. Se le tre masse mantengono costante la loro velocità in direzione e modulo allora il sistema di riferimento è inerziale. Si potrebbe obiettare che il test è in pratica irrealizzabile perché la situazione sperimentale di porre solo un sistema di riferimento nello spazio intergalattico non ha senso. Tuttavia, questo test può essere fatto anche in presenza di forze esterne, purché note: per esempio, sulla Terra dov’è presente la forza di gravità. È sufficiente tener conto del moto che avrebbe il corpo se le forze fossero nulle. Sembra macchinoso, ma l’importante è prevedere una procedura non ambigua per tener conto di eventuali forze esterne; se poi i calcoli saranno molto complicati, questo è un altro problema. È quello che faceva Galilei quando lanciava le sue sfere su un tavolo molto liscio e orizzontale: il fatto di operare in direzione orizzontale gli permetteva di asserire che la forza di gravità, che si esercita in direzione verticale, non influiva sul moto orizzontale del corpo su cui Galilei faceva le sue osservazioni e che, quindi, risultava “libero”, a parte la forza di attrito.
62
fisica per filosofi
Soluzione 2 (approssimata ma semplice) Si assume che esista almeno un sistema di riferimento inerziale, che per il momento – cioè, se vogliamo descrivere il moto di qualunque corpo sulla Terra o all’interno del sistema solare – possiamo identificare come un sistema di riferimento che ha l’origine nel Sole e gli assi diretti secondo le stelle fisse. Soluzione 3 (elegante) Per un sistema di riferimento qualsiasi lo spazio è disomogeneo e anisotropo. Si pensi, per esempio, a un sistema di riferimento ruotante (come quello solidale a una giostra in movimento). Un corpo al centro sarebbe fermo, mentre un corpo in un punto qualunque della piattaforma – non sottoposto ad alcuna forza esterna – non potrebbe essere sempre in quiete: anche se la sua velocità fosse nulla a un certo istante, comincerebbe a muoversi all’istante successivo, per lui il tempo non sarebbe omogeneo. Analogamente lo spazio sarebbe disomogeneo: il corpo in punti a distanza differente dal centro della giostra sentirebbe forze diverse. «Ma si può trovare sempre un sistema di riferimento rispetto al quale lo spazio è omogeneo e isotropo e anche il tempo è omogeneo» (Landau, 1971, p. 14). Un sistema di questo genere lo chiamiamo “inerziale”. In un sistema inerziale, dunque, un corpo libero (quindi, che non è soggetto ad alcuna interazione esterna) in quiete in un certo istante, resta in quiete infinitamente a lungo. Il punto è aver definito l’esistenza di almeno un sistema in cui lo spazio e il tempo sono omogenei e isotropi. Applicando poi queste caratteristiche dello spazio e del tempo alle leggi generali della meccanica risulta che in un sistema inerziale la velocità di un corpo non soggetto a forze è costante. Questo modo di ragionare implica un rivolgimento delle ipotesi iniziali: si scrivono le leggi generali del moto con alcune ipotesi. Si postula l’esistenza di almeno un sistema inerziale. Se ne deduce la legge di inerzia. 2.2.4. Un altro modo di scrivere il primo principio della dinamica La velocità è stata scritta come la variazione della posizione di un corpo in un certo intervallo di tempo diviso per questo intervallo di tempo. Analogamente si può definire la grandezza accelerazione come la varia-
meccanica classica
63
zione della velocità di un corpo in un certo tempo diviso per questo intervallo di tempo (cfr. anche par. 1.4.5). Quindi: ∆v- v-(t ) − v-(t ) v- − v = ∆t = 2t − t 1 = t2 − t 1 2 1 2 1 Il primo principio della dinamica afferma che un corpo non soggetto a forze esterne ha velocità costante. Se la velocità è costante, allora: v–2 = v–1, la variazione di velocità sarà perciò nulla: v- − v0 v–2 − v–1 = 0. Quindi: = 2 1 = t2− t1 t2− t1 da cui: = 0, che possono generalizzare: ā = 0 Il primo principio della dinamica riscritto è: Un corpo non soggetto a forze esterne ha accelerazione nulla – Fe = 0 ↔ ā = 0
Percorso storico-filosofico 2. Spazio, movimento naturale e inerzia I concetti fondamentali della meccanica classica come spazio, tempo e movimento inerziale sono solitamente introdotti secondo una risistemazione della fisica di Newton, che con poche modifiche è rimasta alla base dell’insegnamento della fisica classica. Questo modo di presentare le cose non rende conto di come questi concetti si sono formati nella fisica moderna, attraverso un fondamentale e complesso lavoro di ripensamento concettuale della scienza precedente che ha coinvolto molti scienziati e filosofi. Per comprendere questo mutamento concettuale bisogna considerare come punto di partenza la cosmologia e la fisica di Aristotele, che costituirono lo sfondo teorico rispetto a cui Galilei, Cartesio e altri dovettero impegnarsi per porre l’astronomia copernicana e la meccanica alla base di una nuova filosofia naturale. Nella scienza aristotelica manca del tutto il concetto dello spazio omogeneo e isotropo, di grandezza infinita, che in Newton costituisce una condizione per definire il movimento. L’universo aristotelico è sferico e limitato, e in esso i luoghi sono
64
fisica per filosofi
definiti dalla presenza di corpi. È strutturato secondo sfere concentriche suddivise in due regioni: quella celeste, in cui si muovono i corpi celesti (stelle, pianeti, Sole e Luna) e quella sublunare, in cui si muovono i corpi che incontriamo vicino alla Terra. Oltre la sfera più esterna, quella delle stelle fisse, non esiste nulla. Aristotele, quindi, non contempla l’idea di uno spazio vuoto. Per quanto riguarda il movimento dei corpi inanimati, Aristotele lo concepisce come una disposizione intrinseca dipendente dagli elementi di cui sono costituiti i corpi. I corpi celesti sono fatti di un materiale immutabile chiamato “etere”, il cui movimento naturale è circolare e infinito: in questo modo Aristotele spiega il movimento dei corpi celesti lungo sfere, quale era concepito dall’astronomia di origine tolemaica. La regione sublunare è composta, invece, di quattro elementi – terra, fuoco, aria e acqua – ciascuno dei quali tende per sua natura a raggiungere un proprio “luogo naturale” con un moto rettilineo e finito: per esempio, l’elemento terra tende a cadere verso il basso, per ricongiungersi con il centro della Terra, dove si ferma, mentre il fuoco tende a muoversi verso l’alto. Questi movimenti naturali si iscrivono in un ordine finalistico dell’universo e non necessitano di essere spiegati mediante cause esteriori. I movimenti dei corpi che non seguono le direzioni naturali, al contrario, richiedono una sollecitazione esterna e si chiamano perciò “moti violenti”. Essi hanno una durata limitata, al termine della quale i corpi tornano al loro moto naturale. Un esempio è il moto di una pietra (che si considera composta di terra): se la si scaglia in aria essa per un certo tempo si muove verso l’alto (moto violento), per poi tornare a cadere verso il centro della Terra (moto naturale). Lo spazio in cui si definiscono questi movimenti, quindi, non è omogeneo né isotropo, perché il movimento dei corpi dipende dalla loro posizione e dalla direzione in cui si stanno muovendo. Un passaggio fondamentale per il superamento di quest’antica concezione fu la difesa dell’astronomia copernicana. Questa, infatti, presenta una nuova efficace spiegazione dei fenomeni celesti introducendo delle novità inconcepibili per la fisica aristotelica. Tra queste, ci interessa qui considerare quella del movimento di rotazione della Terra, la cui difesa portò Galilei a elaborare una prima formulazione del concetto di inerzia. Gli aristotelici del suo tempo obiettavano che, se veramente la superficie terrestre ruotasse a grande velocità come prevede la teoria copernicana, allora dovremmo percepire un violento spostamento rispetto all’aria e gli oggetti lanciati dalla terra in aria in
meccanica classica
65
direzione verticale dovrebbero cadere in un punto diverso da quello di partenza. A questa obiezione Galilei, nel Dialogo sopra i due massimi sistemi del mondo del 1632 (cfr. Galilei, 1933a), risponde affermando che tutto quel che si trova sulla superficie terrestre condivide il moto rotatorio, il quale pertanto non è percepibile. Questa concezione galileiana nasce da un’analogia tra la superficie della Terra e il sistema di riferimento definito da una nave, al cui interno non ci accorgiamo della differenza tra quiete e movimento uniforme. Galilei, dunque, considera la questione del sistema di riferimento terrestre alla luce della sua teoria della relatività del movimento. Come in una nave tutti gli oggetti che ci appaiono immobili si muovono con la stessa velocità della nave e cadono verticalmente, così avviene sulla Terra. In base a quest’analogia, Galileo può concepire in modo nuovo il moto di un corpo lanciato orizzontalmente sulla superficie terrestre, considerandolo come una composizione di un moto inerziale e di uno violento: il corpo conserva la velocità orizzontale impressa, mentre al tempo stesso cade in basso per il proprio naturale moto di caduta, con il risultato di descrivere una parabola. In questa concezione conquistata da Galileo, però, manca ancora un importante elemento, che sarà necessario per definire l’inerzia come farà Newton. Per Galileo il moto inerziale sembra essere quello su una curva equidistante rispetto alla superficie terrestre: si tratterebbe, quindi, di un’inerzia “circolare”. Negli scritti galileiani si trovano anche alcuni passi in cui si afferma che il moto rettilineo è uno stato che si conserva all’infinito, come sarà il caso dell’inerzia rettilinea, ma non sembra che Galilei chiarisse fino in fondo questa forte differenza tra i due concetti, essendo interessato a risolvere i concreti problemi astronomici e meccanici con cui aveva a che fare piuttosto che a formulare leggi generali di natura. Un chiarimento filosofico sul concetto galileiano di inerzia si trova in filosofi contemporanei come Cartesio e Pierre Gassendi, sostenitori di una nuova filosofia corpuscolare. Cartesio formula una «prima legge di natura», secondo cui «ciascuna cosa, presa in particolare, persevera nello stesso stato fino a che l’incontro con altre non la costringe a cambiarlo» (Cartesio, 2009a, p. 257). Nel caso del movimento, «se sarà in quiete, non crediamo che essa comincerà mai a muoversi, a meno che non sia spinta a ciò da una qualche causa. Né v’è ragione di ritenere, nel caso in cui essa si muova, che mai interrompa il proprio movimento spontaneamente, senza essere impedita da alcunché d’altro»; a questo aggiunge, come «seconda legge di natura», che «ogni movimento è
66
fisica per filosofi
di per sé rettilineo» (Principi della filosofia; Cartesio, 2009b, pp. 189, 1811). Nel complesso, Cartesio ha formulato quella che sarà chiamata da Newton “legge di inerzia”. La giustificazione cartesiana di questa legge è duplice: metafisica ed empirica. Prima di tutto Cartesio afferma che la costanza dello stato dipende dall’immutabilità di Dio, che ha creato e mantiene in essere l’universo con un atto che, in virtù della perfezione divina, non può mai modificarsi. Pertanto gli stati di quiete o moto rettilineo di un corpo si conservano fintanto che un altro corpo non intervenga a modificarli, sempre secondo le leggi di natura. Questo ragionamento è un esempio di come i fondatori della meccanica classica invocavano spesso concetti e argomenti metafisici, che a partire dal xviii secolo sarebbero stati quasi sempre abbandonati dai fisici. L’inerzia ha poi un riscontro sul piano empirico: si osserva, infatti, che un sasso lanciato da una fionda, che si fa ruotare per prendere velocità, appena lasciato libero si muove di moto rettilineo, che poi viene deviato dalla gravità. Si pone, però, un problema: rispetto a che cosa si definisce il movimento inerziale? E come si può affermare che nel vuoto potrebbero esservi movimenti rettilinei infiniti, di cui all’epoca sembrava impossibile fare esperienza? Di fronte a questa questione Cartesio esita, poiché talvolta definisce il movimento come traslazione rispetto a un luogo, ma poi afferma che tale traslazione è sempre relativa ad altri corpi: insomma, Cartesio ha difficoltà a distinguere moto relativo e moto assoluto, perché non ammette l’esistenza di uno spazio assoluto. Sostiene, infatti, una concezione corpuscolare secondo cui ogni parte dell’universo è piena di materia, in cui ogni moto è relativo e non esiste il vuoto. Gassendi incontra una simile difficoltà, secondo cui una pietra posta nel vuoto si muoverebbe in eterno con un infinito movimento uniforme e in linea retta, ma questa situazione è puramente ideale. Gassendi, peraltro, mantiene ancora la tesi aristotelica secondo cui esistono moti circolari naturali. Per giungere alla formulazione newtoniana dell’inerzia servirà, dunque, il concetto di uno spazio omogeneo, isotropo e infinito, che esista indipendentemente dalla materia, come sistema di riferimento assoluto in cui è concepibile un movimento rettilineo nel vuoto che non avrebbe fine. Grazie alla definizione di questo movimento inerziale diventa anche possibile definire il “cambiamento di movimento” a cui si riferisce la seconda legge della dinamica, cioè l’accelerazione che chiama in causa l’azione di una forza.
meccanica classica
67
2.3. Il secondo principio della dinamica Il secondo principio della dinamica ci dice cosa succede se la somma delle forze applicate a un corpo è diversa da zero. La somma delle forze (esterne) applicate a un corpo è uguale al prodotto della massa del corpo per la sua accelerazione – F =m∙ā
Scriveremo meglio questa formula, così è incompleta. L’oggetto cui essa si riferisce è, per ora, un singolo corpo, che per semplicità consideriamo con estensione nulla. Una piccolissima sfera, tanto per fissare le idee. – – F è la somma delle forze (esterne) che agiscono sul corpo in esame; – m è la sua massa; – ā è l’accelerazione del corpo. Si ricorda che la somma delle forze interne è sempre uguale a zero – (cfr. par. 2.2.2); quindi, d’ora in poi scrivendo F per un corpo si intenderà la somma delle forze esterne. Le forze esterne e l’accelerazione devono essere misurate rispetto a un sistema inerziale; la massa, invece, è una grandezza indipendente dal sistema di riferimento in cui la si misura. 2.3.1. Definizione classica di massa La massa è una delle proprietà che possiamo associare a un qualunque oggetto fisico. Attenzione, abbiamo scritto “possiamo”: ciò vuol dire che non necessariamente ogni oggetto fisico sarà dotato di una massa. Questo aspetto verrà chiarito nel xx secolo con la scoperta del fotone, che ha massa zero, e con gli sviluppi della meccanica quantistica. Per il momento assumiamo il punto di vista della fisica classica e diciamo che ogni oggetto fisico, quindi ogni corpo – microscopico o macroscopico – ha una massa m. Se il corpo non è “elementare” la sua massa sarà uguale alla somma delle masse delle parti di cui è composto, cioè delle masse degli elettroni, dei protoni e dei neutroni. Con il che si è spostato il problema su come definire la massa di queste particelle. La definizione può venire dal secondo principio: la massa è una misura dell’inerzia del corpo, ossia della difficoltà a spostare il corpo, a variarne la sua velocità5.
68
fisica per filosofi
La massa di un corpo è una grandezza costante, se non ci sono interazioni con l’esterno del corpo. Ma, attenzione, un corpo può perdere massa verso l’esterno (una macchina che consuma benzina) o acquistare massa dall’esterno (una valanga). 2.3.2. Come leggere F = m ∙ a 1. L’accelerazione di un corpo a è proporzionale alla forza F applicata (e viceversa): F a= m
“Proporzionale” vuol dire che – per esempio – se raddoppio la forza raddoppierà l’accelerazione. Viceversa, se l’accelerazione si dimezza, vuol dire che è stata impressa una forza che è la metà. 2. La relazione di proporzionalità diretta fra forza e accelerazione è tramite la grandezza “massa”, caratteristica del corpo di cui si sta parlando. 3. La relazione è vettoriale: – F =m∙ā Quindi, l’uguaglianza non è solo fra i moduli (i “numeri” di sinistra e quelli di destra), ma anche fra i versori (la “direzione” del vettore a sinistra e di quello a destra). – Scrivere: F = m ∙ ā equivale a scrivere: F ∙ Fˆ = m ∙ a ∙ â. Il che corrisponde a scrivere due relazioni che devono essere contemporaneamente vere: F=m∙a cioè, il numero della forza è uguale al numero della massa moltiplicato per il numero dell’accelerazione, e: Fˆ = â vale a dire, la direzione della forza è uguale alla direzione dell’accelerazione ā.
meccanica classica
69
3. Scriviamo la relazione utilizzando la definizione di accelerazione in funzione della variazione di velocità (cfr. par. 1.4.5): – a- = dv , quindi, possiamo scrivere: F = m ∙ dv dt dt Questa relazione è vera, ma solo se si suppone che la massa m rimanga costante durante il moto, cosa che non è sempre vera. Per considerare anche il caso in cui m possa variare portiamo m “dentro” la variazione (è un’operazione che si può fare, ma, attenzione, ora avremo una formula diversa). Avremo: –
F=
d(m ∙ v-) Questo è già un passo avanti, ma si può fare di meglio. dt
2.3.3. Definizione di quantità di moto La quantità di moto di un corpo è il prodotto della sua massa per la sua velocità. È un vettore che ha la stessa direzione di vˆ e il modulo uguale al prodotto m ∙ v: ˉp = m ∙ ˉv Se il corpo è esteso, come velocità si considera quella del centro di massa, o baricentro. Quindi, il secondo principio della dinamica lo potremo scrivere così: –
F=
dpdt
– Questa forma è più completa della forma F = m ∙ ā. Questa, infatti, possiamo scriverla come: dv- - dm – dp- d(m ∙ v-) F= = =m +v dt dt dt dt cioè, la forza F può essere legata a una variazione della velocità del corpo e/o a una variazione della massa del corpo. Ma anche la velocità è composta da due termini (modulo e direzione): ˉv = v ∙ vˆ Quindi, la formula completa diventa:
70
fisica per filosofi d(v ∙ ˆv) - dm dvˆ dv - dm – dpF= =m =m∙v +v + m ∙ v+v dt dt dt dt dt dt
Abbiamo, pertanto, tre termini la cui causa deve essere una forza – F ≠ 0: 1. m ∙ v(dvˆ/dt) ci dice che serve una forza per modificare la direzione della velocità; 2. m ∙ ˆv(dv/dt) ci dice che serve una forza per modificare il modulo della velocità; 3. ˆv(dm/dt) ci dice che serve una forza per variare la massa del corpo. Queste tre relazioni si possono leggere anche nel senso inverso; per esempio, la terza ci dice che se varia la massa di un corpo – se, per esempio, la massa diminuisce – allora avremo una forza verso l’esterno (si pensi all’aereo a reazione, che emette “combustibile” verso l’esterno avendo esercitato una forza su di esso – all’indietro – e viene perciò spinto in avanti).
2.3.4. Nota 1. Perché è importante usare la forma del secondo principio della dinamica in cui c’è la quantità di moto ˉp Questo paragrafo fa riferimento ad alcune nozioni che verranno discusse nei parr. 5.8.3 e 7.1.3; è utile, tuttavia, introdurre ora alcuni aspetti derivanti dagli sviluppi della meccanica classica. Il secondo principio della dinamica, scritto in funzione della massa m, perde significato se m = 0, cioè nel caso di un oggetto fisico con massa nulla. Questo non creava problemi a Newton o a Galilei non essendo allora previsti da nessuna teoria oggetti fisici con massa nulla. Ma agli inizi del Novecento, con la meccanica quantistica, viene “scoperto” il fotone (la particella di massa nulla che trasporta il campo elettromagnetico): un oggetto che viaggia sempre alla velocità della luce. Questo “oggetto” strano, il fotone, pur avendo massa nulla, trasporta energia (il Sole ci scalda!) e ha una quantità di moto. Com’è possibile, però, che un fotone abbia una quantità di moto diversa da zero se ha massa nulla? Il fatto è che in relatività la definizione di “quantità di moto” verrà modificata rispetto a quella semplice data in meccanica classica. In relatività la quantità di moto di un corpo si esprimerà così: E ∙ vp- = 2 dove E è l’energia totale del corpo, v– la sua velocità, e c è la velocità c
della luce nel vuoto.
meccanica classica
71
Così se abbiamo un fotone di energia E che viaggia nel vuoto, quindi con velocità c, la sua quantità di moto sarà: E p- = ĉ dove ĉ è la direzione in cui viaggia il fotone, cioè la luce. E se il fotone c
con quantità di moto incide su una superficie riflettente (uno specchio) e torna indietro, la sua quantità di moto varierà di ∆p ˉ = 2p ˉ0. Tale variazione sarà stata causata da una forza, quella esercitata dallo specchio. E la forza esercitata dallo specchio sul fotone sarà uguale e contraria alla forza esercitata dal fotone sullo specchio (cfr. par. 2.4). Questo meccanismo è il principio di funzionamento delle vele solari utilizzate per far viaggiare gli oggetti all’interno del sistema solare.
2.3.5. Nota 2. Cosa succede se un corpo non è a simmetria sferica, oppure non è “piccolo”? Finora abbiamo considerato corpi puntiformi, quindi ideali, per semplificare la trattazione. Se un corpo ha una certa estensione spaziale, oppure se è asim– metrico – come accade con tutti i corpi reali – si ha che la legge F = m ∙ ā continua a valere, ma viene riferita a un punto particolare del corpo, o esterno al corpo: il centro di massa (o baricentro). Si ricordi che il centro di massa di un corpo non necessariamente appartiene al corpo: in un anello si trova al centro, dove non c’è materia. Per un saltatore che salta con lo stile Fosbury il centro di massa si trova sempre sotto l’asticella, che però viene superata da tutto il corpo. Il centro di massa, dunque, si muoverà seguendo una traiettoria definita dal secondo principio della dinamica. Poi il corpo potrà avere altri moti più complicati; per esempio, potrà ruotare intorno a sé stesso, oppure potrà vibrare come una molla. Tutti moti governati da altre equazioni che si aggiungono (non si sostituiscono) al secondo principio della dinamica applicato al centro di massa del sistema.
2.3.6. Nota 3. Non tutte le grandezze sono sommabili aritmeticamente La velocità, lo spostamento (in una sola direzione) e la massa sono grandezze che si possono sommare. Se ci spostiamo di x1 = 2 m e poi di x2 = 3 m lungo una retta, in totale ci saremo spostati di x = x1 + x2 = 5 m. Se abbiamo due masse m1 = 2 kg e m2 = 3 kg e le mettiamo insieme, in totale avremo una massa m = m1 + m2 = 5 kg. Se abbiamo dei vettori vale la stessa cosa: alcuni si sommano con le regole della somma vettoriale (spostamenti, velocità, forze ecc.), altri seguono regole più complicate.
72
fisica per filosofi
Per la temperatura, invece, è diverso: se abbiamo due litri di acqua, uno alla temperatura di 20 °C e un altro a 100 °C e li mettiamo insieme, non avremo due litri di acqua a 120 °C, ma due litri di acqua a T = (20 + 100)/2 = 60 °C: le temperature non si sommano.
2.4. Il terzo principio della dinamica Il terzo principio della dinamica ci dice cosa succede quando abbiamo due corpi che interagiscono. Quando due corpi interagiscono, la forza che il primo corpo esercita sul secondo è uguale e opposta a quella che il secondo corpo esercita sul primo: – – F2,1 = –F1,2.
Si parla di due corpi, il corpo 1 e il corpo 2, che interagiscono tramite una forza. – – Il simbolo F 2,1 (F 1,2) indica la forza che il corpo 1 esercita sul corpo 2 (la forza che il corpo 2 esercita sul corpo 1). Nella fig. 2.3 abbiamo l’esempio nel caso che la forza sia attrattiva. Il terzo principio dice che i moduli, cioè i numeri che esprimono l’intensità delle due forze di interazione, sono uguali, e che le due forze hanno stessa direzione ma verso contrario. Attenzione! Si fa l’ipotesi che le due forze siano misurate nello stesso istante. Questa ipotesi non sarà sempre vera: in relatività si modificherà il concetto di simultaneità, quindi la terza legge della dinamica in generale sarà vera solo dopo un certo tempo a partire da quanto è iniziata l’interazione. La modifica è richiesta per tener conto del fatto, stabilito nella teoria della relatività, che i segnali (quindi anche le interazioni) non figura 2.3 Forza attrattiva tra due corpi
2
1 – F1,2
– F2,1
– – Il simbolo F 2,1 (F 1,2) indica la forza che il corpo 1 esercita sul corpo 2 (la forza che il corpo 2 esercita sul corpo 1).
meccanica classica
73
possono trasmettersi a velocità maggiori di quella della luce c nel vuoto. Questo vuol dire che se il corpo 1 si sposta o si modifica, il suo effetto sul corpo 2, che si trova a distanza R dal primo, non potrà avvenire prima del tempo tc necessario alla luce per percorrere la distanza R: t ≥ tc = R/c. Pertanto, la terza legge è valida solo dopo aver aspettato il tempo necessario perché i sistemi si scambino le interazioni. Questo tempo può essere al minimo tc, ma anche molto maggiore, dipende dal mezzo in cui si trasmetterà l’interazione e dal tipo di interazione. Nota 1. Il terzo principio della dinamica riguarda le forze di interazione fra i due corpi presi in esame. Questo non vuol dire che non vi possano essere altre forze, anche diverse, agenti sui due corpi. Per esempio, se il corpo 1 avesse una carica elettrica, e se nelle vicinanze ci fosse un terzo corpo con una carica elettrica, il corpo 1 sentirebbe anche la forza di interazione elettrica, mentre il corpo 2, se fosse elettricamente neutro, non la sentirebbe. Nota 2. Questo principio è vero sempre, non è necessario che ci si trovi in un sistema inerziale, a differenza del primo e del secondo, che sono validi solo in un sistema di riferimento inerziale.
2.4.1. Un principio di conservazione ricavato dal terzo principio della dinamica Supponiamo che due corpi 1 e 2 siano soggetti solo alle due forze di interazione reciproca, quindi che non ci siano altre forze che agiscono su di essi. Possiamo scrivere il secondo principio per tutti e due i corpi, ricordan– do che il simbolo F 1,2 indica la forza esercitata dal corpo 2 sul corpo 1: dp– – F 1,2 = m1 ∙ ā1 o, meglio: F1,2 = 1 dt dp– E ancora: F 2,1 = m2 ∙ ā2 o, meglio: F–2,1 = 2 dt Ora, se sommiamo membro a membro le relazioni appena illustrate avremo: dp- dp– – F1,2 + F2,1 = 1 + 2 dt dt – – Ma, per il terzo principio della dinamica: F 1,2 = −F 2,1
74
fisica per filosofi
Quindi, il termine a sinistra è nullo, essendo le due forze uguali e contrarie; il termine a destra rappresenta semplicemente la somma delle due quantità di moto, dunque la quantità di moto totale ˉpT del sistema: 0=
dp-1 dp-2 d - - dp-T (p + p )= = + dt dt dt 1 2 dt
Se la derivata di ˉpT è nulla, vuol dire che la variazione di ˉpT nel tempo è zero; questo implica che la grandezza sia costante (cfr. par. 1.4.4): 0=
dp-T ↔ pT = costante nel tempo dt
Questa relazione è valida se non esistono altre forze oltre a quelle di interazione fra le varie parti del sistema, quindi se il sistema è isolato. Un altro modo di enunciare il terzo principio della dinamica è, quindi: In un sistema isolato la quantità di moto totale si conserva (è costante nel tempo).
2.5. Relatività e invarianza galileiane Una trasformazione di coordinate è un insieme di relazioni che permettono di passare dal valore delle coordinate (della posizione a un certo istante) di un punto in un certo sistema di riferimento al valore delle coordinate che lo stesso punto assume in un altro sistema di riferimento. In generale la trasformazione è definita fornendo le relazioni che permettono di passare dai valori (x, y, z, t) che forniscono la posizione nello spazio e nel tempo di un punto P in un sistema di riferimento O, ai valori (x’, y’, z’, t’) che descrivono lo stesso punto nel sistema O’.
2.5.1. Trasformazioni galileiane Una trasformazione galileiana è una trasformazione di coordinate che permette di passare da un sistema di riferimento inerziale a un altro sistema che abbia una velocità V costante rispetto al primo, quindi inerziale per definizione.
meccanica classica
75
Facciamo un esempio: consideriamo il caso particolare di due sistemi O(x, y, z, t) e O’(x’, y’, z’, t’), in cui le origini O e O’ e gli assi x, y, z e x’, y’, z’ coincidano all’istante t = 0, e in cui uno dei due, (O’), si muova di moto rettilineo uniforme rispetto all’altro, (O), con velocità V, in direzione x. Assumiamo che le posizioni di O e di O’ coincidano al tempo t = t’ = 0. Data l’ipotesi di un “tempo assoluto” che vale per tutta la meccanica classica (Δt = Δt’), se le origini dei tempi misurati nei due sistemi di riferimento coincidono, allora si avrà che anche i tempi saranno uguali (t = t’). La posizione del punto P, a un certo istante t = t’ sarà x rispetto a O e x’ rispetto a O’ (x = OP, x’ = O’P); inoltre si ha che l’origine O’ al tempo t si sarà spostata verso destra di: OO’ = V · t. Quindi, dato che OP = OO’ + O’P, si avrà che x = V · t + x’ (cfr. fig. 2.4). Le coordinate y e z rimangono invariate dato che il moto avviene solo in direzione x. Le trasformazioni per passare dal sistema O’(x’, y’, z’, t’) al sistema O(x, y, z, t), e viceversa, sono quindi:
{
{
x = x’ + V · t y’ = y e z’ = z t’ = z
x’ = x – V · t y = y’ z = z’ t = t’
Dalle trasformazioni di coordinate possiamo ricavare le leggi di trasformazione per le altre grandezze; per esempio, per la velocità: dalla trasformazione x = x’ + V · t, derivando rispetto al tempo t, si ottiene: dx = dx’ d (V · t) da cui: dx = dx’ + V quindi, v = v’ + V (scritta + dt dt’ dt dt dt con i soli moduli); in generale si avrà: – v– = v–’ + V Le velocità, dunque, si sommano secondo la seguente formula: v[P(O)] = v’[P(O’) + V [O’O] Derivando ulteriormente, otteniamo la formula per la trasformazione delle accelerazioni: – dv-’ a- = dv = d (v- + V ) = = a’ dt dt dt
76
fisica per filosofi
figura 2.4 Schema di due sistemi di riferimento in moto relativo y
y’ V
t
t’
P O
O’ Vt
O
x’
x
x’ O’’
P
x Gli assi z e z’ passano per O, O’ e sono perpendicolari al foglio, perciò non sono stati disegnati. Il sistema O’(x’, y’, z’, t’) ha una velocità costante V in direzione x rispetto al sistema O(x, y, z, t). Si suppone che all’istante t = t’ = 0 i due sistemi siano coincidenti, dunque con O ≡ O’. La lunghezza OP è uguale alla somma del segmento OO’ con il segmento O’P, quindi x = V · t + x’.
Da essa si vede che, mentre le velocità cambiano nei due sistemi di riferimento (la velocità, quindi, è relativa al sistema di riferimento), le accelerazioni sono le stesse. Anche in questo caso la relazione completa fra le accelerazioni è quella vettoriale: ā = ā’ Come si trasforma la forza passando da un sistema di riferimento – all’altro? Dall’ipotesi di relatività (cfr. infra) abbiamo che F ’ = m’ ∙ ā’ ma la massa è indipendente dalla velocità e dal sistema di riferimento, quindi m = m’. Dalla relazione su mostrata abbiamo, inoltre, che ā = ā’, perciò: – – F ’ = m’ ∙ ā’ = m ∙ ā = F cioè, le forze, misurate in due sistemi di riferimento inerziali, sono uguali: – – F’ = F
meccanica classica
77
Gli osservatori di tutti i sistemi di riferimento inerziali misureranno perciò le stesse forze e le stesse accelerazioni: la fisica è la stessa. Nel Dialogo sopra i due massimi sistemi del mondo (cfr. Galilei, 1933a), Galilei narra il famoso esperimento mentale in cui due persone, chiuse nella stiva di una nave, fanno una serie di esperimenti, nessuno dei quali è in grado di mostrare se la nave stia ferma o si stia muovendo con velocità costante rispetto alla Terra. Questa osservazione contiene in nuce il principio di relatività galileiana che oggi enunciamo così: Le leggi della fisica hanno la stessa forma in tutti i sistemi di riferimento inerziali.
Per “forma” si intende la forma algebrica e il significato dei termini. Quindi, per esempio, in un qualunque sistema di riferimento inerziale – possiamo scrivere il secondo principio della dinamica F = m ∙ ā dove – F , m e ā rappresentano i valori delle grandezze misurate nel sistema di riferimento in oggetto. Nota. Quando scriviamo una legge, una qualunque relazione (F = m ∙ a ecc.) e dobbiamo misurare e/o calcolare le grandezze che compaiono nella formula, abbiamo sempre almeno due “oggetti” che stiamo considerando: 1. il corpo o il sistema fisico in esame; 2. il valore della misura delle grandezze che descrivono il corpo. Questo valore dipende, talvolta, dal sistema di riferimento rispetto a cui le grandezze fisiche vengono misurate. Il fatto che le leggi fisiche abbiano la stessa forma si enuncia dicendo che le leggi sono “invarianti”: Le leggi della fisica sono invarianti rispetto a trasformazioni galileiane. Il concetto di invarianza è molto più generale. Per “invarianza” – per una certa trasformazione – si intende la proprietà di alcune grandezze – o gruppi di grandezze – di non essere modificate quando si applica la trasformazione in oggetto. Questa proprietà, unita alle proprietà di simmetria (cfr. par. 7.9 ) che può avere un sistema, è uno degli strumenti più utilizzati nella costruzione di qualunque modello fisico.
2.6. Principi, leggi, leggi fenomenologiche I principi, le leggi generali e le leggi fenomenologiche hanno diversa origine, diversa importanza e diverso potere predittivo. Prendiamo tre esempi: il secondo principio della dinamica, la legge di gravitazione universale e le leggi di Keplero.
78
fisica per filosofi
– Secondo principio della dinamica (1687, Newton): – F =m∙ā È, forse, il principio per eccellenza. Un principio deve valere sempre, per ogni sistema in cui posso definire le grandezze che compaiono in esso e considerando il sistema di riferimento rispetto a cui vengono misurate le grandezze stesse coinvolte. È la forma più generale che si può dare a una legge. In questo caso a sinistra possiamo avere la “misura” della forza oppure l’espressione matematica della forza che agisce sul corpo (vale, quindi, per qualunque forza). Quando viene scritta da Newton l’unica forza di cui si conoscesse l’espressione matematica era quella di attrazione gravitazionale, ma in seguito questa legge verrà utilizzata inserendoci le espressioni per le forze di natura elettrica, magnetica ecc. Un principio è una proposizione assunta come vera, non ricavata da altre proposizioni, da cui si può ricavare l’intera teoria, e giustificare le evidenze sperimentali.
– Legge di gravitazione universale (1687, Newton): m ∙m – FG = –G 1 2 2 Rˆ R È l’espressione matematica che descrive la forza che si esercita fra due corpi dotati di massa. Ci dice che due corpi di massa m1 e m2 a distanza R si attraggono (il segno “–” indica che la forza è diretta in verso opposto aR ˆ ) con l’espressione indicata dalla legge. La grandezza G è la costante di gravitazione universale. È universale nel senso che vale per qualunque sistema: sulla Terra, nel sistema solare, per una galassia lontana. Non è un teorema! Non può essere dimostrata. Nasce dall’intuizione di Newton, fondata su innumerevoli misure e osservazioni, e permette la descrizione e la predizione dei fenomeni naturali. E continuerà a essere utilizzata fin quando non si scoprirà che esistono dei casi in cui non funziona più; allora verrà sostituita da una nuova legge, in questo caso la teoria della relatività generale di Einstein (1916). La differenza fra una legge e un principio è sottile: di entrambi si può dire che sono proposizioni assunte come vere, non ricavate da altre proposizioni. La differenza è che il principio è la forma più generale possibi-
meccanica classica
79
le che si può dare per descrivere un fenomeno in termini delle grandezze fondamentali (forza, massa, spostamento, tempo ecc.), mentre la legge si riferisce in genere a una particolare classe o a un sottoinsieme di fenomeni fisici. Per chiarire: nel secondo principio della dinamica si enuncia una relazione fra accelerazione e forza, senza che si sia specificato di quale forza si stia parlando. La legge di gravitazione universale ci dà l’espressione matematica da attribuire alla forza di attrazione gravitazionale, che, inserita nell’espressione F = m ∙ a, ci permetterà di calcolare il moto dei corpi coinvolti. Se, invece, volessimo studiare il moto di un corpo di massa m collegato a una molla, utilizzeremmo come forza la legge di Hooke (F = –kx) e, inserendo questa in F = m ∙ a, potremmo calcolare il moto del corpo. Come i principi, una legge fisica non è necessariamente vera, quindi negandola non si ha nessuna contraddizione logica. Per esempio, in questo caso, se avessimo scritto che la forza era proporzionale alla radi—— — ce quadrata delle masse (∝ √m1 ∙ m2 ), oppure all’inverso del cubo della distanza (∝ 1/R3), non avremmo potuto dire che era logicamente sbagliata, poteva benissimo essere vera. Quello che, invece, non può essere contraddetto è il confronto con il risultato sperimentale di una misura, cioè il confronto con l’esperienza, supponendo che le misure sperimentali e i calcoli relativi siano corretti e che la procedura sia ben definita. – Leggi di Keplero (1609-18): sono tre leggi fenomenologiche, descrivono alcuni dati sperimentali senza derivarli da un altro fattore fisico, quindi senza ipotizzare una causa. a) I pianeti si muovono secondo orbite ellittiche di cui il Sole occupa uno dei fuochi. b) Per ogni pianeta il raggio Sole-pianeta descrive aree uguali in tempi uguali. c) Il rapporto fra il quadrato del periodo di rivoluzione e il cubo dell’asse maggiore ha lo stesso valore per tutti i pianeti che orbitano intorno al Sole: è una costante. Queste tre leggi descrivono matematicamente un particolare fenomeno, senza risalire alla causa che ha prodotto il fenomeno osservato. Le leggi fenomenologiche restano legate ai casi particolari che descrivono: non è detto che possano essere utilizzate per descrivere altri sistemi – questo va verificato volta per volta – ma è possibile utilizzarle per verificare (o falsificare) un’ipotesi, come la validità di una legge più generale. Le leggi di Keplero, per esempio, scritte prima che fossero
80
fisica per filosofi
enunciati i principi della dinamica e la legge di gravitazione universale, possono essere facilmente ricavate da queste due. Ne sono una conseguenza logica e formale. 2.6.1. Come funzionano i principi e le leggi Prendiamo come esempio il moto di due corpi liberi nello spazio, e supponiamo che la loro carica elettrica totale sia zero. Così saremo sicuri che fra di loro non ci sia un’interazione elettromagnetica, ma solo la forza di gravità. – Il principio F = m ∙ ā e la legge di gravitazione universale permettono di calcolare le accelerazioni, le velocità e le traiettorie di qualunque oggetto che si muova sotto l’azione della forza gravitazionale. Facciamo un esempio facile, semplificato: il caso di un oggetto di massa m che si trova vicino alla superficie terrestre e che, lasciato libero con velocità iniziale zero, cade. In questo caso sia il corpo che la Terra sono liberi (trascuriamo il fatto che la Terra e il corpo siano sottoposti anche all’attrazione del Sole, in questo caso la possiamo trascurare), ma, dato che la massa del corpo è infinitamente più piccola di quella della Terra, è il corpo che vediamo cadere avvicinandosi alla Terra; anche la Terra cade verso il corpo, però di una quantità trascurabile: possiamo, quindi, considerarla ferma. La forza di attrazione gravitazionale, vicino alla superficie terrestre, possiamo scriverla come (cfr. par. 2.6): M – F = m ∙ ˉ, dove g g = G 2T , diretta verso il centro di massa della Terra. RT Scriviamo la seconda legge di Newton: – F =m∙ā Uguagliandole, abbiamo: m ∙ ˉg = m ∙ ā, cioè6 ˉg = ā L’accelerazione a del corpo è, quindi, costante e diretta come l’accelerazione di gravità g verso il centro della Terra. Notiamo che la massa è scomparsa, il moto è indipendente dalla massa! Ora proviamo a calcolare l’equazione del moto, vale a dire la posizione del corpo in vari istanti di tempo, se, per esempio, lo facciamo cadere, partendo da fermo, da un’altezza h (questo è un calcolo un po-
meccanica classica
81
chino complicato: chi non conoscesse il calcolo differenziale/integrale può saltarlo). Quello che sappiamo è che il corpo avrà un’accelerazione a(t) = –g; indichiamo con z l’asse verticale, mettendo lo zero sulla superficie terrestre, e la direzione dell’asse verso l’alto (per questo l’accelerazione è negativa: è diretta verso il basso). 1. Calcoliamo la velocità v(t) sapendo che a(t) = dv(t)/dt e che il corpo parte da fermo, ossia v(0) = 0: t
t
t
v(t) – v(0) = ∫0 a(t)dt = ∫0 – gtdt = – g ∫0 dt = – gt Dunque, v(t) = –gt: la velocità è diretta verso il basso e cresce linearmente con il tempo. 2. Calcoliamo la posizione z(t) sapendo che v(t) = dz(t)/dt e che il corpo parte dall’altezza h: t t t 1 z(t) – z(0) = z(t) – h = ∫0 v(t)dt = ∫0 – gdt = – g ∫0 tdt = – g t 2 2 Quindi, z(t) = −gt2/2 + h: il corpo cade con uno spostamento proporzionale al quadrato dei tempi. Questa era la legge trovata da Galilei per il moto dei gravi: Se [un mobile] scorra dalla quiete, con moto uniformemente accelerato, gli spazi passati dal medesimo in qualsivoglia tempo, sono fra loro in duplicata proporzione de’ medesimi tempi, cioè come i quadrati de’ medesimi tempi (Galilei, 1933b).
Si noti che questo è lo spostamento “calcolato”, se poi facciamo delle misure su di un oggetto che cade potremo confrontare lo spostamento calcolato con quello misurato e trarne le dovute conseguenze.
2.7. Massa inerziale e massa gravitazionale: il principio di equivalenza Il secondo principio della dinamica afferma: F = mi ∙ a dove mi = massa inerziale La cosiddetta “massa inerziale” è una grandezza proporzionale all’inerzia di un corpo, cioè alla difficoltà di cambiare la velocità di un corpo, a parità di forza esterna.
82
fisica per filosofi
La legge di gravitazione universale, invece, afferma: m ∙m FG = G G 2 2 dove mG = massa gravitazionale R La cosiddetta “massa gravitazionale” è la grandezza proporzionale alla forza gravitazionale esercitata sul corpo, causata da altre masse. Quello che ci si è chiesti – Galilei per primo, poi altri fisici fino ai giorni nostri – è: il valore di queste due masse è lo stesso (mi =? mG)? Si tratta di due misure diverse della stessa grandezza, oppure sono solo due grandezze molto simili? Come si può verificare una di queste ipotesi? Misurando gli effetti inerziali e gravitazionali sullo stesso corpo. Nel caso della caduta lungo la verticale di un corpo nel campo gravitazionale terrestre avremo che la forza di attrazione sul corpo di massa gravitazionale mG sarà: FG = G
mG ∙ mT = mG ∙ g R2T
e questo corpo si muoverà in accordo con la legge di Newton F = mi ∙ a. Combinando le due relazioni avremo che mG ∙ g = mi ∙ a; se quindi facciamo l’ipotesi che massa inerziale e massa gravitazionale siano uguali, allora avremo che a = g, cioè tutti i corpi dovranno cadere con la stessa accelerazione, indipendentemente dalla loro massa. Galilei realizzò i primi esperimenti su corpi in caduta libera, necessariamente poco precisi. In seguito sono stati fatti altri esperimenti (l’ultimo, microscope, è ancora in corso) che hanno sempre confermato l’ipotesi dell’equivalenza “numerica” fra le due masse (cfr. tab. 2.2). In questi esperimenti la grandezza che si vuole misurare è il rapporto R = mi/mG. Se è vera l’ipotesi che mi = mG, allora la misura di R deve fornire esattamente 1. Questo, però, con un’incertezza ∆R dovuta alle condizioni sperimentali. La “bontà” dell’esperimento sta in quanto piccola sarà l’incertezza relativa ∆R/R = ∆R (perché R = 1). Nel caso di Galilei, per esempio, il fatto che l’incertezza relativa sia 2 ∙ 10–2 = 2% sta a indicare che il valore per R sarà compreso (con altissima probabilità) fra 1 – 2% = 1 – 0,02 e 1 + 2% = 1 + 0,02, cioè 0,98 ≤ R ≤ 1,02. Nel caso dell’esperimento di Loránd Eötvös (∆R = 0,00000005) si aveva: 0,99999995 ≤ R ≤ 1,00000005. Il problema verrà affrontato – e risolto – in maniera definitiva da Einstein che, nell’articolo sulla relatività generale (cfr. Einstein, 1916),
meccanica classica
83
tabella 2.2 Alcuni dei principali test del principio di equivalenza con l’incertezza relativa ∆R Anno
Autore
Metodo
Incertezza relativa ∆R
1590
Galileo Galilei
Caduta libera
2 ∙ 10–2
1686
Isaac Newton
Pendolo
~ 10–3
1922
Loránd Eötvös
Bilancia di torsione
5 ∙ 10–8
1930
János Renner
Bilancia di torsione
5 ∙ 10–9
1964
Robert H. Dicke et al.
Bilancia di torsione
3 ∙ 10–11
1972
Vladimir B. Braginsky, Vladimir I. Panov
Bilancia di torsione
3 ∙ 10–12
2008 Eric Adelberger et al.
Bilancia di torsione
3 ∙ 10–14
2017
Sistema orbitante
9 ∙ 10–15
microscope (preliminare)
imporrà come principio l’uguaglianza fra massa inerziale e massa gravitazionale (cfr. cap. 6), enunciando il principio di equivalenza.
2.8. L’energia. 1 Quello di energia è un concetto moderno, che non appare negli scritti di Galilei o di Newton, e che viene definito nel xix secolo nell’ambito della termodinamica per poi essere esteso e modificato più volte nei secoli seguenti7. Qui introdurremo l’energia meccanica (classica), per poi ridefinire e ampliare il concetto nei capitoli successivi. La questione è che in realtà abbiamo dei seri problemi nella definizione di energia. Ecco cosa ne scrive Richard P. Feynman nel suo famoso manuale di fisica: È importante tenere presente che nella fisica odierna noi non abbiamo cognizione di ciò che l’energia è. Non abbiamo un modello che esprima l’energia come somma di termini finiti8. Non è così. Tuttavia vi sono formule per calcolare alcune quantità numeriche, e se le sommiamo tutte otterremo sempre lo stesso numero. […] Esiste una proprietà, o se preferite una legge, che governa tutti i fenomeni naturali conosciuti fino a oggi. Non si conosce eccezione a questa legge, essa è
84
fisica per filosofi
esatta nel limite delle nostre osservazioni. La legge è chiamata conservazione dell’energia. Essa stabilisce che vi è una certa quantità, che chiamiamo energia, che non cambia nei molteplici mutamenti subiti dalla natura. Il concetto è astratto, poiché si tratta di un principio matematico; esso afferma che esiste una quantità numerica che non cambia qualunque cosa accada. Non è la descrizione di un meccanismo o di un fenomeno concreto, è soltanto il fatto singolare di poter calcolare un numero, e dopo aver osservato i mutamenti capricciosi della natura, ricalcolarlo ottenendo sempre lo stesso risultato (Feynman, 1992, vol. i, parte i, cap. 4.1).
Dunque, l’energia è un numero (nel senso che non è un vettore), caratteristico di ogni sistema, che, in un sistema chiuso, si conserva, cioè non varia nel tempo e che, quindi, è molto comodo da calcolare e da utilizzare. Se sappiamo quanto vale in un certo istante, sappiamo che rimarrà sempre lo stesso, magari cambiando forma, perciò potremo utilizzarlo per capire cosa è successo. Un’analogia potrebbe essere quella del “patrimonio” posseduto. Se abbiamo una borsa con 100 monete d’oro e alla fine della giornata ce ne troviamo 86, vuol dire che ne abbiamo cedute 14. Potremmo avere monete d’oro e d’argento, ma quel che conta è il loro valore complessivo. Poi potremmo avere anche dei biglietti di banca, magari di vari Stati, e degli assegni (facciamo finta che non esista il problema della svalutazione delle monete o del cambio di valore dei beni). L’estratto conto della nostra banca più il valore dei contanti che abbiamo con noi ci darà un numero corrispondente al patrimonio che possediamo. Dato questo numero, sempre supponendo che non esista la variabile della svalutazione, sapremo che se non facciamo nulla il valore rimarrà costante. Se il valore diminuirà vorrà dire che dei valori sono usciti dal nostro patrimonio. Ma in esso possiamo includere anche delle terre o delle case o delle azioni (comprate con i beni liquidi). È il concetto di asset (beni). Alla fine potremo calcolare un numero che indica l’ammontare dei nostri beni in un certo istante. Una volta definito che vogliamo valutare i nostri beni, scopriremo che i beni esistono in varie forme e che tutte insieme – sommate – formano il nostro patrimonio. Non ci soffermeremo nell’elencare cosa siano tutti i “beni”, in ogni momento potremmo scoprire che ce ne sono di nuovi (i beni intellettuali, i beni non confiscabili, i cespiti ecc.). Per l’energia è più o meno la stessa cosa, pertanto quello che faremo è indicare, capitolo per capitolo, i vari termini che la comunità scientifica
meccanica classica
85
ha valutato essere “pezzi della grandezza energia”, e di cui a posteriori si è verificato l’effettivo funzionamento. Quello che vedremo è che, benché la definizione di energia possa non essere chiara e immediata, sembrano invece chiari i significati e le espressioni delle varie forme di energia che, sommate, contribuiscono all’energia di un corpo, di un sistema, di tutto l’universo9. Quindi, avremo energia cinetica (legata alla velocità di un corpo), energia potenziale gravitazionale (legata alla posizione relativa delle masse), energia termica (legata alla temperatura), energia potenziale elettrostatica (legata alla posizione relativa di cariche elettriche ferme), energia magnetica (legata al movimento di cariche elettriche con velocità costante rispetto ad altre cariche ferme), energia elettromagnetica (legata movimento di cariche elettriche con accelerazioni diverse da zero), energia nucleare (legata alle interazioni fra i nuclei atomici) e così via. Storicamente si è avuto molto spesso un utilizzo indifferenziato o ambiguo dei termini “forza” ed “energia”. Gottfried W. von Leibniz utilizzò l’espressione “vis viva” (forza viva) per indicare una grandezza proporzionale all’energia cinetica (mv2). Lo stesso Hermann von Helmholtz, riprendendo questo termine, intitolava Sulla conservazione della forza il lavoro del 1847 con cui enunciava il principio di conservazione dell’energia (cfr. Helmholtz, 1996c). Purtroppo la dizione “forza viva” è rimasta in molti testi del xx secolo generando confusione e dubbi, anche perché, dopo averne parlato andrebbe specificato cosa sia la “forza morta” (vis mortua) che, ai tempi di Galilei e di Newton, identificava l’inerzia. 2.8.1. L’energia meccanica Riprendendo l’analogia monetaria, si può dare una definizione di una grandezza dicendo a cosa serve. Nel caso dei “beni” una definizione può essere quella di decidere che un bene è qualcosa (di finito) utilizzabile per soddisfare un bisogno o produrre un effetto che ci è utile. Se ci limitiamo all’energia “meccanica”, che ancora non abbiamo definito, si può dare come significato il fatto che sia una misura del “lavoro” ottenibile da un corpo che si trova in un determinato stato. Per intendere la parola “lavoro” possiamo prendere un esempio antico, del 1803, ma
86
fisica per filosofi
ancora valido per darle un primo senso. Si tratta di un famoso brano di Lazare N. M. Carnot: L’esperienza prova che gli uomini, gli animali e altri agenti di questa natura, possono esercitare delle forze paragonabili a quelle dei pesi10. […] è naturale valutare il lavoro11 sia attraverso il peso che egli [l’uomo] può sollevare, sia attraverso l’altezza alla quale egli solleva questo peso. […] Poiché è evidente che sollevare un peso di 100 chilogrammi a 1 000 metri di altezza è la stessa cosa che sollevare 200 chilogrammi a 500 metri soltanto, ne segue che il lavoro, da questo nuovo punto di vista, deve essere direttamente proporzionale ai pesi da sollevare e alle altezze alle quali occorre portarli (Carnot, 1803, pp. 34-6).
Traducendo in formule si tratta della moderna definizione di lavoro fatto da una forza. Se l’uomo vuole alzare una massa m, deve applicare una forza (almeno) uguale e contraria alla forza di gravità: – – F = −F g = −m ∙ ˉg Se vogliamo alzare la massa m per un’altezza h dovremo fare un lavoro –ˉ L = F ∙ h , dove abbiamo scritto le grandezze in forma vettoriale per tener conto della differente direzione che possono avere la forza applicata e lo spostamento risultante. Si pensi alla barca a vela che si può muovere in una direzione diversa da quella da cui proviene il vento che esercita una forza sulla vela. Questo lavoro fatto non è altro che l’energia che dovremmo spendere per ottenerlo. Generalizzando, possiamo definire l’energia meccanica come quella grandezza che ci dice quanto lavoro potremmo ottenere da questa energia. Notiamo due cose importanti: abbiamo usato la parola “potremmo”; non diciamo come, magari non sappiamo come farlo, stiamo solo quantificando una possibilità. Siamo nel regno della meccanica, ancora non abbiamo parlato di termodinamica, quindi di temperatura, di corpi che si scaldano, cioè di fenomeni dissipativi. Siamo ancora in un mondo ideale dove l’attrito è zero, non abbiamo energia dissipata in calore e l’energia meccanica si conserva. Nel caso dell’energia meccanica possiamo dare delle definizioni abbastanza semplici perché al momento l’universo che stiamo descrivendo è molto limitato e semplice: abbiamo solo degli oggetti con determinate configurazioni12. Questi si trovano in qualche punto dello spazio e possono essere fermi oppure in moto. Da queste informazioni possiamo calcolare varie forme di energia meccanica.
meccanica classica
87
2.8.2. Nota. I termini che formano l’energia meccanica In questo panorama molto semplificato – senza attriti, quindi senza energia trasformata in calore – abbiamo due classi che compongono la grandezza “energia”: le energie cinetiche e le energie potenziali. 1. L’energia legata al movimento è quella che si chiama energia cinetica. Si può calcolare, ma qui non lo faremo, il calcolo si trova in un qualunque testo di fisica elementare; per un corpo puntiforme di massa m e velocità v si ha: Energia cinetica = Ec = K =
1 2 2 mv
dove K è il termine utilizzato in molti testi, specie di lingua inglese, per indicare l’energia cinetica (kinetic energy). Se poi il corpo fosse esteso con la possibilità, per esempio, di ruotare, avremmo anche un’energia cinetica legata alla velocità di rotazione. Si noti che l’energia cinetica dipende dalla velocità, che a sua volta dipende dal sistema di riferimento in cui ci troviamo, pertanto l’energia cinetica non è una grandezza invariante, potrà essere differente per ogni sistema di riferimento, perciò per ogni osservatore. 2. L’energia legata alla posizione del corpo rispetto ad altri corpi con cui interagisce, si chiama energia potenziale, e in genere viene indicata con il simbolo U. Stiamo parlano di corpi che interagiscono, quindi deve esistere una forza fra di loro; come si calcola l’energia potenziale in funzione della forza applicata a un corpo e della sua posizione? Anche qui si può calcolare il lavoro che deve fare una forza esterna per spostare il corpo da una certa posizione a una differente. La cosa essenziale è che il calcolo ci dice solo la differenza di energia potenziale fra due posizioni. Avremo sempre una posizione a cui riferirci per calcolarne il valore. Questa posizione viene scelta in genere come la più facile da trattare matematicamente. Con qualche esempio sarà più chiaro. Faremo un calcolo per due tipi di energia potenziale, quella gravitazionale e quella elastica. Partiamo con l’energia potenziale gravitazionale, supponendo di trovarci sulla Terra. Se prendiamo un corpo di massa m e lo spostiamo da una posizione rc a un’altra posizione ra (r essendo la distanza dal centro della Terra e ipotizzando di non scendere mai sotto la superficie terrestre) avremo che la differenza di energia gravitazionale del corpo sarà: ∆U = Ua – Uc =
GMm rc
–
GMm ra
Da questa espressione si vede che un punto “comodo” da prendere come riferimento è quello in cui rc → ∞ perché così il termine con rc andrà a zero e potremo scrivere:
88
fisica per filosofi ∆U = Ua – U∞ = Ua = –
GMm ra
ra ≥ RT
Questa è, dunque, l’energia potenziale gravitazionale di un corpo a distanza ra dal centro della Terra. Ma c’è un problema: l’energia gravitazionale spesso viene scritta come U = mgh, dove h è la distanza dalla superficie della Terra. Cosa ha a che fare questa relazione con quella scritta precedentemente? Perché quando scriviamo l’energia gravitazionale di un corpo non scriviamo la distanza dal centro della Terra? Perché stiamo facendo un’approssimazione. Il raggio della Terra RT è di circa 6 400 km; quando spostiamo un corpo di poche decine di metri dalla superficie terrestre, o anche di qualche chilometro (circa 9 km rispetto al livello del mare se lo portiamo in cima al monte Everest) ci stiamo spostando di molto poco rispetto al punto in cui stavamo. Perciò possiamo fare un’approssimazione e scrivere l’energia potenziale del corpo prendendo come riferimento un punto della superficie terrestre e supponendo di spostarci di una distanza piccola rispetto a questo raggio terrestre. Facciamo i calcoli tenendo conto che se ci spostiamo di h, dove h è molto minore di RT (h T1) sarà minore o uguale a 1 – (T1/T2) dove l’uguale vale nel caso in cui il ciclo sia reversibile. 4. In un sistema isolato l’entropia non può mai diminuire: se le trasformazioni che coinvolgono il sistema sono irreversibili l’entropia aumenta, altrimenti resta costante. Il terzo principio (legge) della termodinamica Ve ne sono almeno due formulazioni. 1. L’entropia di un cristallo perfetto alla temperatura dello zero assoluto vale zero. 2. Non è possibile raggiungere la temperatura dello zero assoluto con un numero finito di cicli.
3.1. Introduzione: qual è il problema e quale la sua soluzione La termodinamica è una disciplina “strana” e talvolta più difficile da capire di altre parti della fisica classica formalmente molto più complicate. Questo perché essa apparentemente non introduce nulla di nuovo ri-
98
fisica per filosofi
spetto alla meccanica. In meccanica si parte dalle grandezze fondamentali che descrivono lo stato di un corpo solido: la sua posizione nello spazio e nel tempo, la velocità, l’accelerazione, la massa e le forze che agiscono su di esso. Per i corpi idealmente “piccoli” – puntiformi – si può calcolare quasi tutto quello che succede tramite le leggi di Newton. Se i corpi sono più complicati (per esempio, una trottola appesa a un filo elastico su una giostra che gira) dovremo mettere insieme tanti pezzi, introdurremo altre grandezze derivate da quelle fondamentali (le grandezze legate alle rotazioni, il momento di inerzia ecc.) ma alla fine avremo solo un problema matematico un po’ più complesso. Non ci sarà nulla di concettualmente nuovo mettendo insieme tanti “pezzi”. Anche il moto dei fluidi, formalmente molto complicato, può essere trattato a partire dalle leggi della meccanica. Tuttavia, in meccanica c’era un aspetto che, nel xvii secolo, non si sapeva bene come trattare: il problema dell’attrito. Galilei, nei suoi esperimenti con le sfere che rotolavano su piani, si raccomandava che questi ultimi fossero lisci, perfettamente lisci. Lanciando una sfera su un piano notava che quanto più il piano era liscio tanto più la sfera sarebbe andata lontano, e ne estrapolava il principio di inerzia affermando che su un piano perfettamente liscio la sfera avrebbe continuato a scivolare per sempre. Ma il fatto è che nella realtà nessun piano è perfettamente liscio, nel caso reale la sfera prima o poi si ferma e la sua energia cinetica va a zero: quindi il principio di inerzia è un’approssimazione. Dov’è andata a finire l’energia legata al movimento della sfera? Esistevano teorie corpuscolari, di origine antica, riprese da Bacone e Galilei, ma restava da chiarire “cosa fosse la temperatura”. La temperatura non era una grandezza definita nella meccanica – ma i termometri esistevano, Galilei sicuramente ne costruì uno – e doveva entrare in qualche modo nella descrizione del comportamento dei sistemi caldi o freddi. La termodinamica nasce appunto per dare una forma quantitativa, utilizzando i risultati sperimentali, ai fenomeni termici nell’ambito dei sistemi meccanici. Vi era inoltre una ragione molto prosaica nello studiare questi fenomeni: la nascita dell’industrializzazione. Nel xviii secolo in Gran Bretagna, ma anche in altri paesi europei, sorse un problema: le miniere di carbone erano sempre più profonde, si arrivavano a superare le centinaia di metri di profondità, a queste profondità le varie gallerie cominciavano a riempirsi di acqua che veniva aspirata tramite delle macchine che utilizzavano come forza motrice quella
termodinamica
99
fornita dai cavalli. Ma tutto era inefficiente, servivano centinaia di cavalli, che però prima o poi dovevano riposarsi. Insomma era un bel dilemma: la miniera, oltre una certa profondità, rischiava di diventare inutilizzabile. Si pensò allora di utilizzare delle macchine termiche – che già esistevano da almeno un secolo – per pompare l’acqua dalle profondità delle miniere fino in superficie, cioè per fornire lavoro meccanico ricavato dal calore. Ma il problema non si aveva solo con le miniere: con la liberalizzazione della produzione dei tessuti di cotone (Gran Bretagna, 1774) nasceva l’esigenza di avere delle macchine, possibilmente più piccole e maneggevoli di quelle usate per le miniere, per far funzionare i telai. Ancora una volta servivano dei nuovi dispositivi. E, ideata la macchina, il problema ovvio era quello di valutarne il rendimento. Si trattava, in altre parole, di avere delle relazioni matematiche che descrivessero il comportamento di queste macchine termiche. In tutto questo movimento di idee, che si stavano sviluppando in Gran Bretagna, si inserisce il francese Lazare Carnot (1753-1823), uomo eclettico, militare, politico, scienziato, fermamente convinto della necessità di utilizzare le macchine termiche, se non altro per sopravanzare militarmente la Gran Bretagna; nel 1783 egli pubblica l’Essai sur les machines en général: è ancora un abbozzo, contiene sicuramente degli errori concettuali ma è l’inizio del lavoro di decine di scienziati che porteranno nel secolo successivo a creare una nuova disciplina: la termodinamica.
3.1.1. Un altro punto di partenza: reversibilità e irreversibilità Il problema di come trattare l’attrito può essere visto, da un punto di vista globale, come la differenza fra trattare sistemi che compiono trasformazioni reversibili e sistemi che compiono trasformazioni irreversibili. Il concetto di reversibilità può essere definito in maniera rigorosa, ma come primo approccio è più che sufficiente, e spesso più chiaro, rifarsi al senso comune. Se noi vedessimo un film di alcuni fenomeni naturali potremmo dividerli in due grandi classi: 1. i fenomeni per cui “girando il film al contrario” vedremmo qualcosa di accettabile, senza trovarci nulla di anomalo. A questa classe appartiene, per esempio, il moto dei pianeti intorno al Sole: se vedessimo un film in cui i pianeti ruotano al contrario non ci troveremmo nulla di
100
fisica per filosofi
strano, quel moto non viola nessuna legge fisica. Come se vedessimo un urto fra due palle in un biliardo: l’urto può essere invertito senza problemi. Questi sono i cosiddetti “fenomeni reversibili”, vengono trattati in modo completo utilizzando le leggi della meccanica; 2. i fenomeni per cui “girando il film al contrario” vediamo subito che qualcosa non va, si tratta di un evento impossibile. Per esempio, mettendo una sola goccia di inchiostro nero in un bicchiere di acqua succederà che dopo un po’ l’inchiostro si è diffuso in tutta l’acqua e non lo vedremo più. Se vedessimo un film in cui dentro un bicchiere di acqua, pian piano dell’inchiostro si addensa attorno a un punto e alla fine c’è una goccia di inchiostro ben concentrata, diremmo che non è possibile. Come non sarebbe possibile, vedendo una palla che rotola su una strada, rallenta e poi si ferma, vedere il fenomeno al contrario: una palla che da ferma inizia a muoversi per acquistare sempre maggiore velocità. Questi sono fenomeni irreversibili, cioè non possono avvenire “al contrario” di una certa direzione temporale. Qua stiamo introducendo uno dei maggiori problemi della fisica: il significato del tempo e della direzione dei fenomeni naturali, che sembra obbligata. Per ora non approfondiremo il concetto, l’importante è che sia chiara l’idea. Di fondo c’è una differenza fondamentale fra queste due trasformazioni: in un caso (i fenomeni reversibili) non si hanno attriti o tutte le particelle hanno un moto ordinato, nell’altro (fenomeni irreversibili) ci sono degli attriti, qualcosa si scalda, oppure cambia l’ordine nello spazio in cui si trovano miliardi di miliardi di miliardi di particelle, il moto da ordinato diventa disordinato. La termodinamica descrive appunto questi sistemi, tenendo conto che tutte le trasformazioni reali che avvengono nel mondo macroscopico sono disperatamente irreversibili. 3.1.2. L’approccio della termodinamica La meccanica utilizza i principi di Newton in cui le variabili fondamentali sono lunghezze, masse e tempi (L, M, t) e una serie di grandezze derivate dalle prime: velocità, accelerazione, forza, quantità di moto, e 1 1 1 l’energia espressa in varie forme ( mv2, mgh, Iω2, kx2 ecc.). 2 2 2 Per prevedere il comportamento di un sistema meccanico non dobbiamo fare alcuna media: le relazioni sono esatte e così le evoluzioni temporali dei corpi.
termodinamica
101
Se invece di un solo corpo o di 2-3 ne abbiamo 100-1 000, 10 000 o più, si potrebbe pensare che la differenza sia solo la complicazione matematica nel dover risolvere le equazioni che descrivono l’evoluzione di un così grande numero di sistemi. Pierre-Simon de Laplace scriveva nel 1814: Possiamo considerare lo stato attuale dell’universo come l’effetto del suo passato e la causa del suo futuro. Un intelletto che a un determinato istante dovesse conoscere tutte le forze che mettono in moto la natura, e tutte le posizioni di tutti gli oggetti di cui la natura è composta, se questo intelletto fosse inoltre sufficientemente ampio da sottoporre questi dati ad analisi, esso racchiuderebbe in un’unica formula i movimenti dei corpi più grandi dell’universo e quelli degli atomi più piccoli; per un tale intelletto nulla sarebbe incerto e il futuro proprio come il passato sarebbe evidente davanti ai suoi occhi (Laplace, 1814, pp. 3-4).
In pratica non è così. L’enorme numero di sistemi considerati (1 metro cubo di aria contiene circa 1025 molecole) non rende possibile il calcolo esatto delle traiettorie di tutte le particelle, e anche se lo permettesse ci sarebbero dei limiti fisici invalicabili1; siamo costretti, quindi, a utilizzare i valori medi di alcune grandezze caratteristiche: dovendo descrivere un numero molto grande di sistemi interagenti dovremo impiegare le leggi della statistica. Il risultato sarà che i valori medi delle grandezze calcolate tramite la statistica daranno origine a nuovi principi, non esistenti in meccanica. Questi principi definiscono la direzione naturale e obbligata dell’evoluzione di tutti i fenomeni macroscopici che avvengono nel nostro universo, fornendoci la direzione del tempo. La termodinamica è questa nuova parte della fisica, indispensabile per descrivere alcuni fenomeni altrimenti non spiegabili con le sole leggi della meccanica, in particolare quelli “complessi”, quelli in cui esiste una direzione del tempo, quelli in cui si manifestano proprietà emergenti2, e/o la “vita” nel senso più generale possibile. In termodinamica vengono dunque definite delle nuove grandezze, essenziali per descrivere il comportamento dei sistemi a molte particelle e più utili delle semplici grandezze meccaniche, spesso non accessibili all’esperienza: l’energia meccanica, l’energia interna, la temperatura, la pressione. Tutte grandezze definite come “medie” fatte su sistemi macroscopici composti da moltissimi sistemi microscopici. Tutta la termodinamica, e in realtà tutta la fisica dalla seconda metà dell’Ottocento in poi, avrà a che fare con due scale di dimensioni per gli oggetti di cui di parla: una scala macroscopica che possiamo identificare come quella re-
102
fisica per filosofi
lativa a tutti gli oggetti che possono essere visti direttamente, dal nostro occhio, oppure con un microscopio elettronico. Parliamo di oggetti con lunghezze superiori a circa 10 nm (10–8 m), cioè da una proteina fino a un globulo rosso, un uomo, una montagna, la Terra. E una scala microscopica (che sarebbe meglio chiamare “nanoscopica”) in cui le dimensioni tipiche degli oggetti sono inferiori a circa 1 nm (1 ∙ 10–9 m). Stiamo parlando delle dimensioni tipiche degli atomi. La differenza essenziale fra queste due scale sarà, per quel che riguarda la termodinamica, il numero di oggetti elementari che compongono il sistema che si vuole studiare.
3.2. I principi della termodinamica in breve Il problema nel presentare i principi della termodinamica appare chiaro se scriviamo l’ordine cronologico (approssimativo) in cui vennero scoperti e/o definiti: è stato enunciato prima il secondo, poi il primo, quindi il terzo e per ultimo il principio zero. Il secondo, fra l’altro, fu scritto ipotizzando l’esistenza di qualcosa che non esisteva (il calorico), ciononostante era sostanzialmente corretto. Ecco i principi della termodinamica in ordine cronologico3. 1. Il secondo principio (1824 circa, Nicolas L. S. Carnot; poi, 1850 circa, Rudolf Clausius e Lord Kelvin4; Ludwig E. Boltzmann): alcune trasformazioni che coinvolgono il calore scambiato e la temperatura dei corpi non sono permesse. Esiste una direzione naturale del tempo per i fenomeni naturali macroscopici: Se abbiamo due corpi a temperature diverse, il calore passa spontaneamente dal corpo più caldo a uno più freddo.
2. Il primo principio (1847 circa, Helmholtz): L’energia di un sistema isolato si conserva.
3. Il terzo principio (1890 circa, Walther H. Nernst), che in realtà, come vedremo nel par. 3.11, è un teorema: L’entropia di un cristallo perfetto alla temperatura dello zero assoluto vale zero.
4. Il principio zero (1930 circa, Ralph H. Fowler), viene data la definizione di equilibrio termodinamico e, quindi, della temperatura:
termodinamica
103
Se un corpo A è in equilibrio termico con un corpo B, e il corpo B è a sua volta in equilibrio termico con un altro corpo C, allora A è in equilibrio termico con il corpo C.
3.2.1. Le approssimazioni che faremo I soggetti principali di questo capitolo saranno la temperatura, l’energia di un sistema e le grandezze a esse collegate. Discuteremo le relazioni che scriveremo facendo alcune approssimazioni, per semplicità. Ecco le condizioni in cui ipotizzeremo di trovarci: – supporremo che i corpi siano fermi in un sistema di riferimento inerziale; questo comporterà che considereremo uguale a zero l’energia cinetica del centro di massa di tutto il sistema; – supporremo che i corpi non possiedano un’energia potenziale dovuta alla loro posizione; quindi, trascureremo l’energia potenziale gravitazionale, un’eventuale energia potenziale elastica ecc.; – supporremo che i corpi, o meglio gli atomi e/o le molecole che li costituiscono, non abbiano interazioni chimiche; escluderemo, pertanto, dai processi considerati qualunque scambio di energia chimica; – supporremo spesso di avere a che fare con gas perfetti (come all’inizio del par. 3.3). Deve essere chiaro che i principi rimangono sempre validi; è solo la loro discussione che viene semplificata. Tutti gli effetti che abbiamo trascurato potranno essere inglobati nelle relazioni che scriveremo rendendoli ancora più generali nei dettagli dei termini coinvolti: ma si tratterà solo di complicare la trattazione formale. I concetti fisici esposti nei principi rimarranno inalterati. Quindi, per non appesantire il discorso, non ne parleremo.
3.3. Definizioni di alcune delle grandezze utilizzate in termodinamica Molti dei teoremi e delle formule della termodinamica sono state inizialmente scritte per un gas perfetto. Questo perché i principi della termodinamica sono validi per qualunque sistema, ma il comportamento di un gas è particolarmente semplice e facile da descrivere5. Queste rela-
104
fisica per filosofi
zioni si possono estendere ai gas reali, ai corpi liquidi, a quelli solidi. La trattazione è più complessa ma i concetti non cambiano. Dunque, anche noi descriveremo alcune delle proprietà della termodinamica riferendoci a un gas perfetto. 3.3.1. La temperatura T È la grandezza fondamentale della termodinamica, insieme all’energia. Possiamo darne tre definizioni: 1. una semplice, quasi ovvia, poco utile: è la grandezza misurata da un termometro; 2. una soggettiva e intuitiva: è la grandezza legata alla sensazione di caldo e di freddo che si ha toccando un corpo; 3. una microscopica: è una misura dell’energia cinetica media delle particelle che compongono un sistema. Attenzione: non dell’energia cinetica totale, solo della parte dell’energia cinetica che non è legata al moto del centro di massa del sistema. Se, infatti, prendiamo un corpo costituito da molte particelle, per esempio un gas perfetto posto in un recipiente, possiamo considerare due tipi di moto delle particelle del gas (delle molecole): – il moto “ordinato” (cfr. fig. 3.1a): supponiamo di avere un corpo che si muove con velocità v– costante, per esempio un gas dentro il vagone di un treno composto da N particelle di massa m. Ognuna di queste particelle si muoverà con velocità v–. Tutte le particelle avranno la stessa velocità; la velocità media sarà, pertanto, la velocità di ognuna delle N particelle, e potremo scrivere l’energia cinetica totale di traslazione come l’energia associata al centro di massa del sistema per il numero delle particelle. Quindi: = ˉvcm da cui si può calcolare: 1 Ecinetica (totale delle N particelle) = N ∙ 2 mv2cm ˉvcm è velocità del centro di massa: se il corpo si sta muovendo è diversa da zero; – il moto “disordinato” (cfr. fig. 3.1b): supponiamo ora di considerare lo stesso corpo di prima – il gas – ma fermo. In questo caso le particelle,
termodinamica
105
figura 3.1 Esempio di un gas (un insieme di molecole) in movimento in due casi ideali di moto
m
v-
v-cm
v4
v1
v-
v2
(a) moto solo ordinato
v3
m
(b) moto solo disordinato
Il simbolo ⊗ rappresenta il centro di massa del sistema. (a) Corpo in moto con velocità ˉv: le molecole hanno tutte la stessa velocità ˉvi: in media = ˉv = ˉvcm ≠ 0. (b) Corpo fermo: le molecole hanno velocità diverse ˉvi: in media = ˉvcm = 0. Il centro di massa è fermo. Questi sono due casi limite, ideali. In generale un corpo sarà in una combinazione del caso (a) e del caso (b). La temperatura T è proporzionale all’energia cinetica del solo moto disordinato.
le molecole, ognuna con la stessa massa m potranno anche muoversi, ma se lo faranno sarà un moto casuale, ogni particella avrà una velocità con modulo e direzione diversi dalle altre. Le particelle non avranno un moto collettivo di insieme6 e la loro velocità media sarà uguale a zero: = 0 Ma se si stanno muovendo dobbiamo poter valutare di quanto lo stanno facendo. Questo può essere fatto facendo una media, invece che delle velocità – che essendo casualmente positive e negative avranno una media nulla – delle velocità al quadrato. In questo caso la grandezza v2i sarà sempre maggiore o uguale a zero, e la media sarà differente da zero. E sarà differente da zero anche la media delle energie cinetiche di tutte le particelle. Dunque, considerando il caso in cui vcm = 0: = v2 ≠ 0; =
1 mv2; ∝ k BT; 2
Questa grandezza, l’energia cinetica media di ogni particella, è proporzionale alla temperatura assoluta del gas tramite un coefficiente che dipende dalla natura del gas e da una costante universale: kB, la costante di Boltzmann. Quindi:
106
fisica per filosofi
La temperatura assoluta T è la grandezza proporzionale all’energia cinetica media di ogni particella.
La costante di proporzionalità dipenderà, fra l’altro, dal tipo di molecole del gas di cui stiamo parlando. T ∝ kB
In particolare per un gas monoatomico avremo: =
1 3kBT 1 3kBT 3 k T = ; = mv2= m m 2 2 B m 2
dove: T = temperatura “assoluta” = T(K) = T(°C) + 273,15; kB = costante di Boltzmann ≅ 1,38 ∙ 10–23 J/K Il valore della temperatura T può essere espresso utilizzando varie scale che possono differire per l’intervallo del “grado” e/o per la posizione dello “zero”. Le più utilizzate sono la scala in gradi Celsius (quella che impieghiamo tutti i giorni) e quella in gradi Kelvin, la quale si riferisce alla temperatura assoluta che è coerente con tutte le altre grandezze fisiche e che è l’unità del Sistema Internazionale per la grandezza temperatura. L’intervallo di 1 “grado” per queste due scale è lo stesso, mentre cambia la posizione dello zero. Pertanto il valore numerico della temperatura nelle due scale è diverso, ma ∆T(K) = ∆T(°C), cioè l’intervallo fra due temperature – ossia il numero che esprime la differenza fra due temperature – è lo stesso sia per i gradi centigradi che per i gradi Kelvin. È stata una scelta dovuta alla comodità, essendo l’intervallo di 1 grado una grandezza completamente arbitraria che non ha alcun significato “nascosto”. La temperatura assoluta è la temperatura misurata in una scala coerente con la definizione che ne abbiamo dato: se il corpo è costituito da particelle che sono tutte ferme, dunque con velocità quadratica media zero, allora la sua temperatura sarà zero; vedremo poi che questa situazione è un limite ideale, irraggiungibile, e addirittura impossibile nell’ambito della meccanica quantistica, ma per ora non è essenziale. Le altre scale di temperatura, quelle utilizzate usualmente nella vita quotidiana, fanno riferimento a una serie di fenomeni scelti storicamente perché “comodi” – il punto di fusione del ghiaccio o il punto di ebollizione dell’acqua – e non hanno un particolare significato dal punto di vista della termodinamica, mentre darebbero seri problemi se venissero usate direttamente nelle formule.
termodinamica
107
Si vede subito che una scala di temperatura qualunque, per esempio quella europea che usiamo tutti i giorni, darebbe risultati assurdi. Supponiamo, infatti, di avere il nostro gas alla temperatura di 10 °C sottozero, quindi di –10 °C. Avremmo, come media su ogni particella: 1 3 3 = < mv2 ≥ kBT(°C) = kB(–10) < 0 !!! 2 2 2 Un’energia cinetica, maggiore di zero per definizione, sarebbe uguale a una grandezza minore di zero. La temperatura termodinamica assoluta è quella che ha uno “zero” compatibile con le grandezze fisiche con cui è in relazione. Siamo arrivati a un punto fondamentale: abbiamo messo in relazione una grandezza termodinamica (la grandezza termodinamica per eccellenza, la temperatura) con le proprietà meccaniche del corpo, in particolare con l’energia cinetica media delle molecole che lo costituiscono. Siamo pronti per trattare meccanicamente tutti i fenomeni, anche quelli termici. 3.3.2. Il volume V La definizione è quella classica: la quantità di spazio occupata da un sistema. La differenza con il volume così come lo si trattava in meccanica è che in quel caso esso veniva considerato costante – i solidi e i liquidi sono assunti incomprimibili – mentre in termodinamica il volume è un parametro variabile: un gas, dato che può essere compresso, può occupare infiniti volumi diversi, dipende dal recipiente in cui si trova. 3.3.3. La pressione (di un gas) p Anche questa grandezza mantiene il significato che aveva in meccanica classica, dove la pressione era definita come: p ≝ F/S. La pressione è il rapporto fra la forza esercitata perpendicolarmente a una superficie e la superficie stessa. Se consideriamo una superficie molto piccola, al limite grande come un punto, possiamo definire la pressione in un qualunque punto dello spazio. Nel caso di un gas si può mostrare come la pressione che questo esercita sulle pareti del recipiente
108
fisica per filosofi
che lo contiene sia il risultato degli innumerevoli urti delle particelle del gas contro la parete. Queste particelle, tramite gli urti, esercitano istante per istante delle forze sulle pareti; la forza per unità di superficie è la pressione esercitata dalle particelle del gas sulle pareti e in un qualunque punto interno al gas. 3.3.4. Lo stato termodinamico di un sistema In meccanica avevamo scritto lo stato di un sistema in funzione dei parametri meccanici necessari per descriverlo completamente (cfr. par. 1.2.4). In termodinamica, data l’impossibilità sia pratica che teorica di dare la posizione e la velocità di tutte le particelle del sistema, si utilizzano alcune variabili macroscopiche7 che sono necessarie e sufficienti per la descrizione completa del sistema, cioè delle sue proprietà in un dato istante e della sua evoluzione nel tempo. Lo stato termodinamico viene così definito assegnando una funzione f che dipende solo dalla pressione p, dal volume V, dalla temperatura T e dal numero di particelle coinvolte N: f (p, V, T, N) = 0. Per i sistemi termodinamici più semplici (i gas perfetti) la relazione diventa: pV = nRT (legge dei gas perfetti) dove n è il numero di moli8, una grandezza proporzionale al numero di particelle che compongono il sistema e, quindi, alla sua massa, mentre R = 8,31 J/mol ∙ K è la costante universale dei gas. Questa legge mette in evidenza le relazioni fra le tre grandezze p, V e T. Si vede, per esempio, che se abbiamo un sistema in cui V è costante (un recipiente sigillato) allora la pressione p e la temperatura T sono direttamente proporzionali: p = costante ∙ T. Se aumenta/diminuisce una, l’altra aumenterà/diminuirà della stessa percentuale. 3.3.5. Variabili e funzioni di stato di un sistema fisico Ogni sistema fisico e ogni sua trasformazione vengono descritti fornendo il valore di una serie di grandezze che caratterizzano lo stato del sistema e delle relative trasformazioni. Queste grandezze, e le funzioni che
termodinamica
109
si possono creare combinandole fra loro, possono essere divise in due grandi classi: 1. variabili e funzioni di stato; 2. variabili e funzioni non di stato. Le variabili di stato sono funzioni che dipendono solo dallo stato di un sistema, non da come ci si è arrivati. La “posizione”, per esempio, è una variabile di stato: se diciamo di essere in un posto (e forniamo le coordinate della nostra posizione), questo è sufficiente per definire dove ci troviamo, non serve sapere come ci siamo arrivati. Mentre il cammino che abbiamo percorso, che ha sempre le dimensioni di una lunghezza come le coordinate della posizione, è una grandezza non di stato: se diciamo di trovarci a Roma e che prima eravamo a Firenze, non possiamo definire il cammino percorso per andare da Firenze a Roma fornendo solo le due variabili “posizione di Roma” e “posizione di Firenze”: dovremo anche dare le coordinate del percorso fatto, da cui si potrà calcolare la distanza coperta. Ecco un elenco non esaustivo di queste variabili: 1. sono variabili di stato: temperatura T, pressione p, volume V, energia interna U, entropia S, quantità di materia m, numero di moli n... 2. non sono variabili di stato: lavoro L fatto in una trasformazione, calore Q scambiato in una trasformazione... Nota. Tutte le variabili di stato G in un ciclo (cfr. par. 3.3.10) hanno variazione nulla, per definizione di ciclo: ∆Gciclo = Gfinale – Giniziale = 0. Quindi, Giniziale = Gfinale.
3.3.6. L’energia E in termodinamica In termodinamica si estende il significato del termine “energia” come lo abbiamo definito in meccanica (cfr. par. 2.8). Introdurremo un’energia legata alla grandezza “temperatura”, l’energia uguale alla quantità di calore scambiata Q, l’energia meccanica uguale al lavoro L fatto sul corpo e altre forme di energia. Si chiarirà la differenza fra energia come proprietà di un corpo (quindi, funzione di stato) ed energia scambiata fra corpi (in generale funzione non di stato). Anticipiamo il primo principio della termodinamica. In un sistema vale la relazione: ∆E = 0 ↔ Q = L + ∆U
110
fisica per filosofi
Si legge così: In una trasformazione che coinvolge un sistema isolato la variazione di energia è uguale a zero. Questo implica che, se il sistema non è isolato, la quantità di calore scambiata Q è uguale al lavoro scambiato L più la variazione dell’energia interna U.
Dobbiamo a questo punto definire le tre grandezze ∆U, Q, L. 3.3.7. L’energia interna U di un sistema La grandezza U viene definita come l’energia che dipende solo dallo stato termodinamico del sistema; non dipende, quindi, dalla posizione del corpo, né dalla sua velocità media, ma è una caratteristica estensiva del corpo, perciò dipende anche dalla sua massa. Da cosa dipende l’energia interna U che, come spesso accade per l’energia, è la somma di vari termini? 1. Dipende dall’energia associata al moto caotico (di origine termica) delle particelle (molecole, atomi, ioni), dunque dipende dalla temperatura T. 2. Dipende dall’energia di interazione fra queste particelle (energia chimica, energia nucleare). 3. Ha un minimo che non è zero, ma questo sarà un risultato della meccanica quantistica, in questo capitolo considereremo l’energia interna come una grandezza che può essere nulla a una temperatura sufficientemente bassa. Vediamo un caso semplice, anzi il più semplice: un gas perfetto composto da n moli di un gas composto da molecole monoatomiche (per esempio, l’elio); avremo che: U(T) = n ∙ cv T 3 3 k quindi: U(T) = n ∙ kB T 2 B 2 Da dove viene questa formula? È semplicemente l’energia cinetica media del sistema associata al moto disordinato. Nel par. 3.3.1 avevamo 3 1 calcolato che: = 2 m = 2 kBT L’energia interna U di un sistema, pertanto, non è altro che l’energia cinetica media di ogni particella per il numero totale di moli del sistema in oggetto: 3 U = U(T) = n = n kBT ≥ 0 2 dove cv =
termodinamica
111
3.3.8. Il calore scambiato Q Il calore Q viene definito come l’energia scambiata fra due sistemi a causa della differenza di temperatura ∆T esistente fra di essi. Ma, attenzione, Q non è una proprietà intrinseca del sistema: non possiamo dire che un corpo ha il calore Q, non ha senso. Potremo dire che due corpi, che si trovano a una diversa temperatura T, se messi in contatto9, si scambieranno la quantità di calore Q10 (cfr. fig. 3.2). Il calore Q dipende, dunque, dalla differenza di temperatura fra due corpi messi in grado di scambiarsi energia. E il calcolo dovrà tener conto del tipo di trasformazione con cui i corpi si scambiano energia. In generale non potremo calcolare la quantità di calore scambiato utilizzando solo le temperature e le caratteristiche fisiche dei due corpi. Questo perché la quantità di calore Q non è una funzione di stato (cfr. par. 3.3.5). Il concetto di funzione non di stato è questo: per calcolare il valore della funzione dobbiamo conoscere non solo gli stati di partenza e di arrivo ma anche le modalità con cui siamo passati dallo stato iniziale a quello finale. Nel caso in cui lo scambio avvenga per contatto fra i due corpi solidi le molecole di un corpo urteranno le molecole dell’altro11 trasferendo o assorbendo parte della loro energia cinetica. Questa modalità porta a un’espressione per lo scambio di energia termica molto semplice: Q = C ∙ ∆T = C (T2 – T1) in cui C = capacità termica del corpo = c ∙ m = calore specifico ∙ massa In altri casi, quando, per esempio, lo scambio di energia avverrà tramite radiazione elettromagnetica, la relazione non sarà lineare con la temperatura; in questa eventualità l’energia scambiata fra due corpi a temperafigura 3.2 Passaggio della quantità di calore Q dal corpo a temperatura T2 al corpo a temperatura T1 T2 > T1 T2
T1 Q
112
fisica per filosofi
tura T2 e T1 dipenderà dalla quarta potenza della temperatura assoluta: Q ∝ T42 − T41. Se poi lo scambio di energia avvenisse attraverso un fluido (l’aria, per esempio) la cosa sarebbe molto più complicata: in questo caso possono intervenire fenomeni caotici che coinvolgono il moto dei fluidi e le espressioni possono diventare matematicamente molto complesse.
3.3.9. Il lavoro L Il lavoro L, riprendendo la definizione data in meccanica, è l’energia tra– sferita a un corpo da una forza esterna (Fe) che agisce sul corpo spostandolo di una quantità s–, oppure l’energia trasferita all’esterno da una forza generata dal corpo. In formule: – L = Fe ∙ˉs Quindi per avere del lavoro (meccanico) trasferito a un corpo o da un corpo, dobbiamo avere qualcosa che si sposta, o che ruota, o che si deforma. Una macchina a vapore fa girare una ruota, che potrà innalzare un peso contro la forza di gravità compiendo un lavoro. Un gas riscaldato potrà aumentare il proprio volume facendo del lavoro contro la pressione esterna: nel caso di un gas che si trovi a una certa pressione p e che aumenti il suo volume della quantità ∆V, avremo che il lavoro ceduto all’esterno sarà: L = p ∙ ∆V In generale, per calcolare il lavoro andrà definito il tipo di trasformazione, come era stato fatto per il calore Q, non essendo il lavoro L una funzione di stato. 3.3.10. Ciclo termodinamico Un ciclo termodinamico è una trasformazione in cui un sistema, dopo una serie di trasformazioni termodinamiche, torna allo stato di partenza. Assume, cioè, gli stessi (identici) valori delle variabili di stato (cfr. par. 3.3.5) che definivano lo stato di partenza. È importante notare che il ciclo è compiuto dal sistema, che torna allo stato iniziale, mentre il
termodinamica
113
resto dell’universo può avere benissimo avuto delle variazioni (anzi, ne avrà avute di certo). Per esempio, se prendiamo un motore a scoppio a quattro tempi, semplificandolo con un solo cilindro, il sistema composto da quest’ultimo compie una serie di cicli strutturati in quattro passi: 1. all’inizio il cilindro è vuoto e ha un piccolo volume iniziale Vi; 2. il volume aumenta, si crea una depressione e viene iniettata una miscela aria-benzina; 3. il volume viene diminuito e la miscela viene compressa; 4. la miscela viene incendiata, si ha uno scoppio, la pressione aumenta, spinge il pistone, e il volume aumenta. In questa fase il sistema può compiere del lavoro verso l’esterno, quindi produrre energia. 1’. Si aprono le valvole di scarico, il volume diminuisce, i gas bruciati vengono espulsi e si ritorna al punto di partenza con un piccolo volume iniziale Vi vuoto. Quindi, alla fine il cilindro ha compiuto un ciclo tornando allo stato iniziale, ma noi abbiamo utilizzato dell’aria e della benzina che sono bruciate convertendosi in gas di scarico, intorno l’ambiente si è scaldato, se il motore era collegato a qualcosa è stato compiuto del lavoro. Insomma tutto l’universo è cambiato.
3.4. Il primo principio della termodinamica Il primo principio della termodinamica è la naturale estensione del principio di conservazione dell’energia meccanica, una volta stabilito che oltre a quest’ultima esistono altre forme di energia: il calore Q e l’energia interna U. Può essere enunciato come segue: In un sistema isolato l’energia rimane costante: ∆E = 0.
Questa forma, se pure corretta, non dà molte informazioni sulle varie parti che compongono l’energia. È molto più utile la forma in cui appaiono esplicitamente le forme di energia considerate (cfr. fig. 3.3): In una trasformazione, dato un sistema, la quantità di calore Q fornita a esso potrà andare in lavoro L fatto verso l’esterno, oppure potrà aumentare la sua energia interna U, oppure potranno variare entrambe secondo una qualunque combinazione che rispetti il principio Q = L + ∆U [ fornisco del calore Q] = [ottengo del lavoro L] + [aumenta l’energia interna U].
114
fisica per filosofi
figura 3.3 Il primo principio della termodinamica Sistema S Q
∆U L
Q = L + ∆U
Se forniamo a un sistema una quantità di calore Q, questa quantità di calore Q sarà numericamente uguale alla variazione dell’energia interna ∆U più la quantità di lavoro L compiuto dal sistema verso l’esterno. Il primo principio impone che la somma di queste tre grandezze rispetti la relazione Q = L + ∆U.
La convenzione è di considerare il calore Q = Qa > 0 quando è assorbito dal sistema, quindi quando lo stiamo scaldando, mentre il lavoro L viene considerato positivo quando viene fatto dal sistema verso l’esterno, Lf = L > 0. Questa convenzione deriva semplicemente dal fatto di voler scrivere il rendimento delle macchine termiche, che sono macchine cicliche, come una grandezza positiva (cfr. par. 3.6.2). Il lavoro, il calore e l’energia interna, perciò, possono trasformarsi vicendevolmente, secondo la relazione su descritta. Va ricordato che, mentre l’energia interna U è una funzione di stato, il calore Q e il lavoro L non lo sono. Dunque, non dovremmo dire “calore convertito in lavoro”, ma “energia trasferita al sistema tramite un processo dovuto a una differenza di temperatura e in seguito trasferita esternamente in forma di energia meccanica”. Ma sarebbe lungo e inutilmente complicato, perciò utilizzeremo la versione più breve. 3.4.1. La conservazione dell’energia in meccanica e in termodinamica e l’impossibilità del moto perpetuo di prima specie Il primo principio della termodinamica introduce una nuova grandezza nel bilancio energetico di un sistema, concettualmente differente da quelle utilizzate nel principio di conservazione dell’energia meccanica. In meccanica, per un sistema isolato e senza attriti, scrivevamo: E (iniziale) = Ei = E (finale) = Ef dove per “energia” si intendeva la somma dell’energia cinetica di un sistema e della sua energia potenziale. In questa forma ci riferiamo, quindi, ad alcune proprietà del sistema, che
termodinamica
115
“appartengono”, cioè, al sistema. L’energia cinetica del sistema dipenderà dalla massa e dalla velocità delle particelle che lo compongono, mentre l’energia potenziale dipenderà dalla sua posizione nello spazio (in relazione a tutto il resto dell’universo). E l’unico modo di variare queste grandezze è di spostare o di deformare il corpo e/o di accelerarlo, utilizzando una forza esterna. Perciò è necessaria un’azione meccanica su di esso. In termodinamica abbiamo questa nuova grandezza – il calore Q – che non è una proprietà del sistema; è energia che fluisce fra due corpi, senza che ci sia necessariamente un contatto. È qualcosa di completamente diverso12 e, infatti, scriviamo esplicitamente che questa forma di energia è differente dall’energia meccanica che può essere scambiata con il mondo esterno (il lavoro). Per il momento abbiamo solo definito questi due tipi di energia, L e Q, che contribuiscono al bilancio energetico totale, e questo ci permette in ogni caso di valutare se alcune trasformazioni siano possibili o no. Cosa ci dice il primo principio della termodinamica su come va il mondo? Per esempio, possiamo vedere cosa succede a un qualunque sistema isolato, cioè che non può scambiare energia né sotto forma di calore né sotto forma di lavoro. Consideriamo un sistema più generale di quello standard termodinamico, vale a dire un sistema che abbia anche una certa velocità del suo 1 centro di massa, quindi un’energia cinetica Ec = mv2 e magari anche 2 un’energia potenziale Ep. In questo caso la sua energia sarà la somma dell’energia interna U(T) e dell’energia meccanica Em = Ec + Ep e il primo principio dovremo scriverlo come: ∆Etot = ∆(U + Em) = Q – L Se il sistema è isolato, dunque se L = 0 e Q = 0, il primo principio ci dice che ∆E = 0. Pertanto la sua energia rimarrà costante, non potremo aumentarla in nessun modo: è l’impossibilità del perpetuum mobile di prima specie13, il moto perpetuo. Purtroppo non possiamo ottenere energia gratis! Certo questo è un principio, non un teorema. Non è stato dimostrato come vero, ma il fatto è che funziona e si è mostrato vero da qualche centinaio di anni con tutte le sue modificazioni e implementazioni, ed è estremamente improbabile che si trovi un caso in cui non sia verificato. Sarebbe necessario stravolgere tutto l’edificio della scienza moderna, che funziona per un numero incredibile di fatti e osservazioni.
116
fisica per filosofi
3.5. L’energia. 2 Nel cap. 2 abbiamo descritto i vari termini che compongono l’energia meccanica (cfr. par. 2.8). Nei paragrafi precedenti (cfr. par. 3.3) abbiamo aggiunto altri pezzi alla grandezza “energia”, ma, come già sottolineato, è necessario distinguere fra le energie trasferite e le energie che sono funzioni di stato e che, quindi, concorrono a formare l’energia associata ad un sistema. Abbiamo, dunque: 1. energie non di stato: calore Q, lavoro L; il loro valore in una trasformazione qualunque dipenderà dal tipo di trasformazione, perciò non possono essere funzioni solo degli stati iniziali e finali. Esse non fanno parte dei termini che concorrono e calcolare direttamente l’energia associata ad un sistema; 2. energie di stato: energia meccanica, a sua volta esprimibile come energia cinetica Ec – che dipende dalla velocità delle particelle –, energia potenziale Up – che dipende dalla posizione delle particelle che compongono il sistema in esame –, energia interna U(T), che dipende dalla temperatura termodinamica del sistema e si può esprimere in funzione della velocità quadratica media delle particelle che compongono il sistema. A questo elenco si può aggiungere anche l’energia chimica, responsabile delle trasformazioni in cui sono coinvolte reazioni chimiche fra atomi e/o molecole. Essa è legata alla struttura degli atomi e delle molecole. In realtà dipende dalle interazioni di natura elettrica fra i vari componenti elementari di una sostanza, quindi potrebbe essere trattata nel capitolo sull’elettromagnetismo. Ma, data la complicazione di eseguire calcoli sulle strutture atomiche, e la relativa facilità di misurare, invece, le energie coinvolte nelle relazioni chimiche, è invalso l’uso di definire, catalogare e misurare le energie di natura chimica come una categoria a sé.
3.6. Il secondo principio della termodinamica Il primo principio della termodinamica era solo un’estensione ai fenomeni termici del principio di conservazione dell’energia meccanica. Quindi non esprimeva nulla di concettualmente nuovo. Il secondo principio invece stabilisce che alcuni processi che soddisfacevano il primo principio, quindi in cui l’energia era conservata, in natura e spontaneamente avvenivano in una sola direzione. È qualcosa di completamente nuovo. Nasce la “direzione” del tempo.
termodinamica
117
3.6.1. Processi termodinamicamente reversibili o irreversibili Nel par. 3.1.1 abbiamo dato una definizione intuitiva di reversibilità e irreversibilità di un processo termodinamico. Ora ne daremo una descrizione più formale, utilizzando le variabili che abbiamo definito. Lo stato di un sistema termodinamico è definito quando si conoscono i valori di tutte le variabili di stato del sistema. Per esempio, per un gas perfetto è sufficiente dare due delle tre variabili p, V e T e la quantità di materia coinvolta (n). La trasformazione di un sistema S da uno stato iniziale A a uno finale B è detta reversibile se è possibile riportare il sistema allo stato iniziale A, ripristinando contemporaneamente lo stato iniziale dell’ambiente, o, se vogliamo, senza che l’ambiente sia modificato. Perché una trasformazione termodinamica sia reversibile devono essere soddisfatte queste condizioni: 1. la trasformazione deve essere molto lenta, quasi statica; il sistema, quindi, deve passare attraverso infiniti stati di equilibrio, e le variabili di stato devono essere definite in ogni istante della trasformazione e in ogni punto del sistema; 2. non dobbiamo avere effetti dissipativi (attriti) spuri; dunque, non dobbiamo avere trasformazione di energia meccanica, o di altre forme, in energia termica, oltre a quelli previsti dalle singole trasformazioni; 3. non dobbiamo aumentare il “disordine” del sistema, non dobbiamo perdere informazione; questa condizione sarà più chiara una volta definita la variabile “entropia”. Va notato che tutti i processi macroscopici naturali14 sono irreversibili. Tuttavia, è utile descrivere il comportamento dei sistemi reversibili perché, essendo sistemi ideali, permettono di stabilire dei limiti nelle trasformazioni che diventano limiti universali, validi per qualunque sistema. Il secondo principio della termodinamica ci permetterà di stabilire delle regole di evoluzione dei sistemi reali di validità generale. Nella sua formulazione più ampia verrà esteso anche a sistemi non strettamente termodinamici, diventando un principio universale per la descrizione dei limiti che si hanno nell’evoluzione di un qualunque sistema. Il secondo principio della termodinamica ha varie formulazioni, tutte equivalenti, nel senso che se ne viene assunta una qualunque per vera, tutte le altre sono una conseguenza della prima. Noi le esporremo tutte, in breve. Le due formulazioni di base sono dovute a Kelvin, Max Planck15 e Clausius, ma possiamo enunciarlo anche utilizzando la formu-
118
fisica per filosofi
lazione di Carnot sui cicli termodinamici o quella Boltzmann tramite l’entropia. 3.6.2. Il secondo principio della termodinamica: enunciati di Kelvin-Planck e di Clausius I primi due enunciati equivalenti del secondo principio della termodinamica sono: 1. l’enunciato di Kelvin-Planck (circa 1850) (cfr. fig. 3.4a): Non è possibile avere una trasformazione in cui l’unico risultato sia quello di assorbire del calore da una sorgente a una sola temperatura costante e uniforme, e di trasformarlo integralmente in lavoro.
Quello che si sta dicendo è che una parte del calore assorbito andrà sempre persa cedendola a una sorgente a temperatura inferiore; 2. l’enunciato di Clausius (1850; cfr. fig. 3.4b): Non è possibile avere una trasformazione nella quale l’unico risultato sia un passaggio di calore da un corpo più freddo a uno più caldo.
Quindi, possiamo far passare del calore da un corpo più freddo a uno più caldo, raffreddandolo ulteriormente, ma perché avvenga ciò dobbiamo fornire energia al sistema (è il frigorifero). Se abbiamo due corpi a temperatura diversa e ne permetto lo scambio di calore, allora spontaneamente il corpo più caldo si raffredda e quello più freddo si riscalda. figura 3.4 Il secondo principio della termodinamica nelle due formulazioni di Kelvin-Planck (a) e di Clausius (b) T
Q
S (a)
L= Q L
L< Q
T1
Q
T2
T1 T 1 T1
L
Il rendimento di qualunque ciclo è: η = Q in cui L è il M
L
lavoro fatto e Q = Q 2 è la quantità di calore assorbita. Carnot dimostra che: ηc =
Q1
L Q
c
=1–
T1 T2
T1), avrà un rendimento uguale o minore di quello della macchina di Carnot operante fra le stesse temperature. Il segno uguale valendo se la macchina è reversibile.
Tralasciando le dimostrazioni formali vediamo le relazioni essenziali e il relativo significato. ηi (reale/irreversibile; T1, T2) < ηr (reversibile; T1, T2) = ηc (Carnot; T1, T2) T1 = 1– T2
termodinamica
121
Questo è un risultato importante! Ecco un’applicazione. Consideriamo una macchina termica ideale, reversibile, che lavori tra due sorgenti, una alla temperatura di 0 °C e l’altra alla temperatura di ebollizione dell’acqua, 100 °C: T1 = 0 °C ≅ 273 K T2 = 100 °C ≅ 373 K
Il rendimento sarà: ηc = 1 – 273/373 = 1 – 0,73 = 0,27 = 27% Questo vuol dire che una macchina termica ideale che lavorasse fra queste due temperature avrebbe un rendimento massimo del 27%. Anche nel caso di un sistema ideale non riusciremo mai a convertire tutto il calore Q assorbito dalla sorgente calda in lavoro. Una parte (una gran parte in questo caso: il 73%!) del calore assorbito andrà restituita alla sorgente fredda, e sarà persa per il ciclo che stiamo considerando. C’è un’asimmetria nelle conversioni di energia che non si vedeva dal primo principio della termodinamica: quello che succede è che possiamo sempre trasformare integralmente del lavoro in calore, ma non posso trasformare integralmente del calore in lavoro. Questo risultato è stato ottenuto utilizzando nella dimostrazione l’enunciato di Kelvin-Planck del secondo principio. Per questa ragione il teorema di Carnot potrebbe essere considerato un enunciato alternativo a quelli di Kelvin-Planck e di Clausius. 3.6.5. Conseguenze del secondo principio della termodinamica e del teorema di Carnot Il secondo principio nella formulazione di Kelvin-Planck (cfr. par. 3.6.2) stabilisce l’impossibilità del moto perpetuo di seconda specie, che prevede appunto l’integrale trasformazione in lavoro del calore assorbito da un’unica sorgente di temperatura. Il teorema di Carnot afferma che in un ciclo dobbiamo restituire parte del calore assorbito a una sorgente più fredda. Se lo restituissimo, anche in parte, alla sorgente calda, allora avremmo utilizzato una sola sorgente – a temperatura T2 – e il L T rendimento sarebbe: ηr = = 1 – 1 = 1 – 1 = 0, quindi: L = 0 Q T2 Questo stabilisce l’impossibilità del moto perpetuo di seconda specie, cioè l’impossibilità di ottenere lavoro estraendo calore da una sorgente a una sola temperatura.
122
fisica per filosofi
Un’altra conseguenza del teorema di Carnot riguarda la temperatura termodinamica assoluta; infatti, anche considerando il ciclo ideale di Carnot, quello con il massimo rendimento possibile, abbiamo: ηc ≤ 1 → 1 –
T1 T2
≤1 → –
T1 T2
≤0
Essendo T1 < T2, ne segue che T1 deve essere maggiore o uguale a zero, altrimenti, se T1 fosse minore di zero e T2 maggiore di zero, potremmo avere un rendimento maggiore di 1, o se vogliamo avremmo un numero positivo minore di zero. Un rendimento maggiore di 1 è impossibile, verrebbe contraddetto il primo principio perché avremmo ottenuto più energia di quella assorbita. Il minimo valore numerico di T1 è “0” è lo zero assoluto, espresso in gradi Kelvin. Lo zero assoluto corrisponde a –273,15 °C17. Non è possibile raggiungere lo zero assoluto, anche se è possibile raggiungere temperature molto vicine a esso: la minima temperatura raggiunta in un laboratorio terrestre è stata di circa mezzo miliardesimo di grado Kelvin (T = 0,5 ∙ 10–9 K), mentre la minima temperatura “naturale” misurata sulla Terra è stata di circa –99 °C ≅ 174 K nell’Antartide. Nella costellazione del Centauro si trova la nebulosa Boomerang in cui la temperatura è di –272 °C ≅ 1 K. Si tratta, probabilmente, del luogo con la minore temperatura non artificiale di tutto l’universo.
3.7. L’entropia Con i primi due principi della termodinamica abbiamo stabilito due comportamenti che riguardano le interazioni fra i corpi e le evoluzioni dei corpi stessi. Con il primo abbiamo stabilito che una certa grandezza (l’energia) si conserva, quindi resta costante nel tempo. L’energia in un sistema fisico potrà assumere varie forme: potrà essere energia potenziale, cinetica, termica, elettromagnetica, chimica, nucleare, o in forma di massa secondo la teoria della relatività speciale (cfr. cap. 5), e potremo avere qualunque scambio fra di esse, all’interno del sistema o con l’esterno, ma alla fine il totale sarà rimasto lo stesso.
termodinamica
123
Con il secondo principio abbiamo posto delle limitazioni a questi scambi di energia. Abbiamo visto che, per esempio, se abbiamo due corpi, uno a temperatura più alta e uno a temperatura più bassa, e li mettiamo in contatto, avremo un passaggio di energia spontaneo fra i due, ma solo ed esclusivamente dal corpo più caldo a quello più freddo, e alla fine, dopo un tempo molto lungo, i due corpi si troveranno alla stessa temperatura; non succederà mai che il corpo più caldo diventerà ancora più caldo e quello più freddo ancora più freddo. Il secondo principio ci dice che c’è un’asimmetria nei processi naturali, con una direzione ben precisa. Ma ora sorge un problema: con due corpi a due temperature diverse è tutto semplice, basta applicare il secondo principio per sapere cosa succede. Ma se il sistema è più complicato? Ci piacerebbe avere una grandezza da utilizzare che ci dicesse cosa succede e come. È un po’ come quando abbiamo un oggetto nel campo gravitazionale terrestre: sappiamo che l’energia si conserva, che se abbiamo un sasso in mano e lo lasciamo libero questo cadrà verso il basso. E che se lo tiriamo verso l’alto con un certo angolo salirà per un po’ per poi ricadere più o meno lontano. Ma, se volessimo calcolare esattamente la traiettoria di un oggetto lanciato in un campo gravitazionale, cosa potremmo fare? In questo caso basta applicare le leggi di Newton, abbiamo “inventato” delle grandezze che abbiamo chiamato forza, massa e accelerazione e scrivendo la legge F = m ∙ a insieme al principio della conservazione dell’energia possiamo calcolare la velocità del sasso in ogni momento, la sua traiettoria, dove arriva se lo lanciamo, qual è la massima altezza che raggiungerà ecc. Ma con i processi termodinamici? Abbiamo visto che la grandezza “energia” non è sufficiente per descrivere quello che accade, ci sono dei processi che conservano l’energia ma che sono vietati dal secondo principio. Quindi, dobbiamo trovare una nuova grandezza che descriva in modo quantitativo cosa succede nei processi naturali. Questa grandezza è l’entropia, una grandezza fondamentale per descrivere – quantitativamente – quasi tutti i fenomeni esistenti, in particolare per scoprire come evolve un sistema, anche molto complicato, se lasciato libero di evolversi. Il concetto di entropia viene dato a partire dalla termodinamica, e potrà sembrare un po’ complicato, non completamente intuitivo, ma con Boltzmann assumerà una forma molto più generale ed elegante. L’entropia non sarà altro che una misura del “disordine” di un sistema.
124
fisica per filosofi
3.7.1. L’entropia: definizione termodinamica classica L’entropia può essere definita in contesti molto diversi: ne possiamo dare la definizione classica, utilizzando le grandezze già definite in termodinamica che fanno riferimento a proprietà macroscopiche dei sistemi fisici (temperatura, pressione, volume, quantità di calore, energia) oppure possiamo darne una definizione microscopica utilizzando delle grandezze microscopiche (la posizione e la velocità nello spazio di tutte le particelle che compongono il sistema). Vedremo come questa seconda definizione sia molto più generale e che la si potrà estendere a sistemi anche non strettamente termodinamici. Possiamo, inoltre, dare una definizione dell’entropia anche nell’ambito della teoria dell’informazione, legandola al contenuto di informazione presente in un messaggio trasmesso e/o ricevuto. Vediamo la definizione classica, che non sembra per nulla intuitiva, anzi appare abbastanza complicata: definiamo l’entropia, che chiameremo S, come quella grandezza la cui variazione dS in una trasformazione infinitesima reversibile è uguale al rapporto fra il calore assorbito e la temperatura assoluta a cui avviene la trasformazione: dS ≝
δQ (reversibile) T
o anche: ∆S (stato 0 → stato A) = SA – S0= ∑
A δQ Qi i = ∫0 Ti r Ti r
Vediamo il significato di quello che abbiamo scritto. Intanto, diversamente da altre, c’è il fatto che la definizione di entropia viene data per la differenza di entropia in una certa trasformazione, sia essa infinitesima o no. Questo vuol dire che, per ora, il valore dell’entropia è definito a meno di una costante. Non è un problema. È simile a quello che abbiamo incontrato definendo l’energia potenziale gravitazionale. Quando alziamo una massa sopra la superficie terrestre quello che possiamo calcolare è la variazione dell’energia potenziale della massa – che poi è uguale all’energia che dobbiamo spendere per compiere l’operazione – ma lo “zero” dell’energia potenziale può essere posto all’infinito (come fanno gli astrofisici) o sulla superficie
termodinamica
125
terrestre (come fanno altri fisici), il risultato non cambia. La cosa importante è che per fissare la costante dell’entropia dovremo scrivere il terzo principio della termodinamica, ma questo lo vedremo più in là. Ora ci possiamo chiedere perché utilizzare questa strana definizione, in cui abbiamo una combinazione della temperatura, che è una variabile di stato, con il calore scambiato che, invece, dipende dal tipo di trasformazione. Riprendiamo il risultato del teorema di Carnot: abbiamo, dopo qualche calcolo, che, per un ciclo reversibile ∑i
Qi =0 Ti r
Ma questo ci dice che esiste una certa grandezza (il rapporto fra il calore scambiato e la temperatura a cui avviene lo scambio) che in un ciclo reversibile torna allo stesso valore iniziale e che, dunque, è una variabile di stato. Questa nuova variabile di stato la chiamiamo “entropia”, e la definiamo così: Q S (stato A) = ∑ i + c dove c è una costante che dobbiamo anTi r cora fissare. Ma tutte le trasformazioni reali sono irreversibili, quindi quale può essere l’utilità di una grandezza definita per i processi reversibili? Il fatto è che la grandezza S è una variabile di stato, perciò il valore che assume è indipendente dalle trasformazioni utilizzate per arrivare a quello stato. Questo è un punto delicato: S è una variabile di stato, pertanto il suo valore dipende solo dallo stato in cui si trova il sistema a cui si riferisce, non da come ci sia arrivata, ma per calcolarla dobbiamo utilizzare una trasformazione reversibile. Vediamo come utilizzare questa proprietà per una trasformazione generica. Riprendiamo il teorema di Carnot scritto per trasformazioni cicliche reversibili o irreversibili, ricordando (cfr. par. 3.6.4) che l’uguale (=) indica le trasformazioni reversibili, mentre il segno maggiore o minore (>, vm
vm
v
Stato dopo aver selezionato le velocità delle particelle vm,1
(a)
(b)
vm,2
v
— Nei grafici in (b) si è riportato in ascisse il modulo della velocità v = |vˉ| = √v2. Il diavoletto “guarda” le molecole che si avvicinano allo sportellino e, a seconda che la loro velocità sia maggiore o minore della velocità media iniziale delle molecole del gas, le fa passare da una parte o dall’altra, come rappresentato in (a), aprendo o chiudendo lo sportellino che si muove senza attrito. Dopo un certo tempo avremo una parte – per esempio, la destra – con le molecole più veloci, quindi con gas più caldo, e una – la sinistra – con le molecole più lente, perciò con gas più freddo. Avremo, pertanto, due contenitori di gas a due temperature diverse, da cui possiamo ottenere del lavoro, pur essendo partiti da una sorgente a una sola temperatura: questo viola il secondo principio della termodinamica. Il punto chiave è che sapere la velocità delle molecole vuol dire avere un’informazione, e questo costa energia.
3.10. Entropia e informazione: un accenno Finora abbiamo dato due diverse definizioni di entropia, una termodinamica e una statistica. Ricordiamole: supponendo di considerare un sistema fisico A all’equilibrio in un certo stato, oppure un evento A, anch’esso definito dai parametri che lo caratterizzano, possiamo definirne l’entropia S(A): 1. la definizione termodinamica: S (A)≝ ∑
Qi Ti
r0→A
+ S(T = 0 K)
22
O (o K) e A sono stati di equilibrio, questo vuol dire che i parametri macroscopici che descrivono il sistema non dipendono dal tempo, sono costanti;
140
fisica per filosofi
2. la definizione statistica: S(A) ≝ kB ∙ ln W(A) + c
W(A) = numero di microstati W(A) W(A) P(A) = probabilità di A = = ln W(A) + = ln P(A) = ln NTOT NTOT costante 1 P → grado di fiducia ∝ grado di incertezza Ora daremo un’estensione del concetto di entropia elaborata nel 1948 da Claude E. Shannon (1916-2001) legata alla teoria dell’informazione da lui sviluppata in una serie di lavori fra il 1948 e il 1950. La grandezza “informazione” viene definita quantitativamente nel 1948 (cfr. Shannon, 1948); lo studioso statunitense scrive che la quantità di informazione contenuta in un messaggio è proporzionale alla quantità di entropia (preceduta dal segno meno), diviso per la costante di Boltzmann e, quindi, all’inverso della probabilità associata allo stato stesso: I(A) =
1 1 S(A) ∝ – ln P(A) = ∝ kB ln P(A) P(A)
Dunque la quantità di informazione contenuta in un messaggio è tanto maggiore quanto minore è la probabilità del messaggio, e viceversa. Ribaltando il concetto abbiamo che l’entropia di uno stato è legata alla probabilità dello stato stesso e pertanto, inversamente, al suo contenuto di informazione. Qualche esempio chiarirà il concetto. Immaginiamo di essere dei docenti e di rivolgerci agli studenti di un’università statale con sede, per esempio, a Roma, nella quale insegniamo e in cui teniamo di solito lezione di venerdì. 1. P grande → I è piccola: nella situazione appena esposta, le seguenti affermazioni sono quasi ovvie, hanno tutte un’altissima probabilità di essere vere, quindi contengono poca informazione: a) “La maggioranza di voi è di nazionalità italiana”; b) “Venerdì prossimo faremo lezione”; c) “Voi possedete almeno un cellulare”.
termodinamica
141
2. P piccola → I è grande: nella medesima situazione, le seguenti affermazioni sono, invece, molto improbabili, perciò il contenuto di informazione è maggiore: a) “Non faremo più lezione di venerdì”; b) “Nessuno di voi è di nazionalità italiana”; c) “Lei [rivolto a uno studente a caso] ha appena ricevuto una telefonata da sua sorella”23. La grandezza I(A) che, abbiamo scritto sopra, viene chiamata “autoinformazione” e viene definita come la quantità di incertezza associata all’evento (allo stato) A. Shannon scrive la misura della quantità di informazione contenuta in un messaggio come il logaritmo in base 2 dell’inverso della probabilità di occorrenza di quel messaggio: I(A) = log2
1 = log21 – log2P(A) = – log2 P(A) P(A)
Utilizzare il logaritmo in base 2 cambia solo l’unità di misura rispetto al logaritmo in base 10 o in base “e”, ma è comodo: qualunque messaggio deve essere trasmesso tramite una serie di simboli diversi. Possiamo sceglierne 21 (alfabeto italiano), 26 (alfabeto inglese), 10 (caratteri decimali), ma il numero più piccolo di simboli necessari se vogliamo trasmettere un messaggio o un’informazione è ovviamente 2 (sì/no, 0/1). Quindi la più semplice unità di misura dell’informazione è quella legata a 2 stati possibili: [0; 1], [sì; no], [Invio; non invio] Un solo stato (per esempio, 1) non è sufficiente: dobbiamo codificare la possibilità di non ricevere lo stato (per esempio, con 0) se vogliamo che ci sia un’informazione. L’informazione legata al ricevimento di uno dei due stati con P (stato) = ½ è: I(0) = I(1) = log2
1 1 = log2 1 – log2 P(0) = 0 – log2 = log2 2 = 1 bit P(0) 2
Quindi U = 1 bit è la minima quantità di informazione, quella in grado di indicare una di due possibilità (in teoria equivalenti). Un messaggio fornisce quindi tante più informazioni quanto meno è “probabile” il messaggio inviato. Se abbiamo N possibili simboli di-
142
fisica per filosofi
versi da trasmettere, allora la probabilità di averne 1 è 1/N. Quanto più grande è N tanto più piccola è P. Se P è molto piccola (messaggio molto poco probabile), allora la quantità di informazione che può trasportare è: I = – log2 P = log2 N Nella tab. 3.2 abbiamo riportato alcuni esempi calcolando, per alcuni oggetti che possono contenere/trasportare informazione, il numero di possibili stati, la relativa probabilità e il corrispondente numero di bit. È importante ricordare che volendo trasmettere un messaggio dobbiamo sempre suppore che chi lo riceve abbia una tabella per la “decodifica” del messaggio stesso, cioè che lo possa capire. Altrimenti il messaggio viene trasmesso, ma, non essendo capito, la reale trasmissione di informazione è nulla. A questo punto possiamo attribuire alla grandezza “informazione” le caratteristiche dedotte per la grandezza “meno (–) entropia”. Quindi, avremo una direzione nell’evoluzione libera dell’informazione. In un sistema reale chiuso (isolato): 1. l’entropia S aumenta sempre; 2. la quantità di informazione I diminuisce sempre. In questo senso un sistema è veramente isolato se, oltre e non scambiare energia o lavoro tramite le trasformazioni strettamente termodinamiche, non scambia neanche informazione con l’esterno. In tutto quanto detto sopra non si è mai parlato della perdita di informazione legata alla decodifica del segnale da parte di chi lo riceve. Ma questo andrebbe oltre gli scopi di questo libro (per un elenco di citazioni relative al problema, cfr. il paragrafo successivo).
3.10.1. L’informazione: definizioni varie La grandezza “informazione”, pur avendo una definizione formale, è legata a una serie di aspetti collaterali che ne allargano, modificano e rendono spesso ambiguo il significato dato dalla relazione di Shannon. Infatti, nel momento in cui si tratta non solo di trasmettere o ricevere una stringa di caratteri, ma anche di darle un significato, sia esso intrinseco o attribuito da chi lo debba decodificare, è chiaro che si apre un panorama pressoché infinito di interpretazioni legate al comportamento umano, ai linguaggi utilizzati ecc.
1, 2… 6
a, b… z
aaaaa, aaaab, aaaba…
abcde, abced, abecd…
abaca, abaco, abate…
Dado a 6 facce
Lettera dell’alfabeto latino (26 grafemi)
Parola di 5 lettere qualunque, con ripetizioni
Parola di 5 lettere qualunque, senza ripetizioni
Parola di 5 lettere in italiano (valore molto approssimato)
~ 10 000
26!/21! = 8 · 106
265 = 11,8 ∙ 106
26
6
2
Numero N di stati
–2
1 · 10–5
1,25 · 10–7
8,47 · 10–8
1/26 ≅ 3,85 · 10
1/6 ≅ 0,167
1/2 = 0,5
13,3
22,9
23,5
4,7
2,58
1
Probabilità* p(N) = 1/N Numero di bit** = – log2 p(N) = log2 N
* La probabilità associata a ogni singolo elemento di una certa base è uguale all’inverso del numero di elementi totali esistenti. ** Sono corrispondenti all’unità di informazione nella “base” proposta (si è utilizzato log2 N = 3,322 ∙ log10 N).
T, C
Stati possibili
Moneta
Elemento base
tabella 3.2 Alcuni esempi di unità di informazione, da quella elementare (2 stati → 1 bit) a unità più complesse (singole parole di 5 lettere in lingua italiana)
144
fisica per filosofi
Non è certo questo il luogo in cui approfondire questi aspetti; tuttavia, per dare un’idea della complessità del problema riporteremo di seguito un elenco, parziale, delle tante definizioni date per il termine “informazione”. 1. È la causa di una reazione all’ambiente. 2. È ciò che, per un osservatore o un recettore posto in una situazione in cui si hanno almeno due occorrenze possibili, supera un’incertezza e risolve un’alternativa, cioè sostituisce il noto all’ignoto, il certo all’incerto. In altre parole, riguarda il contesto in cui i dati sono raccolti, la loro codifica in forma intellegibile e il significato attribuito a tali dati. 3. L’informazione collegata a un simbolo è definita come: S 1 I = ln = – ln P = – dove P è la probabilità di trasmissione di KB P quel simbolo. 4. È un messaggio ricevuto e compreso. 5. È il contenuto di un messaggio. Con tale significato il termine viene utilizzato nella scienza che studia i canali di trasmissione dei messaggi. 6. Fisher information, utilizzata nell’applicazione della statistica alla teoria della stima e alla scienza in generale. La Fisher information è considerata come la quantità di informazione che un messaggio trasporta su un parametro non osservabile. Può essere calcolata dalla conoscenza della funzione di probabilità che definisce il sistema. Per esempio, con una funzione di verosimiglianza normale, l’informazione di Fisher è il reciproco della varianza di questa funzione. 7. È ogni tipo di schema che influenza la formazione o la trasformazione di altri schemi. 8. In un documento: l’informazione creata, ricevuta e gestita come prova e informazione da un’organizzazione o da una persona, nel rispetto di obblighi di legge o nella transazione commerciale. 9. Secondo Shu-Kun Lin, è la quantità di dati dopo la compressione dei dati. 10. Secondo Gregory Bateson, è una differenza che produce una differenza. 11. Per John R. Peirce, essa integra separatamente gli aspetti di segni ed espressioni. La teoria dell’informazione di Peirce viene definita tramite
( )
termodinamica
145
i concetti di denotazione ed estensione da un lato, e dalla connotazione e comprensione dall’altro. 12. Shannon: «la parola che la designa ha ricevuto significati diversi da vari scrittori nel campo generale della teoria dell’informazione. È probabile che almeno alcune di queste si dimostrino sufficientemente utili in alcune applicazioni per meritare ulteriori studi e un riconoscimento permanente. Non ci si può aspettare che un singolo concetto di informazione spieghi in modo soddisfacente le numerose possibili applicazioni di questo campo generale». 13. Secondo Luciano Floridi, è comunemente riportata a quattro tipi di fenomeni mutuamente compatibili: a) l’informazione su qualcosa (per esempio, una tabella con l’orario dei treni); b) l’informazione come qualcosa (per esempio, il dna o le impronte digitali); c) l’informazione per qualcosa (per esempio, algoritmi o istruzioni); d) l’informazione in qualcosa (per esempio, uno schema o un vincolo). 14. È comunemente utilizzata così metaforicamente o così astrattamente che il significato non è chiaro. 15. È una coppia composta: a) da una rappresentazione materiale (che ne costituisce il formante), b) da un insieme di interpretazioni (che ne costituiscono il formato), la cui natura, evenemenziale, consiste in un cambiamento di stato che, tramite l’occorrenza di tale rappresentazione materiale, provoca l’attivazione del corrispondente campo interpretativo, secondo le regole fissate da un codice prestabilito. 16. La quantità di informazione è una misura espressa in bit della libertà di cui si dispone nello scegliere un messaggio dall’insieme di quelli disponibili, anche se senza significato.
3.11. Il terzo principio della termodinamica: teorema di Nernst Il terzo principio della termodinamica è in realtà un teorema (il teorema di Nernst), enunciato da Nernst nel 1906 e dimostrato in maniera rigorosa da Masanes e Oppenheim nel 2017 (Masanes, Oppenheim, 2017),
146
fisica per filosofi
che può essere dimostrato partendo dagli altri principi. Il terzo stabilisce il valore della costante presente nella definizione della grandezza “entropia” e si può enunciare così: L’entropia di un cristallo perfetto allo zero assoluto è zero.
Per “cristallo perfetto” si intende un cristallo composto dai soli atomi del cristallo (quindi, senza inclusioni di altri atomi o molecole), e con una diposizione spaziale definita totalmente dalla sua struttura cristallina (dunque, senza fratture o simili). In alcuni enunciati si fa riferimento all’entropia di un qualunque sistema fisico. In realtà non è completamente corretto perché se si considera un sistema non perfettamente omogeneo potremo sempre considerare la probabilità associata ai due o più stati microscopici e un eventuale passaggio da uno stato all’altro. Questo cambierebbe l’entropia dello stato che pertanto non sarebbe univocamente definita. Un altro enunciato dello stesso principio, sempre derivabile dagli altri principi è: Non è possibile per un qualunque sistema arrivare alla temperatura dello zero assoluto con un numero finito di passaggi in un tempo finito.
Questo enunciato sancisce l’impossibilità di raggiungere lo zero assoluto.
3.12. Il principio zero della termodinamica Abbiamo lasciato per ultimo il principio zero, necessario per definire la grandezza “temperatura”, perché si tratta di una raffinatezza che, in questa sede, non aggiunge molto alla comprensione della termodinamica. Il problema era la definizione univoca della temperatura. Sembrerà strano, ma fino ai primi del Novecento tutti i fisici utilizzavano questa grandezza senza che ne fosse stata data una definizione rigorosa e autoconsistente. Il principio zero della termodinamica, scritto nel 1931, si enuncia così: Se un corpo A è in equilibrio termico con un corpo B, e il corpo B è a sua volta in equilibrio termico con un altro corpo C, allora il corpo A è in equilibrio termico con il corpo C.
termodinamica
147
Percorso storico-filosofico 4. Unità della natura e conservazione dell’energia La credenza nell’unità della natura, cioè nella possibilità di ridurne i fenomeni a principi e leggi unitarie, è antica quanto la filosofia. Questa intuizione, infatti, è già presente nei cosiddetti “fisiologi” della Ionia del vii-vi secolo a.C., come Talete e Anassimene, con la proposta di individuare un singolo “principio” (archè), come l’acqua e l’aria, in alternativa alle molteplici spiegazioni mitologiche degli eventi naturali. Nella scienza moderna questa idea è rielaborata dal punto di vista della concezione meccanicistica del mondo, secondo cui ogni fenomeno dipende dai movimenti e dalle interazioni di particelle di materia dotate di massa. Se la meccanica è fin dall’inizio costruita a partire da questo concetto di materia, il problema aperto è di includere nel quadro della fisica moderna fenomeni diversi come le reazioni chimiche, la luce, l’elettricità, il magnetismo, il calore. Rispetto a questo problema, nel xviii secolo prevale la tendenza ad attribuire i diversi fenomeni ad altrettanti fluidi, come il calorico o l’etere (un materiale diffuso in tutto lo spazio, capace di volta in volta di trasmettere luce, elettricità e altri fenomeni, da non confondersi con l’etere celeste dell’aristotelismo). Questa concezione, tuttavia, lascia aperti diversi problemi. In primo luogo, quello di provare sperimentalmente l’esistenza di tali fluidi o materiali, alcuni dei quali ritenuti “imponderabili”, cioè privi di peso. In secondo luogo, il problema della reciproca convertibilità di questi fluidi o materiali, che sembra conseguire dal principio, assunto nella meccanica classica, che la quantità di materia nell’universo si conservi senza aumentare né diminuire. L’Ottocento è un secolo di svolta per tutte queste questioni e conduce a un profondo riassetto teorico destinato a caratterizzare la fisica successiva. Nei primi decenni del secolo, diversi risultati sperimentali rafforzano l’ipotesi dell’unità delle forze della natura: pensiamo allo studio delle relazioni tra forze elettriche e chimiche (elettrochimica), alla scoperta dell’elettromagnetismo e dell’induzione elettromagnetica, alle ricerche sull’equivalenza tra calore e lavoro meccanico e a quelle sui nessi tra calore ed elettricità, e tra calore e processi fisiologici negli animali. È importante sottolineare che queste scoperte non sono accidentali, ma al contrario sono guidate dalla concezione filosofica dell’unità della natura e dell’equivalenza delle potenze naturali. Per
148
fisica per filosofi
esempio, Hans Christian Ørsted (1777-1851), scopritore dell’elettromagnetismo, è influenzato dalla filosofia di Kant e dalla dottrina romantica della profonda unità metafisica che sta a fondamento di tutti i fenomeni naturali e li collega. Anche Michael Faraday (1791-1867), scopritore dell’induzione elettromagnetica, era profondamente persuaso dell’identità e della reciproca convertibilità delle “forze” che stavano alla base dei fenomeni elettrici, magnetici, chimici e luminosi, e indagò anche un possibile legame tra elettricità e gravità. Nelle sue Ricerche sperimentali sull’elettricità e il magnetismo, egli scrive: Le varie forme in cui si manifestano le forze della materia hanno un’origine comune; o, in altre parole, sono così direttamente connesse e mutuamente dipendenti da essere convertibili, per così dire, una nell’altra, e da possedere equivalenti di potenza nella loro azione (Faraday, 1846, pp. 1-2).
Ciò che distingue queste idee rispetto al passato è il tentativo, tipico della scienza ottocentesca, di esprimerle attraverso una formulazione matematica. Si pone allora la questione di confrontare queste ricerche con le leggi di conservazione meccaniche. Come abbiamo accennato, l’esigenza di stabilire delle leggi di conservazione nei fenomeni relativi a materia e movimento è avvertita fin dalle prime formulazioni della meccanica moderna. Cartesio include tra le leggi di natura quella di conservazione delle quantità di materia e di moto (che nell’attuale formulazione equivalgono rispettivamente a massa e impulso m ∙ v). Anche Newton assume la conservazione della quantità di materia e tra le sue “regole del filosofare” – nella prima edizione dei Principi matematici della filosofia naturale – ne include una dedicata alla trasformazione della materia da una forma all’altra. Egli, tuttavia, non pone una conservazione della quantità di movimento, assumendo che la dissipazione del moto nell’universo possa essere periodicamente compensata dall’azione di Dio. Tra i filosofi del xvii secolo è Leibniz quello che presta maggiore attenzione al problema della conservazione, partendo dall’assioma secondo cui la causa equivale all’effetto, cioè tutto ciò che accade in natura deve essere contenuto nella sua causa. Sul piano della meccanica, questo porta alla formulazione della legge di conservazione della “forza viva” (m ∙ v2), che anticipa la successiva concezione del lavoro meccanico. Inoltre, Leibniz assume che negli urti anelastici la perdita di movimento
termodinamica
149
a livello macroscopico debba essere compensata da una sua conversione a livello microscopico. Anche tale intuizione sarà rielaborata dalle ricerche della termodinamica. Tutte queste teorie fanno capo a una concezione di una “potenza” inerente alla materia, che in date circostanze si libera e produce degli effetti. Ma la presenza di concetti come potenza ed energia, in Leibniz, rimanda ancora alla filosofia aristotelica. Per arrivare al concetto di energia nel suo significato attuale bisogna aspettare le formulazioni ottocentesche, che danno conto delle nuove acquisizioni empiriche di cui si è detto sopra. La prima formulazione matematica del principio della conservazione dell’energia nel senso attuale è dovuta a Hermann von Helmholtz (1821-1894). Fisico, fisiologo e conoscitore della filosofia, riesce ad abbracciare con le sue rare competenze l’intero campo delle ricerche che, nel xix secolo, ruotavano intorno all’idea della conservazione. Egli stesso compie ricerche sperimentali innovative su processi fisiologici come il movimento muscolare, tentando di provarne sperimentalmente la dipendenza da forze fisico-chimiche, tipiche della natura inorganica. L’espressione compiuta del suo principio si trova nel saggio Sulla conservazione della forza. Come si evince dal titolo, per Helmholtz ciò che è indistruttibile in natura sono, in ultima analisi, forze di attrazione e repulsione che si propagano dalla materia, che a loro volta devono seguire leggi immutabili: «Il compito di ricondurre fenomeni naturali a forze immutevoli, attrattive o repulsive [è] la condizione della completa intelligibilità della natura» (Helmholtz, 1996c, p. 53). Ma l’espressione matematica di questa conservazione fa riferimento all’azione svolta da queste forze: Helmholtz parla di “forza viva” e di “forza di tensione” per indicare le quantità che, vent’anni dopo, sarebbero state chiamate per la prima volta “energia cinetica” ed “energia potenziale”. La somma di queste due quantità, secondo il principio di Helmholtz, si conserva in ogni fenomeno naturale, inclusi quelli meccanici, termici, elettromagnetici. La formulazione del principio di conservazione dell’energia ha importanti conseguenze filosofiche. In primo luogo, Helmholtz esclude che si possano dare delle specifiche “forze vitali” negli organismi, distinte da quelle dei processi inorganici: ogni fenomeno naturale, infatti, deve essere sottoposto alla medesima legge delle forze, per cui anche i processi biologici devono essere riconducibili a concetti e misure meccaniche. In secondo luogo, gli stessi processi cognitivi dell’uomo dipendono da processi nervosi dotati di durata misurabile e soggetti alla conver-
150
fisica per filosofi
sazione dell’energia, e un discorso analogo, in linea di principio, vale per ogni processo psicologico. Si pone, così, un nuovo problema: se l’intero campo dei fenomeni naturali è riportato a leggi fisiche deterministiche, cioè tali da fare previsioni matematicamente necessarie, e se i fenomeni psichici sono fenomeni naturali a tutti gli effetti, come spiegare aspetti dell’esperienza soggettiva come il ragionamento o il libero arbitrio? La questione viene affrontata da filosofi e scienziati assumendo un postulato del principio dell’energia, vale a dire la “chiusura causale” del mondo fisico. Secondo questo postulato non si possono dare in natura effetti che causati da entità estranee all’ordine naturale, poiché questo modificherebbe la quantità di energia nel mondo. Ogni fenomeno osservabile in natura, quindi, deve essere prodotto da cause che operano secondo il principio della conservazione dell’energia24. Un’altra importante conseguenza del principio di conservazione dell’energia è una modificazione del rapporto tra la formulazione matematica della fisica e gli oggetti a cui questa si riferisce (o, come si dice in filosofia, la sua ontologia). Ancora negli ultimi decenni dell’Ottocento è diffusa la concezione secondo cui il formalismo matematico della fisica fa sempre riferimento all’esistenza di particelle e corpi dotati di proprietà meccaniche. Un esempio cruciale è quello di Thomson (Lord Kelvin), protagonista della ricerca termodinamica. Nel suo Trattato di filosofia naturale (1867), scritto con Peter G. Tait, conia i termini di energia “cinetica” e “potenziale”, e sostiene che l’energia sia il concetto fondamentale della fisica grazie alla sua capacità di esprimere relazioni valide per tutti i fenomeni. Ma Kelvin ritiene che ogni forma di energia sia in ultima analisi riconducibile all’energia meccanica, difendendo il primato epistemologico del meccanicismo. Non mi sento mai soddisfatto fintanto che non mi sia riuscito di costruire un modello meccanico dell’oggetto che sto studiando; se riesco a farmi un tale modello, allora capisco; se non ci riesco, allora non capisco (Thomson, 1904, p. 270).
Quest’ultima osservazione è rivolta alla teoria elettromagnetica di Maxwell, che Kelvin dichiarava di non capire. Maxwell, infatti, aveva ammesso che il campo elettromagnetico potesse corrispondere alla trasmissione di un effetto in un mezzo meccanico (etere), ma aveva sostenuto che l’uso di leggi matematiche (come la conservazione dell’energia) permetteva di studiare le proprietà di un sistema fisico senza
termodinamica
151
conoscerne tutti i meccanismi interni, cioè senza formarsi particolari modelli meccanici. In generale, alla fine dell’Ottocento l’uso di modelli molecolari e dell’etere meccanicistico, che aveva fino a quel momento garantito l’unità della natura in base a un’ontologia meccanicista, è in crisi. Il filosofo Ernst Mach, nella Meccanica nel suo sviluppo storico-critico del 1883, sostiene che il meccanicismo sia un’interpretazione arbitraria dei processi naturali, spingendosi fino a negare la realtà degli atomi (cfr. Mach, 1977). Sullo sfondo di queste discussioni, alimentate dallo sviluppo del concetto di energia, si sarebbero formate le due teorie destinate a rivoluzionare nuovamente la fisica, la relatività speciale e la meccanica quantistica.
4 Elettromagnetismo
elettromagnetismo Premessa Esiste una proprietà dei corpi materiali chiamata carica elettrica; questa può assumere valori positivi, negativi o nulli. Principi dell’elettromagetismo 1. In un sistema chiuso la carica elettrica si conserva. 2. La carica elettrica è un invariante, non dipende dal sistema di riferimento in cui viene misurata. La forza su una carica elettrica La forza di natura elettromagnetica su una carica elettrica q è: – – F = q ∙ (Ē + ˉv × B) – dove Ē è un campo creato da altre cariche elettriche fisse, mentre B è un campo creato da altre cariche elettriche in movimento. – Il campo elettrico Ē e il campo magnetico B Una carica elettrica q puntiforme genera, a una distanza R dalla carica, un campo elettrico Ē: q – E(q, R) = k 2 Rˆ R Un tratto infinitesimo di filo dl percorso da una corrente elettrica i genera, a una – distanza R dal tratto di filo, un campo infinitesimo dB: – – μ dl × R – dB(i, dl, R) = i R2 2π Le due grandezze k e μ sono due costanti che dipendono solo dal tipo di materiale presente nello spazio e dalle proprietà dello spazio vuoto.
154
fisica per filosofi
4.1. Introduzione – Quando Newton scrive il secondo principio della meccanica (F = m ∙ ā) introduce il concetto di forza. La legge è generale, vale per qualunque forza, ma all’epoca di Newton l’unica forza che si conosceva in modo tale da poterne dare una definizione formale, nel senso di poter scrivere una formula che permettesse di calcolarla, era la forza di gravità, descritta dalla legge di gravitazione universale, legata a una proprietà ben definita di tutti i corpi, la massa. Tuttavia, già all’epoca esistevano altre “forze” di cui non si sapeva dare una descrizione formale, anche se note da secoli. Stiamo parlando delle forze di origine elettrica e magnetica. Nel mondo occidentale il primo “scienziato” che si accorse che sfregando un bastoncino di ambra si potevano attrarre dei piccoli pezzi di materiale fu, probabilmente, Talete, nel vi secolo a.C. E, sempre in Occidente, fin dal v-vi secolo si utilizzava la bussola, un sottile ago di ferro magnetizzato che, se libero di muoversi, ruotava ponendosi sempre in direzione nord-sud. Esistevano, quindi, almeno due forze diverse da quella di gravità, sebbene non se ne conoscesse la natura né il comportamento. La descrizione di queste due forze e delle leggi che ne derivavano fu un percorso complesso compiuto fra il xviii e il xix secolo, arrivando a una descrizione completa non solo delle forze elettriche e magnetiche, ma anche alla descrizione di qualcosa che fino ad allora sembrava completamente indipendente da queste due: la propagazione della luce. Questo lavoro di unificazione fu compiuto da Maxwell che scrisse le famose equazioni che portano il suo nome (cfr. Maxwell, 1864): quattro equazioni differenziali che permettono di trattare tutti i fenomeni legati alla presenza di cariche elettriche, ferme o in moto, nel vuoto o nei mezzi materiali1. In questo capitolo descriveremo i principi che stanno alla base dei fenomeni elettrici, magnetici ed elettromagnetici e che, insieme alla meccanica e alla termodinamica, formano il corpus di quella che viene chiamata fisica classica.
4.2. Una nuova proprietà: la carica elettrica Fino al xviii secolo le proprietà necessarie per descrivere il moto di un corpo in rapporto agli altri erano, in linea di principio: la posizione e la velocità in un qualunque istante di tempo, l’eventuale configurazione
elettromagnetismo
155
spaziale (per un corpo esteso) e la sua massa2. L’elettromagnetismo nasce quando si scopre che a ogni corpo possiamo – o meglio, dobbiamo – attribuire una nuova proprietà necessaria per descrivere alcuni fenomeni non spiegabili tramite la forza di gravità agente sulla massa: la carica elettrica. La carica elettrica è, quindi, un’ulteriore proprietà, oltre alla massa, che dobbiamo attribuire a ciascun corpo. Per fare questo dobbiamo aver definito tutte le procedure necessarie per misurare e perciò dare un valore numerico a questa nuova proprietà. Può essere fatto partendo dalla legge F = m ∙ a. È quello che faranno i fisici del xviii-xix secolo. 4.2.1. Proprietà della carica elettrica La carica elettrica ha due proprietà fondamentali che possono essere assunti come principi: 1. la carica elettrica posseduta da un corpo non dipende dalla scelta del sistema di riferimento in cui viene misurata; cioè, è un invariante; 2. la carica elettrica totale di un sistema chiuso (che non può scambiare massa con l’esterno) rimane costante; non si può “creare” una carica elettrica: la carica elettrica totale di tutto l’universo è costante. L’elettromagnetismo non è altro che l’insieme delle relazioni necessarie per descrivere il comportamento dei corpi dotati di carica elettrica quando interagiscono fra di loro. Ma la cosa è più complicata di quanto non fosse la trattazione della meccanica, in cui avevamo solo la forza di gravità. Le interazioni tramite la carica elettrica dipendono in modo essenziale anche dal moto relativo delle varie cariche. Vediamo per il momento la situazione più semplice: cosa succede se abbiamo delle cariche elettriche ferme le une rispetto alle altre. 4.2.2. Interazione fra cariche elettriche ferme: la legge di Coulomb Charles A. de Coulomb (1736-1806) osservò (avendo costruito vari strumenti con cui analizzare le interazioni di natura elettrica) che corpi dotati di carica elettrica si attraggono o si respingono con una legge identica (formalmente) a quella di gravitazione universale: qq F–= k 1 22 Rˆ R
156
fisica per filosofi
figura 4.1 Forze di interazione gravitazionali ed elettriche esercitate dal corpo (M, Q) sul corpo (m, q) M∙m – ˆ M, m > 0 F (m) = – G R; R2 (a)
Q∙q – ˆ Q, q>≤ 0 F (q) = k R; R2 (b)
La forza gravitazionale è sempre attrattiva
La forza elettrostatica è repulsiva, attrattiva o nulla
Le due forze sono indipendenti, la forza totale è la somma delle due q
m F(m) M
– R
Q
F(q)
– R
Caso in cui le cariche Q e q hanno lo stesso segno; se il segno fosse diverso la forza sarebbe attrattiva La figura schematizza le forze di interazione gravitazionali (sempre attrattive) – in (a) – ed elettriche (repulsive se le cariche hanno lo stesso segno, attrattive se esse hanno segno opposto e nulle se la carica elettrica è zero) – in (b) –, su un corpo di massa m, carica elettrica q, a distanza R dal corpo di massa M e carica elettrica Q. Le forze indicate sono quelle esercitate dal corpo (M, Q) sul corpo (m, q). Sul corpo (M, Q), per il terzo principio della dinamica, si eserciteranno le stesse forze, con la stessa direzione e verso opposto.
Questa è la legge di Coulomb, dove k è una costante che dipende dal mezzo in cui si trovano le cariche elettriche. È il mondo dell’elettrostatica, descrive ciò che avviene quando facciamo interagire delle cariche elettriche ferme. Esistono, quindi, almeno due proprietà dei corpi “semplici” – intendendo come “semplici” corpi molto piccoli, idealmente puntiformi –: la massa m e la carica elettrica q, descritte dalle due leggi, quella di gravitazione universale di Newton e quella di Coulomb (cfr. fig. 4.1). Le due leggi hanno la stessa dipendenza dalla distanza: le intensità decrescono entrambe con il quadrato della distanza, ma hanno tre differenze fondamentali: 1. il segno della forza: la massa di un corpo è una grandezza sempre positiva mentre la carica elettrica può essere positiva, negativa o nulla3.
elettromagnetismo
157
Questo porta al fatto che, mentre l’interazione gravitazionale fra due corpi esiste sempre ed è sempre attrattiva (quindi, non può esistere uno schermo gravitazionale), l’interazione elettrostatica, dipendendo dal prodotto delle due cariche, può essere attrattiva (nel caso di cariche di segno diverso), repulsiva (nel caso di cariche dello stesso segno), o zero (nel caso in cui almeno uno dei due corpi abbia carica elettrica zero); 2. le costanti inserite nelle formule (G, k): G è una costante universale, è sempre la stessa, a prescindere dal mezzo in cui si trovano i corpi; dipende solo dall’aver scelto certe unità di misura. Questo vuol dire che se i corpi sono nel vuoto, oppure nell’acqua, oppure se c’è un altro corpo fra i due, fosse anche una galassia, la forza che si esercita fra essi è sempre la stessa. La costante k, invece, dipende fortemente dal mezzo interposto fra i due corpi: il valore più alto si avrà nel vuoto, per qualunque mezzo interposto sarà minore4; 3. il valore della forza: le due forze sono grandezze omogenee, pertanto possono essere confrontate. È importante vedere quale sia il loro rapporto per un sistema elementare, per esempio nel caso che avessimo due protoni, posti nel vuoto, a distanza R. La forza di attrazione gravitazionale fra i due protoni di massa mp mp ∙ mp e carica qq è: FG = G La forza di repulsione elettrostatica, inR2 q ∙q vece, è: Fe = k p 2 p R Se ne facciamo il rapporto otteniamo un numero indipendente dalla loro distanza: m ∙m G p 2 p G m2 6,67 ∙ 10–11 (1,67 ∙ 10–27)2 FG p R = (p, p) = ≅ ≅ 8 ∙ 10–37! qp ∙ qp k q2p Fe 9 ∙ 109 (1,6 ∙ 10–19)2 k R2 Questo è un numero incredibilmente piccolo. La forza di interazione gravitazionale è enormemente inferiore a quella elettrostatica. Perché, allora, sentiamo la forza di gravità, che determina anche il moto dei pianeti nel sistema solare? Il fatto è che gli atomi, essendo composti da un numero uguale di protoni ed elettroni, che hanno cariche uguali (esattamente uguali) e opposte, sono essenzialmente neutri, quindi la forza di natura elettrica fra atomi, molecole, corpi macroscopici è spesso molto vicina a zero.
158
fisica per filosofi
Per questo noi sentiamo sempre gli effetti dell’attrazione gravitazionale dovuta alla Terra (il numero protoni e di neutroni presenti sulla Terra è di circa 1051), mentre non ci accorgiamo delle forze di natura elettrica, se abbiamo a che fare con sistemi elettricamente neutri. Ma quello che può succedere è che possiamo avere dei piccolissimi sbilanciamenti fra le cariche elettriche atomiche o molecolari, dovute, per esempio, a migrazioni di elettroni da un atomo all’altro, oppure a deformazioni delle nuvole di elettroni intorno agli atomi. Ciò porta ad avere corpi con cariche differenti e/o asimmetriche nella distribuzione delle cariche positive e negative, e questa leggerissima differenza è quella che determina le interazioni fra oggetti con piccola massa, dove con “piccola” intendiamo masse molto minori di quelle dei corpi celesti (pianeti, stelle e simili). Le interazioni gravitazionali fra i corpi presenti sulla terra, siano un pezzo di ferro, un treno o una montagna sono allora assolutamente trascurabili rispetto a qualunque forza elettrica derivante da un pur minimo sbilanciamento delle cariche elettriche: sono le interazioni elettromagnetiche che dominano le interazioni fra gli oggetti “terrestri”. Rimangono ovviamente le forze gravitazionali dovute all’attrazione della Terra. Quindi, sulla Terra, i corpi si muovono a causa delle interazioni elettriche e cadono a causa della forza di gravità.
4.2.3. Calcolo dell’interazione elettrica/gravitazionale fra due persone Possiamo provare a fare un calcolo approssimato per valutare entro quanto devono essere uguali la carica del protone e quella dell’elettrone. Supponiamo di avere due persone adulte, ognuna con una massa di 70 kg, poste a 10 m di distanza, con lo stesso numero di protoni (p) e di elettroni (e). Immaginiamo, inoltre, che lo sbilanciamento fra le cariche positive dei protoni e le cariche negative degli elettroni degli atomi che compongono le persone sia molto piccolo, diciamo di una parte su dieci miliardi. Questo vuol dire che supponendo che la carica del protone sia q(p) = + 1 (in certe unità), la carica dell’elettrone sarebbe q(e) = –1,000 000 000 1, e potremmo calcolare la forza di repulsione risultante dal fatto che i due corpi sono composti di atomi non esattamente neutri. Il calcolo è un po’ labo-
elettromagnetismo
159
figura 4.2 Rappresentazione di una grandezza scalare, la temperatura (a), e di una vettoriale, la velocità (b) (a) La temperatura è una grandezza scalare: quella indicata dal termometro è di 20 °C
(b) La velocità è una grandezza vettoriale: la macchina si muove con una velocità di 110 km/h da Roma verso Firenze Firenze v-
Roma
T = 20 ° C
Il vettore v- si può rappresentare: o con la sua lunghezza v e con l’angolo α che ne individua la direzione y v- ≡ [v, α] v-
v α
x
o con il valore della proiezione del vettore vlungo i due assi x e y: v- ≡ [v , v ] x
y
y v-
vy vx
x
Per una grandezza scalare, come la temperatura in (a), è sufficiente un numero. Per una vettoriale, come la velocità in (b), (in due dimensioni) sono necessarie due grandezze: il modulo (v) e la direzione (α), oppure le due proiezioni lungo i due assi vx e vy.
160
fisica per filosofi
figura 4.3 Differenza fra prodotto scalare (a) e prodotto vettoriale (b) di due vettori ā, ¯b –
c = a b sin α; c– ⊥ (ā; b )
c = a b cos α
c–
ā α (a)
–
b –
b
α
ā (b)
– (a) Prodotto scalare: c = ā ∙ b; c è uno scalare, non ha direzione. Il prodotto scalare, quindi, fornisce uno scalare (un numero) ed è proporzionale al prodotto del modulo dei due vettori per un fattore che dipende dal coseno dell’angolo – compreso fra i due (cos α). – (b) Prodotto vettoriale: c– = ā × b; c– è un vettore, ed è perpendicolare sia ad ā che a b. Il prodotto vettoriale è un vettore che ha come modulo il prodotto dei due moduli per il seno dell’angolo compreso fra i due (sin α). La direzione di questo vettore è perpendicolare –a entrambi i vettori di partenza, quindi è perpendicolare– al piano individuato dai due vettori (ā, b) con il verso come indicato in figura: se ā ruota verso b in senso antiorario, c– è diretto verso l’alto.
rioso5; il risultato è che la forza di repulsione sarebbe F = 12 ∙ 106 N. Tanto per avere un’idea riportiamola in “massa”, cioè quale massa, sulla Terra avrebbe questo peso, inteso come la forza di attrazione gravitazionale: si ha che questa forza è equivalente al peso di una massa m = F/g ≅ 1,2 ∙ 106 kg = 1 200 ton. È evidente che non è così, nessuno di noi sente questa forza, le cariche degli elettroni e dei protoni sono uguali, è solo il loro numero che può essere diverso di pochissimo (molto, molto meno di una parte su dieci miliardi) generando le interazioni elettriche.
4.2.4. Nota matematica. Come si moltiplicano i vettori Finora abbiamo parlato dei vettori ricordando che si tratta di grandezze che, a differenza delle cosiddette “grandezze scalari”, non sono definite solo da un numero, ma per esserlo completamente è necessario dare anche una direzione e un verso. Per esempio (cfr. fig. 4.2), la temperatura è una grandezza scalare (possiamo dire di essere in una stanza in cui la temperatura è di circa di 20 °C), mentre la velocità è una grandezza vettoriale (possiamo dire di essere in macchina e muoverci a 110 km/h sull’autostrada Roma-Firenze, in direzione di Firenze). Questo porta alla rappresentazione grafica dei vettori: possono essere disegnati come un segmento che è lungo proporzionalmente al loro valore nu-
elettromagnetismo
161
tabella 4.1 Valori delle grandezze sin α e cos α per alcuni angoli particolari Paralleli Come sono – i vettori ā e b
Perpendicolari α
@ 45° α
α = 0°
α = 90° = π/2 α = 45° = π/4
cos 0° = 1
cos 90° = 0
— cos 45° = 1/√ 2
Cosa possiamo Prodotto vettoriale calcolare (modulo) sin 0° = 0 c = a ∙ b ∙ sin α
sin 90° = 1
— sin 45° = 1/√ 2
Prodotto scalare c = a ∙ b ∙ cos α
merico (il modulo) e vengono disegnati con la direzione e il verso opportuni. Si noti che per fare questo dobbiamo aver stabilito un sistema di riferimento con delle direzioni ben precise per gli assi nello spazio tridimensionale. Nella fig. 4.2b abbiamo un esempio nel caso di un vettore in uno spazio a due dimensioni. Un’altra differenza fra le grandezze scalari e quelle vettoriali si ha nel tipo di operazioni che si possono fra tra di loro. Vediamo il caso della moltiplicazione fra vettori. Il prodotto fra due vettori può essere fatto in due modi diversi, il cosiddetto “prodotto scalare”, che fornisce un numero, e il prodotto vettoriale, che fornisce un nuovo vettore. Nella fig. 4.3 mostriamo un esempio dei due casi; nella tab. 4.1, invece, si trovano i valori delle grandezze sin α e cos α calcolate per alcuni angoli particolari: saranno utili nel seguito di questo capitolo.
4.3. Il concetto di campo Il concetto di campo nasce dai lavori e dalle osservazioni dei fisici del xix secolo. La storia di chi abbia scoperto che cosa e di chi siano stati i primi a osservare e a descrivere i tanti effetti legati alle interazioni fra le cariche elettriche è qualcosa che ha a che fare con la storia della fisica. Non ne parleremo: qui, semplificando, diremo che il concetto di campo fu sviluppato da Faraday, molti anni dopo che le principali leggi delle interazioni elettriche e magnetiche erano state scritte. L’idea è questa: già con la legge della gravitazione universale Newton si era posto il problema di quale fosse la causa che provocava l’attrazione
162
fisica per filosofi
fra masse. È il famoso hypotheses non fingo con cui Newton, nella seconda edizione dei suoi Principi matematici della filosofia naturale del 1713, rinuncia a dare una spiegazione al fenomeno dell’attrazione gravitazionale a distanza: In verità non sono ancora riuscito a dedurre dai fenomeni la ragione di queste proprietà della gravità, e non invento ipotesi. Qualunque cosa, infatti, non deducibile dai fenomeni va chiamata ipotesi; e nella filosofia sperimentale non trovano posto le ipotesi sia metafisiche, sia fisiche, sia delle qualità occulte, sia meccaniche (Newton, 1965, pp. 795-6).
L’affermazione «nella filosofia sperimentale non trovano posto le ipotesi […] fisiche» va intesa come “non trovano posto ipotesi non confermate sperimentalmente”, quindi le affermazioni non giustificate. Ma non c’è solo il problema di giustificare la legge di attrazione gravitazionale, ce n’è un altro concettualmente più complicato: attraverso che cosa si trasmette questa forza? Noi siamo abituati a dover toccare dei corpi per esercitare una forza su di loro, per esempio per spostarli. Mentre la forza di gravità sembra agire anche fra corpi che non sono in contatto (Terra-Luna, Sole-Terra). Come può il vuoto trasmettere una forza? Questo era il punto che preoccupava i fisici da Newton in poi, e che avrebbe dato origine a supporre l’esistenza dell’etere o di altri enti presenti nello spazio fra i corpi. Il punto chiave che risolse il problema fu quello di riconsiderare lo spazio vuoto. Quest’ultimo ha sicuramente delle proprietà geometriche, perché non dovrebbe avere delle proprietà fisiche? Il concetto di campo è quello di assegnare a ogni punto dello spazio – vuoto o non vuoto, non ha importanza – una grandezza fisica che sarà legata agli effetti che potremo misurare6 su un qualunque corpo posizionato in quel punto. E questi effetti saranno, in prima approssimazione, quelli di una forza. Dal punto di vista formale la cosa è abbastanza semplice. ConsideriaqQ – – – mo la legge di Coulomb: F (q, Q, R) = k R2 Rˆ dove con F (q, Q, R) intendiamo ora la forza esercitata sulla carica q dalla carica Q che si trova a distanza R da q; questa legge posso riscriverla così: –
–
F (q, Q, R) = k
qQ Q – Rˆ = q ∙ k 2 Rˆ = q ∙ E–Q(R) R2 R
elettromagnetismo
163
Quello che abbiamo fatto è di scrivere la forza sulla carica q come il prodotto della carica stessa per una grandezza (vettoriale): il campo elettrico. Questa grandezza, che dipende da Q (la causa, la sorgente della forza) e dalla posizione relativa fra la sorgente Q e il punto in cui andiamo a calcolarla, è una proprietà dello spazio. Possiamo anche scrivere, infatti: – – Q – – F(q, Q, R) Rˆ EQ(R) = = k q R2 È una relazione che possiamo generalizzare a un sistema di n cariche – – Qi(R i) nella posizione R i scrivendo: – – n Qi F(q, R) E (R) = = ∑i k – – (Rˆ –Rˆ i) q (R –Ri)2 – –
dove abbiamo esplicitato sia la posizione nello spazio del punto R in – cui vogliamo calcolare il campo elettrico (R ), sia la posizione di ognuna – delle n cariche Qi (R i). Il campo elettrico, quindi, operativamente, non è altro che la forza elettrica che si eserciterebbe su una carica q, divisa per il valore della carica stessa7, dipende dal valore e dalla posizione delle sorgenti del campo (le cariche elettriche) e dal punto in cui stiamo calcolando il campo. È importante capire il diverso significato che hanno le due espressioni che abbiamo dato per il campo elettrico: – – – – ≝ F(q, R) = ∑ n k Q i (Rˆ –Rˆ ) ≝ E– (R) E– (R) – – teor i i 2 sper q (R –Ri) La prima è una definizione operativa: Esper ci dice come misurare la grandezza “campo elettrico” in un punto dello spazio utilizzando il valore della sua interazione con una carica posta in quel punto. Possiamo non sapere nulla di quello che c’è in tutto il resto dell’universo, ci basta prendere una carica di prova q, metterla in un punto e misurare la forza che agisce su di essa non considerando tutte le altre forze (gravitazionali o di altro tipo) che si esercitano sulla particella. Questo operativamente può essere un problema per nulla semplice, ma qui stiamo definendo una procedura. Da questa misura possiamo calcolare il valore del campo elettrico in quel punto. La seconda espressione, Eteor, invece, ci permette di prevedere, tramite un calcolo, quale sarà il
164
fisica per filosofi
campo elettrico in tutti i punti dello spazio conoscendo il valore del– – – – le sorgenti e la loro posizione. Le due grandezze E (R )sper ed E (R )teor dovranno risultare sempre uguali, entro le incertezze. Nel caso che non lo fossero abbiamo tre possibilità: abbiamo sbagliato a misurare il campo elettrico, abbiamo sbagliato a calcolare il campo elettrico dalle sorgenti, la teoria che stiamo utilizzando è errata, almeno nel caso che stiamo considerando.
4.3.1. Cariche elettriche in moto con velocità costante Si osserva che se facciamo muovere delle cariche elettriche con un moto ordinato – e questo moto lo chiameremo corrente elettrica (cfr. fig. 4.4) – si genererà uno nuovo campo che viene chiamato campo di induzione ma– – gnetica B (spesso detto, per semplicità, campo magnetico B ). Quindi, cariche in moto con velocità media v sono equivalenti a una – corrente i, e questa corrente i dà origine a un campo B che per un caso particolare (un filo conduttore rettilineo virtualmente infinito percorso da una corrente costante i) è uguale, nel vuoto, a: B (i, R) =
μ0 i 2π R
dove R è la distanza dal filo, la direzione di B è tangenziale alla circonferenza di raggio R, con il verso indicato nella fig. 4.5, e μ0 una costante, la permeabilità magnetica del vuoto, che vale μ0 = 4π ∙ 10–7 H/m. Il punto chiave, per quel che riguarda le interazioni elettromagne– tiche, è che il campo B esercita a sua volta una forza su ogni carica in movimento rispetto al sistema di riferimento in cui si trovano (a riposo) l’osservatore, il filo percorso da corrente e il campo B che ne risulta. È la cosiddetta “forza di Lorentz” (Hendrik A. Lorentz, 1853-1928): – – – F = q (E + ˉv × B ) Quindi: se abbiamo una particella di carica q in presenza di un – – campo elettrico E e di un campo magnetico B , se inoltre la carica q avrà una velocità v (misurata in un certo sistema di riferimento iniziale), questa particella sentirà una forza F secondo la formula
elettromagnetismo
165
figura 4.4 Schema di un conduttore con portatori di carica che si muovono al suo interno con una velocità media v
S
Corrente elettrica: i ≝ n ⋅ q ⋅ v ⋅ S n q
v
Lo schema rappresenta un conduttore di sezione S con n portatori di carica q per unità di volume (tipicamente elettroni) che si muovono dentro il conduttore con una velocità media v. Il moto ordinato di queste cariche viene chiamato corrente elettrica. Per convenzione il verso positivo della corrente è associato al moto di cariche elettriche positive.
di cui sopra: in particolare, se la velocità v e il campo B sono mutuamente perpendicolari, la forza, in modulo, sarà semplicemente F = q ∙ v ∙ B sin 90° = q ∙ v ∙ B, mentre la direzione sarà perpendicolare sia al campo B che alla velocità v. È importante sottolineare che, secondo l’elettromagnetismo classico, un campo elettrico E e un campo magnetico B in moto con velocità uniforme non cambiano, vengono, cioè, visti da un osservatore, in un sistema di riferimento inerziale, come se fossero fermi. 4.3.2. Un’incongruenza della teoria Dalla formula della forza di Lorentz si può vedere che c’è un problema: la formula dice che la forza F dovuta al campo B dipende dalla velocità della carica nel sistema di riferimento in cui la misuriamo, sistema di riferimento in cui misuriamo anche la corrente i. Supponiamo di avere una particella di carica q a una distanza R dal filo percorso da una corrente i (quella della fig. 4.5), e supponiamo che la particella q abbia una velocità v costante parallela alla direzione del filo. Facciamo l’ipotesi semplificatrice che nel filo ci siano solo le cariche q in moto, quindi che non ci siano gli atomi8. Poniamoci ora in un sistema di riferimento solidale con il filo: vedremo, dunque, il campo B (costante e uniforme lungo la traiettoria della particella) fermo rispetto a noi e la particella q in moto con velocità v. In questo caso la particella sarà soggetta a una forza di Lorentz diversa da
166
fisica per filosofi
figura 4.5 – Campo B creato da un filo indefinito percorso da una corrente costante i (q è una carica libera in moto rispetto al filo con velocità v) q, vi R
– B
zero uguale a F = q ∙ v ∙ B (abbiamo utilizzato l’informazione che la velocità della particella è perpendicolare al campo B). Tralasciamo per il momento di scrivere la direzione della forza, la cosa essenziale è che questa forza è diversa da zero. Poniamoci ora in un sistema di riferimento (inerziale) solidale con la particella q. In questo caso noi vedremo il campo magnetico B generato dalle cariche nel filo, ma questo non ha nessun effetto, cioè non genera nessuna forza sulla particella q che per noi ha velocità uguale a zero. Quindi, a seconda che ci si metta nel sistema solidale con il filo o in quello solidale con la particella, tutti e due essendo sistemi inerziali, vedremo cose differenti. In un caso abbiamo una forza, nell’altro no. Non è coerente. Non soddisfa il principio di relatività galileiano (cfr. fig. 4.6). Questo è un problema che sembra banale, ma è molto serio. La soluzione la troverà Einstein nella teoria della relatività speciale del 1905, che non per niente ha come titolo Sull’elettrodinamica dei corpi in movimento (cfr. Einstein, 1905c). Qui abbiamo presentato una versione semplificata del problema, ne riparleremo in dettaglio nel capitolo successivo dedicato alla relatività speciale.
4.3.3. Cariche elettriche in moto con velocità non costante Quando abbiamo delle cariche elettriche che si muovono con velocità non costante, quindi con accelerazione diversa da zero, nello spazio si crea un campo che è composto sia da un campo elettrico che da uno
elettromagnetismo
167
figura 4.6 Caso di una carica q in moto con velocità costante v rispetto a un filo percorso da una corrente i (a)
(b)
F(q) = q ⋅ v ⋅ B ≠ 0 q, v-
i
F(q) = q ⋅ v ⋅ B = 0 q, v-
i
In (a) l’osservatore è solidale con il filo, e misura una forza F diversa da zero data dalla forza di Lorentz. In (b) l’osservatore è solidale con la carica, dunque vede una carica con velocità zero immersa in un campo B diverso da zero, quindi misura una forza F pari a zero Abbiamo pertanto due sistemi inerziali in cui le forze sono diverse: questo va contro la relatività galileiana.
magnetico, con delle relazioni ben precise fra di loro. Questo fatto è una conseguenza delle equazioni di Maxwell. Vale la pena, allora, di provare a scriverle per commentarle.
4.4. Le equazioni di Maxwell Le equazioni di Maxwell sono tra le maggiori conquiste dell’intelletto umano e permettono di descrivere una serie di fenomeni estremamente complessi e apparentemente slegati fra di loro. Si tratta di quattro equazioni – come già detto Maxwell scrisse un sistema di venti equazioni con un formalismo abbastanza complicato, qui ne daremo la versione moderna – che descrivono tutti i fenomeni che avvengono quando abbiamo delle cariche elettriche che interagiscono, siano esse ferme o in moto, nel vuoto o in presenza di un qualunque mezzo materiale. La discussione delle equazioni di Maxwell è qualcosa che va oltre gli scopi di questo libro dato che esse presuppongono la conoscenza di un formalismo avanzato; tuttavia, vorremmo scriverle e provare a darne un significato fenomenologico, per dare un’idea di cosa descrivano. Vedremo poi qualche conseguenza legata ai fenomeni che derivano dal puro formalismo delle equazioni.
168
fisica per filosofi
Gli oggetti descritti dalle equazioni sono quattro campi vettoriali: due fondamentali, legati direttamente alle forze che agiscono su una carica (E, B) e due campi aggiuntivi (D, H) che rendono più semplice la forma delle equazioni. La necessità di dare due campi aggiuntivi dipende dal fatto che, a differenza delle interazioni gravitazionali, i corpi rispondono in maniera molto diversa, spesso con effetti macroscopici, quando sono immersi in campi elettrici e magnetici, o quando fra loro e le sorgenti dei campi sono presenti altri corpi. Questo non è vero nel caso dei campi gravitazionali. La forza di attrazione sulla Terra dovuta al Sole non è influenzata dalla presenza fra la Terra e il Sole del vuoto, di un altro pianeta, della Luna, mentre, per esempio, dentro una scatola di metallo il cellulare non funziona: il campo elettromagnetico che arriva dall’esterno interagisce con gli atomi metallici delle pareti della scatola e viene assorbito; una scatola metallica è uno schermo che impedisce l’ingresso nella scatola di un segnale elettromagnetico. E, fortunatamente, con opportuni collegamenti, possiamo evitare anche che il campo elettromagnetico esca da una scatola metallica: un forno a microonde che lasciasse uscire la radiazione elettromagnetica sarebbe un bel problema, cuocerebbe anche gli oggetti costituiti in prevalenza di acqua nelle immediate vicinanze (il gatto, per esempio!). Nelle equazioni di Maxwell sono presenti le seguenti grandezze: 1. il campo elettrico E: è il campo legato alla forza che agisce su di una carica elettrica a causa di altre cariche elettriche ferme, qualunque sia la loro origine; 2. il campo di induzione magnetica B: è il campo che esprime la forza che agisce su di una carica elettrica a causa del suo movimento rispetto ad altre cariche elettriche in moto; è legato alle correnti elettriche che generano i campi magnetici, siano esse microscopiche o macroscopiche9; 3. il campo magnetico H: descrive i campi magnetici originati dalle sole correnti elettriche macroscopiche, quindi non quelle dovute agli elettroni che ruotano intorno ai nuclei atomici, ma quelle dovute al moto delle cariche elettriche libere; 4. il campo di induzione elettrica D: descrive i campi elettrici generati dalle cariche elettriche macroscopiche. Con il che si intendono i campi elettrici generati da cariche libere di muoversi nei materiali (i metalli) e/o libere nello spazio, escludendo, dunque, le cariche presenti nei materiali che, sotto l’effetto di campi elettrici esterni, si sono leggermente spostate dalla loro posizione di equilibrio, rimanendo sempre legate agli atomi; 5. tre costanti che dipendono dai materiali presenti nello spazio: la permeabilità elettrica e magnetica (ε, μ)10 e la resistività elettrica ρ.
Altre relazioni
Equazioni
Q = costante
– – F = q (Ē + v– × B )
– ∂B– – – ∇ × B = μ ( J + ε ) ∂t
– ∂B – ∇ × Ē = – ∂t
– – ∇ · B = 0
– ∇ · Ē = ρc/ε
La carica elettrica non si può creare né distruggere
La forza che agisce su una carica q è proporzionale al campo elettrico E e al campo B (tramite il prodotto vettoriale con la velocità v)
Se abbiamo delle correnti elettriche oppure un campo E che varia nel tempo allora nello stesso punto si genera un campo magnetico
Se abbiamo un campo B che varia nel tempo, allora nello stesso punto si genera un campo elettrico
Il campo B non ha sorgenti localizzate
Il campo E ha come sorgenti locali le cariche elettriche
Cosa vogliono dire
tabella 4.2 Le equazioni di Maxwell in forma locale per un mezzo isotropo e omogeneo
170
fisica per filosofi
– – – – Nei materiali omogenei e isotropi avremo che: D = εE e B = μH. Noi scriveremo le equazioni di Maxwell nella forma leggermente semplificata che si ha imponendo omogeneità e isotropia dei materiali. Le altre grandezze che compaiono implicitamente nelle equazioni di Maxwell sono: – Q: la carica elettrica; – ρc: la densità di carica elettrica, cioè la carica elettrica per unità di volume; – – J : la densità superficiale di corrente, ossia la corrente elettrica per – – unità di superficie, legata al campo elettrico dalla relazione E = ρ J , dove ρ rappresenta la resistività del materiale. Le equazioni di Maxwell in forma locale per un mezzo isotropo e omogeneo sono nella tab. 4.2. Il fatto che la forma sia “locale” vuol dire che le equazioni in oggetto mettono in relazione grandezze misurate tutte nello stesso punto dello spazio, quindi localmente, e nello stesso istante. La potenza concettuale nell’utilizzo dei campi sta in questo: i campi, sia quello elettrico che quello magnetico, possono avere varie cause ed essere dovuti anche a fenomeni molto lontani o avvenuti molto tempo prima dell’istante che si considera. Ma per descrivere cosa succede in un punto dello spazio, in un certo istante t, è sufficiente conoscere il valore di questi campi in quel punto all’istante t.
4.4.1. La velocità della luce Proviamo a scrivere ora le equazioni di Maxwell nel caso di uno spazio – senza sorgenti, quindi dove ρc = 0 e J = 0. Questo non vuol dire che tutto lo spazio sarà vuoto, avremo sicuramente delle zone dello spazio in cui ci sono cariche elettriche e/o correnti, ma noi vogliamo scrivere le quattro equazioni di Maxwell nella parte di spazio in cui non abbiamo sorgenti, dove però possono essere presenti dei materiali. Quindi assumeremo uguali a zero il valore della densità di carica ρc e della densità di – corrente J . Inoltre, faremo l’ipotesi che i materiali non siano dissipativi, quindi che abbiano una resistenza elettrica infinita; questo vuol dire porre la resistività ρ = ∞. Le equazioni di Maxwell sono quelle illustrate nella tab. 4.3: esse hanno come argomento solo il campo elettrico E, il campo magnetico B e il prodotto delle due costanti ε, μ.
elettromagnetismo
171
tabella 4.3 Le equazioni di Maxwell in uno spazio senza cariche elettriche localizzate né correnti Le – equazioni con ρc = 0 e J = 0, quindi in una parte di spazio senza cariche né correnti
– ∇∙Ē=0
Cosa vogliono dire (nello spazio che stiamo considerando)
Non abbiamo sorgenti localizzate del campo elettrico Non abbiamo sorgenti localizzate del campo magnetico
– – ∇∙B =0
– – ∇ × Ē = – ∂B ∂t – – – ∂E ∇ × B = με ∂t
Se esiste un campo magnetico B che varia nel tempo allora abbiamo un campo elettrico E ≠ 0 Se esiste un campo elettrico E che varia nel tempo allora abbiamo un campo magnetico B ≠ 0
Risolvendole si ha come soluzione un’onda che si propaga nello spazio. Quest’onda è composta da un campo elettrico e da un campo magnetico perpendicolari fra di loro e perpendicolari alla direzione di propagazione, che viaggiano con una velocità v il cui valore risulta essere uguale al – rapporto fra E e B, cioè fra i moduli del campo elettrico E e del campo – magnetico B : v=
E 1 1 1 = = B √εμ √ε0 μ0 √ εr μr
La velocità v di questo segnale dipende quindi solo dal prodotto delle due costanti ε, μ: è il campo elettromagnetico. Nella fig. 4.7 vediamo la geometria dei tre vettori E, B, v per un’onda di forma particolare: la cosiddetta “onda piana”. La forma dell’onda piana è quella delle onde del mare che dal largo arrivano sulla spiaggia: le singole onde sono delle rette perpendicolari alla direzione di propagazione, quindi alla velocità. Un’onda non piana è, per esempio, l’onda circolare: quella prodotta da un sasso lanciato nell’acqua: in questo caso la forma delle onde è circolare. Nel vuoto, oppure nell’aria, dove εr ≅ μr ≅ 1, si ha allora (inserendo i valori delle costanti ε0, μ0 misurati oggi): 1 ε0 μ0 = ≅299 796 ≅ 300 000 km/s
v (vuoto ÷ aria) ≅
=√
1 8,854 ∙ 10–12 ∙ 4π ∙ 10–17
√
172
fisica per filosofi
figura 4.7 Schema delle direzioni relative in cui oscillano i campi E, B per un’onda elettromagnetica piana che si propaga con velocità v z
La velocità v con cui si propagano i due campi E, B (accoppiati) dipende solo dal prodotto delle due costanti ε, μ: so
1 1 1 E = = B √εμ √ε μ √ε μ 0 0 r r
E B
v
y
Formalmente si ha: – – E = B × v̅
x
Se il campo magnetico B oscilla lungo l’asse z, allora il campo elettrico E oscilla lungo l’asse x, e la velocità di propagazione dell’onda è v, lungo l’asse y, perpendicolare sia all’asse x che all’asse z.
Questo è un valore molto particolare. Vale la pena di citare il lavoro originale di Maxwell (1864), in cui egli osservava che il calcolo di questa velocità, utilizzando i valori delle due costanti ε0, μ0 misurati a metà Ottocento, dava 310 740 km/s, mentre la misura della velocità della luce fatta da Louis Fizeau nel 1849 forniva un valore di 313 274 km/s. Da questo Maxwell (ibid.) afferma «sarebbe difficile evitare la conclusione che la luce consiste di oscillazioni trasversali del medesimo mezzo che è la causa dei fenomeni elettrici e magnetici». Ecco il punto e la meravigliosa conclusione a cui portano le equazioni Maxwell: la luce non è altro che la trasmissione di un campo elettrico e un campo magnetico accoppiati a formare un unico ente fisico che viaggia con velocità c (nel vuoto). La luce è, quindi, l’unione di due campi indissolubilmente legati dalle equazioni di Maxwell che viaggiano nello spazio, trasportando energia: è il campo elettromagnetico. Oggi il valore della velocità della luce (di qualunque segnale elettromagnetico) nel vuoto non viene più misurato ma viene assunto come esatto, ridefinendo poi il metro. La ragione è che la velocità della luce è una costante universale indipendente dal sistema di riferimento. Quest’affermazione verrà chiarita nel cap. 5. Nel vuoto, dunque, la luce viaggia con velocità c, dove c = 299 792 458 m/s
elettromagnetismo
173
Si tratta di un valore assunto oggi (dal 21 ottobre 1983) come esatto, senza incertezze. In un mezzo trasparente, invece, la luce avrà una velocità minore, che dipenderà dal mezzo considerato, e che può essere scritta come: 1 1 v=√ =√ ε0 μ0 εμ
√
1 c c = = ≤c εr μr √εr μr n
dove n⋝1 è il cosiddetto “indice di rifrazione del mezzo”, quello misurato e utilizzato fin dai tempi di Galilei per costruire lenti e strumenti ottici.
4.5. Il concetto di unificazione delle interazioni Le equazioni di Maxwell sono un caso particolare di unificazione delle interazioni. Data l’importanza del concetto, specie per gli sviluppi che ha avuto nell’ultimo secolo e che continua ad avere per lo sviluppo di nuove teorie, vale la pena di spenderci qualche parola. Quando, in ambito scientifico, si parla di unificazione di due o più interazioni si intende il fatto che due interazioni che si manifestano con proprietà ed effetti diversi sono in realtà manifestazioni della stessa interazione che, a scale di energia diversa o in condizioni particolari, racchiude in sé le caratteristiche di entrambe le interazioni di partenza. Il caso dell’elettromagnetismo è esemplare. Se considerassimo solo delle cariche elettriche ferme, allora fra di loro si eserciterebbe solo la forza elettrostatica dovuta al campo elettrico E. Se, invece, considerassimo solo delle cariche elettriche in movimento con velocità costante allora su una carica elettrica ferma si eserciterebbe la sola forza dovuta al campo magnetico B. In entrambi i casi possiamo scrivere delle formule che esprimono la forma del campo elettrico e quella del campo magnetico, e questi due campi possono esistere indipendentemente uno dall’altro. Se, invece, prendessimo in considerazione delle cariche elettriche in moto con velocità non costante, per esempio delle cariche che oscillano, allora si genererebbe un campo che si propaga nello spazio e che è composto dall’unione di un campo elettrico più un campo magnetico, non più indipendenti, ma con delle relazioni ben precise fra di loro: in particolare avremo che il segnale che si propaga – la luce – avrà una velocità v = E/B. Il sistema, quindi, non sarà più descrivibile tramite due campi separati e indipendenti E e B, ma da un unico campo: quello elettromagnetico.
174
fisica per filosofi
I due campi si sono unificati, sono, cioè, l’espressione dello stesso campo e hanno perso la qualità di essere indipendenti uno dall’altro. Se poi ci trovassimo in alcune situazioni particolari – cariche ferme, cariche con velocità costanti ecc. –, allora dall’espressione del campo elettromagnetico si potranno ricavare quelle dei singoli e indipendenti campi elettrici e/o magnetici. Questa procedura di unificazione sarà uno dei maggiori compiti dei fisici del xx secolo e di quelli attuali nella ricerca di unificazioni nuove e più generali fra tutte le interazioni conosciute.
4.6. Onde Un’onda è definita in genere come una perturbazione che si può trasmettere in un mezzo materiale o nel vuoto, ma questo non è sufficiente. La definizione di onda è meno semplice di quanto possa sembrare, comprendendo una moltitudine di effetti anche molto diversi. In generale possiamo dividere le onde – intese come perturbazioni, ossia come variazioni non casuali di una grandezza fisica dalla sua condizione di equilibrio – in due grandi classi: quelle legate a una perturbazione che avviene nel tempo ma rimane limitata nello spazio, per esempio l’onda legata alla vibrazione di una corda di violino oppure al moto di un pendolo, e quelle in cui la perturbazione si trasmette nello spazio: le onde del mare, un’onda sonora o un’onda elettromagnetica emesse nello spazio aperto. La cosa importante è che questa perturbazione avviene senza che ci sia, in media, un trasporto di materia da un punto all’altro dello spazio. L’onda del mare è associata alla perturbazione della superficie dell’acqua, che però non si muove con la velocità dell’onda ma oscilla in su e in giù rimanendo in media sempre nello stesso posto. Analogamente le onde sonore nell’aria corrispondono a una perturbazione delle molecole dell’aria, quindi della pressione di quest’ultima, intorno alla loro posizione di equilibrio. Questo moto, che non è associato a un trasporto di materia, è associato, tuttavia, a un trasporto di energia e di quantità di moto. Noi sentiamo un suono perché l’onda sonora trasmette una certa energia al timpano, facendolo vibrare e permettendo la conversione dell’energia legata al movimento in impulsi elettrici. Allo stesso modo l’onda elettromagnetica, che può propagarsi anche nel vuoto, è un’oscillazione del campo elettrico e magnetico, che trasporta energia. Questa energia, se arriva sul nostro corpo, si trasforma in energia termica. Ecco perché il sole ci scalda!
elettromagnetismo
175
Dal punto di vista strettamente matematico un’onda è un fenomeno descritto da una funzione che è soluzione della cosiddetta “equazione delle onde”11. I punti chiave sono: 1. un’onda è una perturbazione che si trasmette; la perturbazione può avere una forma qualunque, non deve essere necessariamente un’onda sinusoidale; 2. quando si parla di onde, tuttavia, si utilizza come forma matematica di riferimento una funzione sinusoidale; questo perché, secondo il teorema di Fourier, qualunque funzione periodica può essere scritta come una somma di seni e coseni. La descrizione del comportamento delle onde, pertanto, può essere fatta rigorosamente considerando solo onde sinusoidali. Vediamo ora quali sono i parametri necessari per descrivere una qualunque onda12. L’onda sinusoidale più generale possibile, che viaggia nel tempo t e nella sola direzione x con velocità v si può scrivere come: A (x, t) = A0 sin (ωt + kx + φ) = A0 sin (
2π 2π t+ x + φ) T λ
Dove: – A(x, t) è la grandezza che rappresenta l’onda, in particolare la grandezza fisica che sta oscillando e/o la perturbazione che stiamo considerando; nel caso di un’onda del mare rappresenta lo spostamento verticale di un punto della superficie del mare, nel caso del suono che viaggia nell’aria rappresenta lo spostamento longitudinale delle molecole dell’aria, nel caso della luce e le ampiezze del campo elettrico e magnetico in direzione perpendicolare al moto; – A0 è l’ampiezza dell’onda; è l’ampiezza massima dell’onda, cioè di quanto vibra, o quanto vale al massimo della sua escursione, la grandezza che sta oscillando. Dato che la funzione “sin” può andare da un minimo di –1 a un massimo di 1, l’ampiezza totale dell’onda A(x, t) varierà da –A0 ad A0; – T è il periodo dell’onda; facendo un grafico dell’andamento dell’onda per una x costante (vuol dire che l’osservatore si mette in punto fisso e misura l’onda in funzione del tempo), avremo la forma, nel caso in cui x = 0 (cfr. fig. 4.8): A (t) = A0 sin (ωt + φ) = A0 sin (
2π t + φ) T
176
fisica per filosofi
figura 4.8 Andamento di un’onda sinusoidale in funzione del tempo t, per x = 0 e φ = 0 A (t)
T
0
t
A (x = 0, t) = A (t) = A0 sin
( 2πT t)
–A0
il periodo T rappresenta quindi la periodicità dell’onda in funzione del tempo, in altri termini qual è il tempo impiegato dalla grandezza A(x, t) a tornare nello stesso stato. Il periodo T è legato alla pulsazione dell’onda ω e alla frequenza dell’onda f, dalle relazioni: T=
2π 1 ; T = ; ω = 2πf ω f
– λ è la lunghezza d’onda; disegnando l’andamento dell’onda in funzione della posizione x, per una t costante (vuol dire “fotografare” la funzione a un certo istante), abbiamo la forma, nel caso di t = 0: A (x) = A0 sin(
2π x + φ) λ
λ, la lunghezza d’onda, è quindi la periodicità dell’onda in funzione della posizione (cfr. fig. 4.9). Spesso al posto di λ si utilizza la grandezza k = 2π/λ, il cosiddetto “numero d’onda”. – La lunghezza d’onda λ, la frequenza f e la velocità v con cui si propaga l’onda sono legate dalla seguente relazione: v=λ∙f Nota. La velocità v, nelle formule, può essere + v o – v, a seconda che l’onda si muova in direzione + x o in direzione – x. È un dettaglio formale che qui non considereremo.
elettromagnetismo
177
figura 4.9 Andamento di un’onda sinusoidale in funzione della posizione x, per t = 0 e φ = 0 A (x)
λ
A0 0
A (x, t = 0) = A (x) = A0 sin
( 2πλ x )
x
–A0
Il valore della velocità con cui si trasmette l’onda dipende tipicamente dalle caratteristiche del mezzo in cui si trasmette l’onda e dalle caratteristiche dell’onda di partenza. Bisogna ricordarsi che, mentre nel caso della luce nel vuoto la velocità delle onde elettromagnetiche è una costante universale c, ed è la massima velocità con cui può trasmettersi un qualunque segnale, in generale nei mezzi materiali la velocità della luce sarà minore: v (luce) =
c ≤c n( f )
dove n( f ) ≥ 1 è l’indice di rifrazione del materiale, che in genere dipende dalla lunghezza d’onda della luce13 e dalle caratteristiche del materiale; per il vuoto, n = 1; – φ è la fase d’onda; se scriviamo la forma d’onda al tempo t = 0, e nel punto x = 0 abbiamo: A(0, 0) = A0 sin φ. Il valore della fase è, quindi, un’indicazione legata all’ampiezza dell’onda all’istante iniziale e nel punto iniziale: x = 0 e t = 0 che non corrispondono necessariamente a dove è stata emessa e a quando è stata emessa (le origini degli assi sono convenzionali; cfr. fig. 4.10 e, per alcuni casi particolari, tab. 4.4). Fra tutte le modalità con cui possiamo descrivere un’onda, o che si incontrano nella realtà fisica, ve ne sono alcune di fondamentale importanza nella descrizione di molti fenomeni. 1. Onda stazionaria: è un’onda che non “trasporta” una perturbazione, essendo limitata nello spazio. La limitazione consiste, appunto, nella li-
178
fisica per filosofi
figura 4.10 Andamento di varie onde, identiche per ampiezza e lunghezza d’onda, ma con fase diversa A (x) φ=0
x A (x) = A0 sin
φ = 90° = π/2
x
φ = 180° = π
x
φ = –90° = –π/2
x
( 2πλ x + φ)
= A0 sin φ
mitazione dello “spazio” in cui l’onda può oscillare. Per esempio, l’onda con cui oscilla la corda di un pianoforte o di una chitarra: in questo caso l’oggetto che oscilla (per esempio, la corda) ha gli estremi fermi e fissi, mentre alcune sue parti oscillano. L’onda stazionaria può esistere solo per alcune determinate lunghezze d’onda caratteristiche del mezzo, del tipo di oggetto ecc. Nella fig. 4.11 si vede come esempio una corda con gli estremi fissi, con i primi modi di oscillazione possibili. Il numero “n” rappresenta l’inverso dell’armonica. La prima, la seconda, la terza e così via. Quindi, l’onda stazionaria è quantizzata. Una corda di una certa lunghezza e con una certa tensione, una volta colpita emetterà suoni solo alla sua frequenza fondamentale f0 (per esempio, un “la”) e/o alle frequenze 2f0, 3f0, 4f0, oppure a una combinazione di tutte queste. Questo è importante: un’onda classica in determinate condizioni può essere quantizzata, cioè può esistere solo per alcuni valori multipli interi di una certa grandezza. Vedremo come un’osservazione del genere porterà in meccanica quantistica a un primo sviluppo del dualismo onda/particella.
elettromagnetismo
179
tabella 4.4 Ampiezza di un’onda sinusoidale A(x, t) = A0 sin(ωt + kx + φ), calcolata per x = 0 e t = 0 per diversi valori della fase φ φ (gradi)
φ (radianti)
sin φ
A(0,0)
0°
0
0
0
45°
π/4
— 1/√ 2
90°
π/2
1
A0
180°
π
0
0
270°
3π/2
–90°
–π/2
–1
–A0
— A0/√ 2
2. Polarizzazione: un’onda trasversale è un’onda in cui le particelle del mezzo in cui si propaga l’onda, oppure i campi che descrivono quest’ultima, oscillano perpendicolarmente alla direzione di propagazione. Nel caso di un’onda trasversale si chiama polarizzazione la direzione che ha, a un certo istante di tempo, la grandezza che oscilla. figura 4.11 Modi stazionari di vibrazione di una corda con gli estremi fissi che vibra trasversalmente L 0 1/2 1/3 1/4
n λn = 2L/n 2L 1 1
fn = n f1 f1 = v/2L
2
L
2f1
3
2 3L
3f1
4
2 1 4L = 2L
4 f1
La corda è lunga L, il numero n rappresenta l’ordine dell’armonica, λn la lunghezza d’onda dell’n-esima armonica e v la velocità delle onde sonore nell’onda. Le onde stazionarie sono quantizzate, cioè, date le caratteristiche della corda, le armoniche non possono avere valori qualunque per la lunghezza d’onda, ma sono sottomultipli della grandezza 2L, la lunghezza d’onda della prima armonica. La frequenza associata a ogni modo di vibrazione sarà fn = v/λn = n ∙ v/2L = n ∙ f1, dove f1 è la frequenza di vibrazione della prima armonica.
180
fisica per filosofi
figura 4.12 Andamento spaziale, quindi fissato un certo tempo t, di due onde trasversali polarizzate linearmente y
x
y
x
z (a)
z (b)
L’onda in (a) ha polarizzazione x, mentre quella in (b) ha polarizzazione y.
Nella fig. 4.12 si vede l’esempio di due onde trasversali polarizzate linear mente, una secondo l’asse x, l’altra secondo l’asse y. Questa figura rappresenta anche l’andamento di un’onda elettromagnetica con polarizzazione lineare. Le due onde mostrate nella fig. 4.12 potrebbero rappresentare le oscillazioni del campo elettrico e magnetico che hanno sempre piani di oscillazione perpendicolari tra loro. Un’onda può non avere nessuna polarizzazione media; per esempio, la luce che arriva sulla terra, o quella emessa da una lampadina incandescente hanno una polarizzazione casuale, che varia istantaneamente con la frequenza di emissione dei fotoni. In questo caso si parla di onda non polarizzata.
4.6.1. Alcuni fenomeni che avvengono con le onde La diffrazione è il fenomeno per cui un’onda, quando incontra un ostacolo, genera una serie di onde che possono essere descritte come se l’ostacolo fosse una sorgente di onde sferiche14. Il fenomeno avviene essenzialmente (cioè, gli effetti sono macroscopici) quando l’ostacolo ha dimensioni dell’ordine di grandezza o minori della lunghezza d’onda dell’onda che incide sull’ostacolo. Questa è anche la scala con cui l’onda “interagisce” con l’ostacolo.
elettromagnetismo
181
figura 4.13 Effetti della diffrazione per un’onda che colpisce vari ostacoli λ
λ
L
L
(a)
(b)
(c)
Tutto va come se il punto di incontro dell’onda con l’ostacolo diventasse una sorgente di onde semisferiche nella direzione in cui si stava propagando l’onda prima di incontrare l’ostacolo. (a) Onda che incontra una fenditura in cui la larghezza della fenditura è più piccola della lunghezza d’onda: Lλ. (c) Onda che incontra un ostacolo “puntiforme” (l’estremità del muro).
Per esempio (cfr. fig. 4.13a), se un’onda incide su uno schermo con un “piccolo foro”, al di là dello schermo la luce sarà “come se” fosse stata generata da una sorgente puntiforme posta nel foro. Se l’onda incontra un ostacolo (un muro) succede la stessa cosa. Gli effetti dipendono dalla lunghezza d’onda λ dell’onda considerata in rapporto alle dimensioni degli oggetti che incontra. Ecco alcuni esempi. 1. onde sonore udibili: λ ~ 2 cm ÷ 10 m; il suono “gira” intorno alle porte, alle case; gli strumenti musicali in cui il suono interagisce con la geometria dell’oggetto hanno queste dimensioni tipiche; 2. onde elettromagnetiche, luce visibile: λ ~ (0,4 ÷ 0,7) ∙ 10–6 m; per vedere gli effetti della diffrazione della luce servono ostacoli molto piccoli (la superficie di un cd, per esempio, che ha i solchi distanti fra loro circa 1 μm); 3. onde elettromagnetiche, onde radio vhf/uhf: λ ~ 10 cm ÷ 10 m; è il segnale radio fm-tv-cellulari, l’antenna deve essere lunga da circa un metro (tv) a pochi centimetri (cellulare); il segnale viene fermato da una casa con i muri spessi, da una montagna ecc.; 4. onde elettromagnetiche, onde radio lf/mf, basse/medie frequenze: λ ~ 100 m ÷ 10 km; il segnale radio am oltrepassa case e montagne.
182
fisica per filosofi
L’interferenza è il fenomeno legato alla somma di due (o più) onde che hanno la stessa frequenza. Il risultato dipende essenzialmente dalla fase relativa delle due onde. Consideriamo due onde con identica pulsazione ω e, per semplicità, con la stessa ampiezza A0: A1 (x, t) = A0 cos (ωt +
2π x + φ1) λ
A2 (x, t) = A0 cos (ωt +
2π x + φ2) λ
Sommandole avremo, utilizzando le opportune formule trigonometriche:
(
ATOT(x, t) = A1(x1, t)+A2(x2, t) ≅ 2A1 x, t,
)
φ1+φ2 ∆φ ∙ cos 2 2
Si ricorda che una differenza di cammino ∆x è equivalente a una differenza di fase ∆φ│∆x = (2π/λ) ∆x. Quindi, l’ampiezza massima totale in un certo punto dipende dalla differenza di fase globale ∆φ, indipendentemente dal fatto se questa differenza sia dovuta a una differenza della fase iniziale o a una differenza del cammino percorso. L’ampiezza massima sarà, dunque, in un certo punto in cui esiste una differenza di fase ∆φ: max
A TOT = 2A0 ∙ cos
∆φ 2
Avremo, allora, due casi limite. 1. Un’interferenza cosiddetta “costruttiva” (cfr. fig. 4.14a): le due onde hanno la stessa ampiezza e lo stesso segno, perciò si sommano e danno un’ampiezza massima doppia di quella che ognuna aveva inizialmente: ∆φ = 0° → ∆φ/2 = 0° → cos 0° = 1 → Atot = 2A0 ∙ 1 = 2A0 2. Un’interferenza cosiddetta “distruttiva” (cfr. fig. 4.14b): le due onde che si sommano hanno ampiezza uguale ma segno opposto, perciò la loro somma dà zero (in quel punto non c’è nessuna onda). ma x ∆φ = 180° → ∆φ/2 = 90° → cos 90° = 0 → Ato t = 2A0 ∙ 0 = 0
elettromagnetismo
183
figura 4.14 Interferenza di due onde con la stessa ampiezza A e fase diversa: Atot = A1 + A2 A1
0
A2
A1 A2
0
Atot
0
Atot
Interferenza costruttiva A2 = A1 → A1+ A2= 2A1
Interferenza distruttiva A2 = –A1 → A1+ A2= 0
(a)
(b)
(c)
Le due onde devono avere la stessa frequenza/lunghezza d’onda. (a)-(b) A seconda della fase, la somma delle due onde di ampiezza A1 = A2 = A0 darà un’onda con ampiezza 2A0 oppure un’onda con ampiezza zero. (c) Interferenza da una doppia fenditura: le onde sferiche che escono dalle due fenditure si sommano algebricamente in tutto lo spazio. Quando incontrano lo schermo a seconda che ci sia interferenza distruttiva o costruttiva avremo luce o buio, quindi una banda scura o una banda luminosa.
Quello che succede è che l’energia si ridistribuisce nello spazio, in alcuni punti si ha più energia di prima (interferenza costruttiva: Atot = 2A0), in altri punti non si ha nessuna onda, quindi l’energia è zero (interferenza distruttiva: Atot = 0). In totale l’energia che incide su tutto lo schermo sarà sempre la somma di tutta quella che era uscita dalle due fenditure. Se uno schermo con due piccoli fori viene investito da un’onda, avviene prima un fenomeno di diffrazione, e poi l’interferenza fra le onde che escono dai due fori. Il risultato è di avere alcune zone dello spazio in cui le onde si sommano e altre in cui non c’è luce (cfr. fig. 4.14c).
Percorso storico-filosofico 5. Moto assoluto, spazio assoluto ed etere Per Galilei, come abbiamo visto (cfr. Percorso storico-filosofico 2), i concetti di quiete e movimento si definiscono sempre rispetto a un determinato sistema di riferimento, per esempio quello della superficie terrestre. Questa concezione è generalizzata in meccanica classica nella formula delle trasformazioni galileiane, che descrivono come cambia la descri-
184
fisica per filosofi
zione matematica del movimento a seconda del sistema di riferimento rispetto a cui si definiscono gli spostamenti. Con il consolidamento della meccanica moderna, tuttavia, si è posto il problema di stabilire se il movimento avvenga sempre e soltanto relativamente a un sistema di riferimento individuato da qualche oggetto nello spazio (moto relativo) o se esista un moto assoluto. La definizione di un moto assoluto richiede l’individuazione di uno spazio assoluto, cioè un sistema di riferimento unico e onnicomprensivo per tutti i movimenti naturali, qual era quello definito dal centro della terra nel cosmo geocentrico aristotelico. Un discorso analogo vale per il tempo (cfr. Percorso storico-filosofico 6). Si pongono così le basi per una contrapposizione teorica che attraversa tutta la fisica moderna e contemporanea, quella tra “assolutismo spaziotemporale”, secondo cui esiste un moto assoluto, e “relativismo spaziotemporale”, secondo cui non è possibile definire un sistema di riferimento assoluto per tutti i movimenti in natura e ogni movimento è sempre relativo a un sistema di riferimento locale. Cartesio, per esempio, sostiene una posizione relativista. Egli nega che si possa concepire uno spazio vuoto, rispetto a cui si definirebbero i movimenti, e afferma, invece, che ogni movimento consiste in uno spostamento relativo di parti della materia che riempie l’universo. Newton introduce un radicale ripensamento di questa concezione. È compito della filosofia naturale, a suo avviso, distinguere i moti reali da quelli apparenti. A tale scopo è indispensabile definire uno spazio assoluto, che funga da sistema di riferimento ultimo per i movimenti. Ecco come Newton lo descrive nello scolio alle Definizioni dei Principi matematici di filosofia naturale: Lo spazio assoluto, per sua natura senza relazione ad alcunché di esterno, rimane sempre uguale ed immobile; lo spazio relativo è una dimensione mobile o misura dello spazio assoluto che i nostri sensi definiscono in relazione alla sua posizione rispetto ai corpi, ed è comunemente preso come lo spazio immobile […]. Se la Terra, per esempio, si muove, lo spazio della nostra aria, che relativamente alla Terra rimane sempre identico, sarà ora una parte dello spazio assoluto attraverso cui l’aria passa, ora un’altra parte di esso; e così assolutamente in perpetuo (Newton, 1965, pp. 102-3).
Lo spazio assoluto è, dunque, un requisito teorico necessario, in linea di principio, per parlare di movimento «vero»: «Il moto assoluto è la traslazione del corpo da un luogo assoluto in un luogo assoluto» (ivi, p. 104). Lo spazio assoluto, pertanto, deve essere posto come sfondo
elettromagnetismo
185
di tutti gli spazi relativi definiti con i sensi rispetto a qualche oggetto. Il fatto che lo spazio assoluto sia una condizione necessaria affinché le leggi del movimento possano essere applicate fu sottolineato anche dal grande matematico Eulero (Leonhard Euler, 1707-1783). Si tratta di un ente per definizione non osservabile. Nei Principi matematici di filosofia naturale, del resto, Newton studia i moti planetari facendo uso di un sistema di riferimento relativo al centro di gravità del sistema solare (situato all’interno del Sole). Tuttavia, egli individua nei moti centrifughi una specie di movimento che attesta l’esistenza dello spazio assoluto. In un celebre esperimento mentale, Newton (ivi, pp. 109-10) immagina un secchio riempito d’acqua che ruoti appeso a un filo; l’innalzamento dell’acqua lungo le pareti del recipiente, che aumenta con la rotazione, indica un reale «sforzo di allontanarsi dall’asse» dell’acqua, che per Newton non dipende dal moto relativo delle parti d’acqua rispetto alle pareti del secchio e altri corpi esterni, e va invece considerato come un moto assoluto. Alla concezione newtoniana si oppose fermamente Leibniz (16461716), elaborando una concezione rigorosamente relativista di spazio e movimento. Per Leibniz lo spazio vuoto non può essere considerato una sostanza che esista indipendentemente dai corpi. Si tratta, piuttosto, di un «ordine di coesistenza» dei corpi che compongono l’universo. Nel carteggio con Samuel Clarke, difensore delle teorie newtoniane, Leibniz (quinto scritto, par. 47) descrive così la formazione del concetto di spazio: Ecco come gli uomini giungono a formarsi la nozione dello spazio. Considerano che più cose esistono a un tempo e trovano tra esse un certo ordine di coesistenza, secondo il quale il rapporto tra le une e le altre è più o meno semplice. È la loro situazione o distanza. Quando accade che uno di questi coesistenti muti il suo rapporto con una moltitudine di altri, senza che essi mutino i rapporti tra loro, e che un nuovo venuto acquisti un rapporto uguale a quello che il primo aveva con gli altri, si dice sia venuto al suo posto. E tale mutamento si chiama moto […]. E supponendo, o fingendo, che tra quei coesistenti ve ne siano in un numero sufficiente che non abbiano subito mutamenti, si dirà che quelli che con tali esistenti fissi hanno un rapporto tal quale altri avevano precedentemente rispetto ad essi, hanno occupato il medesimo posto che questi ultimi avevano occupato. E ciò che comprende tutti questi posti è chiamato spazio. Il che fa vedere come, per avere l’idea del posto e, di conseguenza, dello spazio, basti considerare i rapporti e le regole dei loro mutamenti, senza che vi sia bisogno di figurarsi alcuna realtà assoluta fuori delle cose di cui si considera la situazione (Leibniz, 2000, vol. iii, p. 535).
186
fisica per filosofi
La tesi di Leibniz è collegata a diversi argomenti filosofici a sostegno del fatto che lo spazio è un qualcosa di ideale e non di reale. Per esempio, egli sostiene che se esistesse uno spazio assoluto, indipendente dai corpi, non si darebbe ragione del fatto che Dio non ha disposto tutte le cose in una posizione diversa nello spazio assoluto, in cui tutti i posti sono identici, ma ciò entra in conflitto con il suo principio di ragion sufficiente. Inoltre, egli contesta la tesi di Newton secondo cui lo spazio sarebbe una manifestazione dell’onnipresenza di Dio, che a suo avviso porta a confondere il piano metafisico con quello dei fenomeni. Anche Kant, benché elabori la sua filosofia della natura a partire dalla scienza newtoniana, escluderà questo aspetto metafisico della concezione di Newton. Nei suoi Principi metafisici della scienza della natura, in cui intraprende una giustificazione filosofica dei principi della fisica moderna, Kant (2003, p. 347) afferma che lo spazio assoluto non è un oggetto dell’esperienza, ma è soltanto l’idea di un sistema di riferimento onnicomprensivo che lo scienziato inevitabilmente presuppone quando definisce i sistemi di riferimento relativi. Mach (1838-1916), nel suo importante studio sui principi della meccanica (1883), afferma che i concetti di spazio e tempo assoluto «sono puri enti ideali non conoscibili sperimentalmente» (Mach, 1977, p. 246). Mach elabora anche una critica dell’esperimento mentale del secchio rotante. Newton mostrerebbe che la rotazione del secchio produce forze centrifughe indipendenti dal moto relativo tra pareti del secchio e acqua, ma non proverebbe che questa rotazione non sia relativa rispetto ad altri corpi. Mach ritiene, infatti, che ogni moto (o stato di quiete) è per definizione relativo a quello di altri corpi. D’altra parte, Mach formula un’ipotesi alternativa che permetterebbe di salvare la tesi dell’assolutismo: i corpi potrebbero trovarsi tutti in un «mezzo» onnipresente, che eserciterebbe un attrito trascurabile; si tratta di una tesi priva di «alcuna utilità pratica», ma Mach riconosce che, se fosse possibile raccogliere conoscenze sperimentali su questa ipotetica materia onnipresente, «l’idea di un mezzo quale sistema di riferimento potrebbe avere un valore scientifico maggiore che non quella dello spazio assoluto, che tante difficoltà porta con sé» (ivi, p. 248). Questo tipo di ipotesi, ai tempi di Mach, riceve grande attenzione tra gli scienziati, poiché si collega a un’altra ipotesi assai diffusa nella fisica moderna. Molti fisici, infatti, supponevano l’esistenza di un etere come sostrato di fenomeni diversi. Per esempio, il già citato Eulero lo ammetteva come mezzo entro cui si trasmettono i segnali luminosi, concepiti
elettromagnetismo
187
come onde. La concezione assume poi nuovo risalto con lo sviluppo della teoria del campo elettromagnetico di Maxwell, che individua nell’etere il supporto delle onde elettromagnetiche. La nuova teoria, del resto, suppone che la velocità della luce sia costante e indipendente dal sistema di riferimento di volta in volta scelto, pertanto fornisce un nuovo sostegno all’ipotesi di un etere che svolga la funzione dello spazio assoluto newtoniano. La questione viene affrontata nel celebre esperimento di Albert A. Michelson ed Edward Morley (1887), che mira a stabilire l’esistenza dell’etere come sistema di riferimento per il moto terrestre. L’esito negativo dell’esperimento conduce gli scienziati a un’intensa elaborazione di teorie alternative per conciliare la relatività del movimento con l’indipendenza della velocità della luce dal sistema di riferimento, che si risolve con la formulazione della teoria della relatività speciale di Einstein. In essa la simultaneità tra gli eventi, tradizionalmente ritenuta una semplice conseguenza dell’esistenza dello spazio, appare come uno stato relativo al sistema di riferimento, portando a una profonda rielaborazione dei concetti di spazio e tempo (cfr. Percorso storico-filosofico 6). Alla luce della teoria della relatività, anche la disputa sulle teorie assolutistiche e relativistiche dello spazio (e del tempo) si riapre (cfr. Percorso storicofilosofico 7).
5 Teoria della relatività speciale La teoria da svilupparsi si fonda – come ogni altra elettrodinamica – sulla cinematica dei corpi rigidi, poiché le affermazioni di una tale teoria riguardano relazioni tra corpi rigidi (sistemi di coordinate), orologi e processi elettromagnetici. La non sufficiente considerazione di queste circostanze è la radice delle difficoltà, con le quali l’elettrodinamica dei corpi in movimento attualmente deve lottare. Einstein (1905c, p. 892)
relatività speciale Primo principio della relatività speciale Le leggi della fisica hanno la stessa forma in tutti i sistemi di riferimento inerziali. Secondo principio della relatività speciale La velocità della luce nel vuoto è una costante indipendente dallo stato dei corpi emittenti o riceventi. Equivalenza massa-energia In un sistema di riferimento inerziale la grandezza E2 – p2c2 = m2c4 è un invariante. E è l’energia del sistema, m la sua massa e ˉp la sua quantità di moto.
5.1. Il punto della situazione in fisica agli inizi del Novecento Agli inizi del Novecento la situazione in fisica è questa: si crede nell’esistenza di uno spazio assoluto e di un tempo assoluto, indipendenti l’uno dall’altro, entrambi isotropi e omogenei. Si assume, inoltre, che lo spazio sia euclideo. Valgono la relatività galileiana e le trasformazioni galileiane, e valgono i principi della dinamica di Newton. Sistemi costituiti da molte particelle in moto relativo sono descritti dalle leggi della termodinamica. Vengono definite due nuove grandezze:
190
fisica per filosofi
la temperatura e il calore. Grazie alla termodinamica viene definita la direzione dei fenomeni naturali: il tempo. Due sole sono le forze (interazioni) conosciute: quella gravitazionale e quella elettromagnetica (quest’ultima nata dall’unificazione dell’interazione elettrica e di quella magnetica a opera di Maxwell). Le leggi della fisica sono deterministiche, o probabilistiche nel caso di sistemi termodinamici. Per definire lo stato di un sistema semplice (una piccola sfera, per esempio) è necessario sapere solo la sua posizione, la velocità, la massa e la carica elettrica. L’ottimismo di molti fisici sul fatto che ormai erano state gettate le basi di tutta la fisica è tale che Albert A. Michelson affermò nel 1894: «I grandi principi della fisica sono stati stabiliti, le verità future della fisica devono essere cercate al sesto posto decimale» (Horgan, 1996, p. 19, trad. mia). Tuttavia, i problemi irrisolti non sono di poco conto, alcuni fatti sperimentali generano degli interrogativi: o il comportamento è differente dalle previsioni teoriche oppure si trovano dei comportamenti non spiegati neanche approssimativamente dalla cosiddetta “fisica classica”. Ecco un elenco – parziale – dei problemi che si riscontrano; alcuni verranno affrontati e risolti dalle teorie della relatività (quella speciale per i punti 1-2, quella generale per i punti 3-4), altri (punti 5-9) dalla meccanica quantistica, altri ancora (punto 10) dalla moderna cosmologia. 1. La velocità della luce nel vuoto misurata in diversi sistemi di riferimento: sembra che non si sommi secondo le regole della fisica classica (somma di velocità in diversi sistemi di riferimento inerziali). 2. Il comportamento di oggetti con cariche elettriche (per esempio, spire conduttrici) in moto con velocità costante rispetto ad altri oggetti con correnti elettriche microscopiche (per esempio, magneti): lo stesso fenomeno sembra dover essere descritto da formule differenti a seconda del sistema di riferimento: questo va contro la relatività galileiana. 3. L’interazione gravitazionale così come descritta dalla legge di gravitazione universale di Newton: sembra trasmettersi istantaneamente anche per distanze galattiche. Com’è possibile? 4. Il calcolo dell’orbita di Mercurio, tenendo conto delle interazioni gravitazionali con il Sole e tutti gli altri pianeti: dà risultati differenti da ciò che si osserva, ma le misure sono molto precise. Perché? 5. Il colore degli oggetti in funzione della temperatura: perché oggetti scaldati ad alta temperatura hanno colori diversi a seconda della temperatura, indipendentemente dal tipo di materiale?
teoria della relatività speciale
191
6. La quantità di radiazione elettromagnetica, di energia radiante, emessa da un corpo nero1: la teoria prevede che questa energia sia infinita, ma ovviamente ciò non è possibile. 7. L’elettrone che, in un atomo, ruota intorno al nucleo: secondo l’elettromagnetismo classico un elettrone che ruota ha un’accelerazione diversa da zero (quella centripeta), perciò dovrebbe irradiare energia, quindi perdere energia e cadere dentro il nucleo. Perché questo non succede? 8. Le proprietà costanti di tutti gli elementi chimici: perché tutti gli atomi dello stesso tipo (per esempio, tutti gli atomi di ferro) hanno esattamente le stesse proprietà fisiche che risultano anche costanti nel tempo? 9. Le differenze di comportamento fra gli elementi: 1 elettrone in meno fa molta più differenza che molti elettroni in meno; per esempio, lo xeno ha solo un elettrone in più dello iodio (54Xe; 53I) eppure le due sostanze hanno proprietà molto differenti, mentre le proprietà dello xeno sono molto simili a quelle del kripton pur avendo 18 elettroni in più (54Xe; 36Kr). Perché? 10. Il colore del cielo: perché è nero di notte e azzurro di giorno? Il problema fu descritto da Keplero nel 1601 ed analizzato da Olbers nel 1826. Nella prima metà del xx secolo nascono due (tre) nuove teorie, per provare a risolvere questi problemi: le (due) teorie della relatività e la meccanica quantistica. Le teorie della relatività vengono pubblicate da Einstein in due anni precisi: nel 1905 quella della relatività speciale (o relatività ristretta) e nel 1916 quella della relatività generale. La prima affrontava i problemi che riguardavano la luce e i fenomeni elettromagnetici legati ai corpi in movimento: il risultato dell’esperimento di Michelson e Morley (1887) e alcune asimmetrie nell’elettromagnetismo. 5.1.1. Il problema della velocità della luce: l’esperimento di Michelson e Morley Secondo le leggi della fisica classica le velocità si sommano passando da un sistema di riferimento in moto a un altro, se entrambi i sistemi di riferimento sono inerziali. Cioè, se ci troviamo su un nastro trasportatore e camminiamo con una velocità di 2 m/s, e il nastro trasportatore si muove rispetto al terreno con una velocità di 3 m/s nella stessa direzione in cui ci muoviamo noi, un osservatore solidale con il terreno ci vedrà
192
fisica per filosofi
muovere alla velocità di 2 + 3 = 5 m/s. La somma classica delle velocità dovrebbe valere anche per la velocità della luce quando questa viene emessa da un sistema che si muove, per esempio da una persona che sta sulla Terra (che si muove a grande velocità intorno al Sole). Nella seconda metà del xix secolo Maxwell e collaboratori avevano misurato e predetto correttamente il fatto che la luce fosse un segnale elettromagnetico che si propagava a grandissima velocità (all’epoca la velocità della luce nel vuoto era stata misurata con buona precisione, si aveva c ≅ 298 000 km/s), ma rimaneva il problema di stabilire quale fosse il mezzo che trasportava quest’onda. Il punto era questo: qualunque onda trasporta energia, e mentre l’onda viaggia questa energia si trova nel mezzo che trasporta l’onda. Il suono, una volta emesso, viaggia nell’aria e l’energia dell’onda sonora viene trasmessa attraverso il movimento delle molecole di aria. Un’onda del mare viene trasmessa attraverso l’acqua, che trasporta l’energia dell’onda. Quindi, per analogia, anche l’onda elettromagnetica avrebbe dovuto essere trasportata da un mezzo. Quale? L’ipotesi di Maxwell e collaboratori era che la luce venisse trasportata da un mezzo chiamato etere luminifero, e che questo etere fosse immobile, solidale con lo spazio assoluto. Di conseguenza si sosteneva che ogni corpo in movimento fosse sottoposto a un “vento d’etere” che si muoveva rispetto al corpo alla stessa sua velocità, ma con direzione opposta. Come quando siamo su una bicicletta e sentiamo il vento contro di noi. Dal nostro punto di vista è come se noi fossimo fermi e fossimo immersi in un vento che si muove contro di noi. Ora, se la luce viaggia nell’etere e l’etere coincide con lo spazio assoluto, noi che siamo sulla Terra, in movimento rispetto all’etere, dovremmo misurare una velocità per la luce che si somma o si sottrae alla velocità della Terra che sta ruotando intorno al Sole2. Questo era quello che predicevano le relazioni di Galilei sulla somma delle velocità in sistemi inerziali. Nel 1887 Michelson e Morley realizzarono un esperimento per misurare questo “vento d’etere” rispetto a un osservatore sulla Terra. L’idea di base dell’esperimento era questa: se la luce si propaga attraverso l’etere, deve essere possibile rilevare la differenza della velocità della luce nella stessa direzione del vento d’etere, rispetto alla direzione opposta. Questo tipo di esperimento è stato ripetuto più volte nel corso dell’ultimo secolo, talvolta con modiche, ma sempre con lo stesso schema di principio; ne daremo qui la versione di base (cfr. fig. 5.1). Michelson e Morley, utilizzando un interferometro, lanciano un fascio di luce una volta nel senso di rivoluzione della Terra, una volta in
teoria della relatività speciale
193
figura 5.1 Esperimento di Michelson e Morley (1887) La luce fa due percorsi: Sacad e Sabad; i due tratti non in comune (aca e aba) hanno la stessa lunghezza L. Per ogni tratto il tempo impiegato sarà la lunghezza diviso la velocità
V T = velocità della Terra rispetto al Sole osservatore d
t(ac) = t(ca) =
S
a
L
c
L c – VT L c + VT L
t(ab) = t(ba) =
L
t’(aca) =
c
t’’(aba) = Sistema di riferimento solidale con il laboratorio (la Terra)
1—
2L
b
1
∙
c
1—
c
c2
1
∙
2L
VT2
VT2
c2
1
∙ 1—
VT2
c2
Il laboratorio si trova sulla Terra, quindi rispetto allo spazio assoluto si muove con velocità V T. Una sorgente S emette un raggio di luce. In a la luce incontra uno specchio semiargentato, che fa passare metà della luce (verso c) e ne riflette l’altra metà (verso b). La luce che arriva in c (uno specchio) viene riflessa, torna in a, viene deviata e arriva in d. La luce che arriva in b (uno specchio) viene riflessa, arriva in a, prosegue e arriva in d dove si somma alla luce proveniente dall’altro percorso; i due raggi percorrono esattamente lo stesso cammino ma con velocità differenti, perciò dovrebbero impiegare un tempo differente. In d si pone un rivelatore di luce che misura l’intensità della luce somma dei due raggi. Se il tempo di arrivo è differente, dunque se la velocità dei due raggi è differente, come era previsto dalla teoria, allora il rivelatore di luce deve misurare una variazione dell’intensità luminosa dovuta al fenomeno dell’interferenza fra i due raggi luminosi.
senso contrario, e perpendicolarmente, poi fanno interferire (sommano) i due raggi di luce. Questo apparato permette di rivelare la differenza nel tempo di arrivo di due raggi di luce identici (con la stessa frequenza). Il valore previsto dalla teoria per questa differenza di tempo era circa quaranta volte più grande di quello minimo rivelabile. Michelson e Morley fanno l’esperimento, lo ripetono più volte con un apparato sempre più sensibile e il risultato è sempre lo stesso: non vedono alcuna differenza
194
fisica per filosofi
figura 5.2 Il risultato pubblicato da Michelson e Morley (1887) 6.
0,05λ 0λ 0,05λ
N S
E W
0λ S N
In orizzontale c’è la direzione dell’asse dell’apparato rispetto alla Terra (NS, EW, SN); in verticale l’ampiezza del segnale proporzionale al ritardo di arrivo dei due raggi luminosi. La linea continua è il risultato della misura; quella tratteggiata è otto volte più piccola del risultato previsto calcolato utilizzando le formule della relatività galileiana. L’apparato sperimentale viene ruotato rispetto all’asse nord-sud per verificare che i due cammini ac e ab (cfr. fig. 5.1) siano effettivamente uguali.
nella velocità della luce! Le formule della relatività galileiana non funzionano. Il risultato sperimentale (cfr. fig. 5.2) non è ambiguo3, le ipotesi per giustificare le misure fatte sono queste: 1. le misure sono sbagliate; 2. i calcoli sono sbagliati; 3. il modello è sbagliato, cioè la luce non obbedisce alla legge classica di composizione delle velocità. Le misure furono ripetute con apparati diversi dando sempre lo stesso risultato negativo; era molto improbabile che fossero tutte sbagliate. I calcoli in realtà sono molto semplici, è facile controllare che non sono errati. Quindi, rimaneva l’ipotesi che il modello fosse sbagliato. Ma non era banale ipotizzare che le formule della relatività galileiana non fossero corrette e come andassero corrette. 5.1.2. Spire, magneti e correnti indotte La seconda classe di esperimenti che preoccupava Einstein riguardava gli effetti del moto relativo di magneti e spire conduttrici (una spira è un sottile anello di materiale conduttore), e delle correnti indotte dal
teoria della relatività speciale
195
movimento relativo dei due sistemi. L’esperimento tipico consiste nel considerare due oggetti – un magnete e una spira – che si muovono con velocità costante V uno rispetto all’altro. In questo caso possiamo porre l’osservatore, cioè il nostro sistema di riferimento, sul magnete (Alice; cfr. fig. 5.3a) oppure sulla spira (Bob; cfr. fig. 5.3b). La scelta è indifferente dato che i due sistemi sono entrambi inerziali. Quello che succede è che si genera una corrente elettrica che circola nella spira fintanto che c’è una velocità diversa da zero fra i due sistemi. Le formule che seguono sono un po’ complicate, l’importante è capirne il significato a grandi linee. Poniamo il caso di Alice, quindi di un osservatore solidale con il magnete. Se muoviamo la spira – che ha una resistenza elettrica R – rispetto al magnete, nella spira passerà una corrente i dovuta alla forza elettromotrice fem: fem – – ; fem = ∮ E ∙ ˉ dl = −∮ ˉv × B ∙ ˉ dl i= R dove Ē è il campo elettrico che nasce dalla forza di Lorentz che agisce sulle cariche elettriche – quelle che compongono il materiale di cui è fatta la spira – che si muovono con velocità v rispetto al campo B creato dal magnete. Poniamo ora il caso di Bob, quindi di un osservatore solidale con la spira. Se muoviamo il magnete rispetto alla spira, in essa passerà una corrente i: i=
fem dφ(B) ; fem = – R dt
dove Φ(B) è il flusso del campo B attraverso la superficie della spira. Il fatto è che la corrente i risulta la stessa per i due casi, sia come risultato del calcolo che sperimentalmente, ma in ciascuno dobbiamo utilizzare due formule diverse per calcolare la stessa forza elettromotrice e, quindi, la stessa corrente i. In realtà abbiamo sempre e solo un movimento relativo del magnete rispetto alla spira. Secondo la relatività galileiana se abbiamo dei sistemi che si muovono uno rispetto all’altro con velocità costante, le leggi della fisica devono rimanere le stesse: dobbiamo poter utilizzare le stesse formule. Se, però, dobbiamo ricorrere a formule diverse per calcolare la stessa corrente nei due casi, allora c’è un’asimmetria che non dovrebbe esserci. Se, per esempio, uno dei due sistemi fosse solidale con lo spazio assoluto, mentre l’altro si muovesse rispetto a esso, dalla scelta della formula da utilizzare per calcolare l’effetto sperimentale potremmo decidere in
196
fisica per filosofi
figura 5.3 Esperimento del magnete e della spira (a)
(b) Alice
i V
S
N
i
V
S
N
Bob
Abbiamo un magnete che si muove con velocità costante V rispetto a una spira o viceversa. Secondo le teorie dell’elettromagnetismo i due osservatori – Alice in (a) e Bob in (b) – devono utilizzare formule differenti per calcolare la corrente i che scorre nella spira; ma questa corrente è la stessa per entrambi gli osservatori. C’è o no un’asimmetria?
quale dei due sistemi ci troviamo. Potremmo individuare, dunque, un sistema di riferimento privilegiato. Questo è un problema.
5.2. La teoria della relatività speciale Ecco l’introduzione dell’articolo originale di Einstein del 1905, Sull’elettrodinamica dei corpi in movimento. Nel titolo non c’è la parola “relatività”, si parla, appunto, dell’elettrodinamica dei corpi in movimento, cioè dei problemi che abbiamo appena discusso: la velocità della luce e le correnti indotte dal moto di magneti e spire. Sull’elettrodinamica dei corpi in movimento A. Einstein È noto che l’elettrodinamica di Maxwell – come la si interpreta attualmente – nella sua applicazione ai corpi in movimento porta a delle asimmetrie, che non paiono essere inerenti ai fenomeni. Si pensi per esempio all’interazione elettromagnetica tra un magnete e un conduttore. I fenomeni osservabili in questo caso dipendono soltanto dal moto relativo del conduttore e del magnete, mentre secondo l’interpretazione consueta i due casi, a seconda che l’uno o l’altro di questi corpi sia quello in moto, vanno tenuti rigorosamente distinti. Se infatti il magnete è in moto e il conduttore è a riposo, nei dintorni del magnete esiste un campo elettrico con un certo valore dell’energia, che genera una corrente nei posti dove si trovano parti del conduttore. Ma se il magnete è in quiete e si muove il conduttore, nei dintorni del magnete non esiste alcun campo elettrico, e si ha invece nel conduttore una forza elettromotrice, alla quale non corrisponde
teoria della relatività speciale
197
nessuna energia, ma che – a parità di moto relativo nei due casi considerati – dà luogo a correnti elettriche della stessa intensità e dello stesso andamento di quelle alle quali dà luogo nel primo caso la forza elettrica. Esempi di tipo analogo, come pure i tentativi andati a vuoto di constatare un moto della terra relativamente al “mezzo luminoso” portano alla supposizione che il concetto di quiete assoluta non solo in meccanica, ma anche in elettrodinamica non corrisponda ad alcuna proprietà dell’esperienza, e che inoltre per tutti i sistemi di coordinate per i quali valgono le equazioni meccaniche debbano valere anche le stesse leggi elettrodinamiche e ottiche, come già è dimostrato per le quantità del prim’ordine. Assumeremo questa congettura (il contenuto della quale nel seguito sarà chiamato “principio di relatività”) come postulato, e oltre a questo introdurremo il postulato con questo solo apparentemente incompatibile, che la luce nello spazio vuoto si propaghi sempre con una velocità determinata V, indipendente dallo stato di moto dei corpi emittenti. Questi due postulati bastano a pervenire a un’elettrodinamica dei corpi in movimento semplice ed esente da contraddizioni, costruita sulla base della teoria di Maxwell per i corpi in quiete. L’introduzione di un “etere luminoso” si dimostra fin qui come superflua, in quanto secondo l’interpretazione sviluppata non si introduce uno “spazio assoluto in quiete” dotato di proprietà speciali, né si associa un vettore velocità a un punto dello spazio vuoto nel quale abbiano luogo processi elettromagnetici. La teoria da svilupparsi si fonda – come ogni altra elettrodinamica – sulla cinematica dei corpi rigidi, poiché le affermazioni di una tale teoria riguardano relazioni tra corpi rigidi (sistemi di coordinate), orologi e processi elettromagnetici. La non sufficiente considerazione di queste circostanze è la radice delle difficoltà, con le quali l’elettrodinamica dei corpi in movimento attualmente deve lottare (Einstein, 1905c, pp. 891-2).
Vale la pena di sottolineare alcuni punti, ripresi dalla citazione appena riportata in cui evidenziamo con il corsivo alcuni elementi rilevanti: 1. «È noto che l’elettrodinamica di Maxwell […] porta a delle asimmetrie, che non paiono essere inerenti ai fenomeni»: le asimmetrie della teoria non “paiono” essere legate ai fenomeni; 2. «Esempi di tipo analogo […] portano alla supposizione che il concetto di quiete assoluta non solo in meccanica, ma anche in elettrodinamica non corrisponda ad alcuna proprietà dell’esperienza»: è sensato “supporre” che non si possa parlare di quiete assoluta, non solo in meccanica, ma anche in elettrodinamica; 3. «Assumeremo questa congettura (il contenuto della quale nel seguito sarà chiamato “principio di relatività”) come postulato»: assumiamo come postulato (il primo postulato della relatività speciale) il principio di relatività per tutte le leggi della fisica;
198
fisica per filosofi
4. «Introdurremo il postulato […] che la luce nello spazio vuoto si propaghi sempre con una velocità determinata V, indipendente dallo stato di moto dei corpi emittenti»: assumiamo come postulato (il secondo postulato della relatività speciale) che la velocità della luce nel vuoto sia una costante; 5. «Questi due postulati bastano a pervenire a un’elettrodinamica dei corpi in movimento semplice ed esente da contraddizioni»: lo scopo è costruire una teoria semplice e coerente, non si afferma che sarà l’unica…; 6. «L’introduzione di un “etere luminoso” si dimostra fin qui come superflua»: non si dice che l’etere non esiste, ma che non è necessario per descrivere la realtà; 7. «La non sufficiente considerazione di queste circostanze è la radice delle difficoltà, con le quali l’elettrodinamica dei corpi in movimento attualmente deve lottare»: tutti i problemi nascono nel non aver considerato con la dovuta attenzione i processi di misura delle distanze e dei tempi. È semplice, no? 5.2.1. I due principi della relatività speciale Einstein, quindi, propone di risolvere il problema delle asimmetrie legate al comportamento di alcuni oggetti in movimento (quelli con carica elettrica e la luce) partendo da due principi, appunto, i principi della relatività speciale. 1. Primo principio: Le leggi della fisica sono le stesse in tutti i sistemi di riferimento “inerziali”, cioè per tutti i sistemi che si muovono uno rispetto all’altro con velocità costante (vale per tutte le leggi della fisica, non solo per la meccanica).
2. Secondo principio: La velocità della luce nel vuoto è una costante universale4, è indipendente dal moto del sistema che la emette e da quello che la riceve.
Da queste due assunzioni Einstein prosegue con lo scopo di riscrivere le trasformazioni di coordinate di Galilei in modo che soddisfino il secondo principio. Il percorso logico fatto da Einstein è semplice ma molto sottile. Come prima cosa viene (ri)definito il concetto di simultaneità per orologi “a
teoria della relatività speciale
199
riposo”, quindi entrambi fermi rispetto a un osservatore, ma situati in posti diversi: Se vogliamo descrivere il moto di un punto materiale, diamo i valori delle sue coordinate in funzione del tempo. Ora si deve tenere ben in mente che una descrizione matematica siffatta ha un significato fisico solo quando si sia detto chiaramente in precedenza che cosa si intende qui per “tempo”. Dobbiamo tener presente che tutte le nostre asserzioni nelle quali il tempo gioca un ruolo sono sempre asserzioni su eventi simultanei (Einstein, 1905c, pp. 892-3).
Il caso di orologi situati nello stesso posto è banale: si dicono simultanei se entrambi segnano lo stesso tempo nello stesso istante5. Se, invece, gli orologi si trovano in posti diversi la cosa è più delicata; ecco cosa scrive Einstein: Se nel punto A dello spazio si trova un orologio, un osservatore che si trovi in A può valutare temporalmente gli eventi nell’intorno immediato di A osservando le posizioni delle lancette dell’orologio simultanee con questi eventi. Se anche nel punto B dello spazio si trova un orologio – aggiungeremo, “un orologio esattamente con le stesse proprietà di quello che si trova in A” – allora una valutazione temporale degli eventi nell’intorno immediato di B da parte di un osservatore che si trovi in B è pure possibile. Non è possibile tuttavia, senza un’ulteriore deliberazione, confrontare temporalmente un evento in A con un evento in B; finora abbiamo definito soltanto un “tempo di A” e un “tempo di B”, ma non abbiamo definito alcun “tempo” per A e B complessivamente. Quest’ultimo tempo può essere definito soltanto quando si assuma per definizione che il “tempo” che la luce impiega per andare da A a B è uguale al “tempo” che essa impiega per andare da B ad A. Ossia, parta un raggio di luce al “tempo di A” tA da A verso B, sia al “tempo di B” tB riflesso verso A e ritorni ad A al “tempo di A” t’A. I due orologi per definizione camminano sincroni quando: tB – tA = t’A – tB Assumiamo che questa definizione di sincronismo sia possibile in modo esente da contraddizioni, che quindi valgano le condizioni: 1. quando l’orologio in B cammina sincrono con l’orologio in A, l’orologio in A cammina sincrono con l’orologio in B; 2. quando l’orologio in A cammina sincrono sia con l’orologio in B che con l’orologio in C, gli orologi in B e C camminano in modi mutuamente sincroni. Abbiamo così determinato con l’aiuto di certe esperienze fisiche (pensate) che cosa si debba intendere per orologi a riposo che camminano sincroni e si trovano in posti separati e con questo evidentemente abbiamo ottenuto
200
fisica per filosofi
una definizione di “simultaneo” e di “tempo”. Il “tempo” di un evento è l’indicazione simultanea con l’evento di un orologio a riposo che si trova nella posizione dell’evento, che cammina sincrono con un determinato orologio a riposo, e cioè per tutte le determinazioni di tempo compiute con l’orologio stesso. Assumiamo secondo l’esperienza che la quantità: –– 2AB =V t’A – tA sia una costante universale (la velocità della luce nello spazio vuoto). È essenziale che noi abbiamo definito il tempo mediante orologi a riposo nel sistema a riposo; chiamiamo il tempo ora definito, a motivo di questa associazione con il sistema a riposo “il tempo del sistema a riposo” (ivi, pp. 893-5).
È possibile, dunque, definire in modo non ambiguo la simultaneità di due orologi “a riposo” solo avendo assunto che la velocità della luce sia una costante universale. Se vogliamo definire un intervallo di tempo per un evento che avvenga in posizioni diverse da dove si trova l’osservatore e in moto rispetto a questo la cosa si fa più complicata. Einstein analizza quali tempi misurerebbero, per un certo evento, due osservatori, uno a riposo e uno in moto rispetto agli orologi. Il risultato è il seguente: Vediamo quindi che non possiamo attribuire al concetto di simultaneità alcun significato assoluto, ma che invece due eventi che, considerati in un sistema di coordinate, sono simultanei, se considerati da un sistema che si muove relativamente a questo sistema, non si possono più assumere come simultanei (ivi, p. 897).
A questo punto è chiaro che i vecchi concetti di tempo, spazio, simultaneità, lunghezze e tempi assoluti vanno rivisti.
5.3. Il risultato matematico: le trasformazioni di Lorentz La prima conseguenza della relatività speciale, avendo assunto come veri i postulati, è quella di dover riscrivere le trasformazioni di coordinate che fanno passare da un sistema di riferimento inerziale a un altro: le trasformazioni di Galilei, infatti, violano il secondo principio della relatività spe-
teoria della relatività speciale
201
ciale (che la velocità della luce sia costante per ogni sistema di riferimento). Vedremo ora le differenze fra le trasformazioni di Galilei (quelle della meccanica classica) e quelle di Lorentz (quelle della relatività speciale). Ci si potrebbe chiedere perché le trasformazioni della relatività di Einstein si chiamino trasformazioni di Lorentz: (cfr. par. 5.4.4). Le scriveremo per due sistemi particolarmente semplici. La loro derivazione non è complicata, ma ha qualche aspetto formale non elementare (cfr., per esempio, Kittel, Knight, Ruderman, 1970, pp. 376-80). Consideriamo due sistemi di riferimento, in moto uno rispetto all’altro, in cui il secondo (O’, x’, y’) si muove con velocità V rispetto al primo (O, x, y; cfr. fig. 5.4). Il primo sistema può essere la Terra, il secondo un treno che si muove con velocità costante V. Nei due sistemi abbiamo (almeno) due orologi che misurano il tempo in ciascuno di essi, t nel sistema O e t’ nel sistema O’. Sul treno può esserci poi un uomo fermo o in movimento la cui posizione è x rispetto al sistema O e x’ rispetto al sistema O’. Le trasformazioni di coordinate di Galilei ci forniscono le espressioni di x in funzione di x’ e di t in funzione di t’. Per semplicità si assume che all’istante iniziale t = t’ = 0 i due sistemi abbiano le due origini coincidenti (O = O’) e che la velocità di O’ rispetto a O sia in direzione x. Quindi, si avrà sempre y = y’ e z = z’. Ecco le trasformazioni di coordinate: 1. quelle della meccanica classica di Galilei, nelle quali è presente il tempo “assoluto” (t = t’), in cui i due orologi segneranno sempre lo stesso tempo. E quelle di Lorentz della relatività speciale, in cui il tempo dipende anche dalla posizione e dalla velocità di un sistema rispetto all’altro:
{
Galilei Lorentz x = x’ + Vt’ x = γ(x’ + Vt’)
{
V t = γ (t’ + x’ c2 ) — 2 t = t’ γ = 1/√ 1– v2 c
In entrambi i casi si assume per semplicità y = y’ e z = z’. Nelle trasformazioni di Lorentz spazio e tempo non sono più indipendenti: la misura di uno dipende dalla misura dell’altro. Il tempo è determinato dallo spazio e lo spazio dal tempo, quindi t ≠ t’, si supera il concetto di un tempo assoluto. Lo scorrere del tempo dipende dal sistema di riferimento, e dalla velocità dell’evento considerato rispetto a chi lo osserva.
202
fisica per filosofi
figura 5.4 Schema di due sistemi di riferimento, uno fermo – quello con origine in O – e un altro – il treno, O’ – in moto con velocità V rispetto al primo t
y
(a)
y’
y
(b)
V O’
=
V
O
t’
x
O’
x’ x
O x, x’
Sul treno c’è un uomo la cui posizione è x se misurata dal primo sistema, e x’ se misurata dal secondo. I tempi misurati da due orologi nel primo e nel secondo sistema di riferimento sono t e t’. All’istante t = t’ = 0 i due sistemi siano coincidenti (O = O’). In (b) i due sistemi di riferimento sono disegnati sfalsati anche secondo l’asse y per chiarezza.
Vediamole in dettaglio: nelle trasformazioni di Lorentz appare un coefficiente che non esisteva in quelle di Galilei, il fattore γ. Questo è il cosiddetto “fattore relativistico”, un numero adimensionale compreso fra 1 e infinito che viene definito così:
{
1 v=0→γ=1 γ= 2 quindi: 1 ≤ γ ≤ ∞ v 1— 2 c v = c → γ = ∞ Prima di osservare gli effetti fisici di queste trasformazioni, vediamo come funziona il fattore γ, il termine che ci dice quanto siano grandi gli effetti relativistici in un sistema. Se la velocità c della luce fosse infinita, il fattore γ sarebbe uguale a 1 e le trasformazioni relativistiche sarebbero identiche a quelle di Galilei; ma velocità infinita vuol dire trasmissione istantanea dei segnali: questo creerebbe ben altri problemi; inoltre, sappiamo che non è vero, il fatto che la velocità della luce sia finita non è in discussione. Se, invece, V = 0, cioè per sistemi entrambi “a riposo” uno rispetto all’altro, abbiamo sempre γ = 1, le trasformazioni ridiventano quelle di Galilei. La differenza si ha, pertanto, quando il fattore γ è diverso da 1. Ma quanto deve essere diverso da 1 il fattore γ per accorgerci della differenza con un sistema descritto dalle trasformazioni di Galilei? In altri
teoria della relatività speciale
203
tabella 5.1 Fattore relativistico γ calcolato per alcuni sistemi reali Oggetto
V(km/h)
Laboratorio Concorde Aereo x-15 Satellite gps a 26 500 km Terra intorno al Sole Sole intorno alla galassia
0 2 400 7 300 13 600 108 000 828 000 1 000 000
Muoni atmosferici
Protoni lhc-cern (2018) Luce nel vuoto
V(m/s)
β* = V/c
γ
0 667 2 028 3 778 30 000 230 000 300 000 3 000 000 30 000 000 90 000 000 150 000 000 936 000 000 260 000 000
0 1 (2,2 · 10–6) 1 –6 (6,8 · 10 ) 1 (1,3 · 10–5) 1,0000000001 (1,0 · 10–4) 1,0000000050 (7,7 · 10–4) 1,0000002939 (1,0 · 10–3) 1,0000005000 1% 1,00005 10% 1,00504 30% 1,04828 50% 1,2 86,7% 2 94,1% 3 98% 5 99% 7,1 99,5% 10 99,92% 25 99,99% 70,7 99,995% 100 99,9998% 500 299 792 455 99,9999991% 7 454 299 792 458 100% ∞
* Il fattore β (dove 0 ≤ β ⋜ 1) serve a dare un’idea di quanto la velocità V dell’oggetto sia vicina, in percentuale, alla velocità c della luce.
termini, quando cominceremmo a misurare cose diverse da quelle che calcoleremmo utilizzando le trasformazioni galileiane? Ricordiamoci che l’effetto relativistico si ha quando γ comincia a essere sensibilmente maggiore di 1. Nella tab. 5.1 sono stati calcolati i fattori γ per alcuni sistemi del mondo reale. Si può vedere come per nessun oggetto macroscopico in moto sulla Terra o nel sistema solare il fattore γ è sensibilmente maggiore di 1.
204
fisica per filosofi
figura 5.5 Il fattore relativistico γ in due scale diverse c
100
10 γ
10 γ
1
1
100 101 102 103 104 105 106 107 108 109 V (km/h)
1 · 108
(a)
c
100 Il fattore γ per velocità molto vicine alla velocità della luce c ≃ 1,1 miliardi di km/h
5 · 108 V (km/h)
1 · 109
(b)
In (a) si vede che per basse velocità il fattore γ è quasi sempre uguale a 1, mentre in (b) si vede quando questo fattore inizia a essere sensibilmente maggiore di 1: per velocità maggiori di circa 500 milioni di km/h. Il fattore γ diventa infinito per velocità uguali a quelle della luce nel vuoto, quindi solo per segnali elettromagnetici o gravitazionali (cfr. cap. 6).
Anche se considerassimo il moto del Sole rispetto al centro galattico avremo una velocità di 828 000 km/h, quindi 230 000 m/s: questo porterebbe a un fattore γ ≅ 1,0000003, tre decimi di milionesimo, una differenza veramente piccola; ecco perché Galilei e altri illustri fisici non se ne erano accorti: non se ne potevano accorgere. Tra i pochi oggetti “naturali” con massa e γ >> 1 ci sono i raggi cosmici e i muoni atmosferici, particelle cariche che – ne riparleremo – vengono create dall’impatto dei raggi cosmici con l’atmosfera terrestre. Ma questo fattore diventa infinito se prendiamo un segnale elettromagnetico (la luce nel vuoto; cfr. fig. 5.5). Per questo le leggi dell’elettromagnetismo creavano dei problemi: con la luce siamo in pieno regime relativistico!
5.4. Conseguenze delle trasformazioni di Lorentz Dalle trasformazioni di Lorentz seguono alcune proprietà che riguardano lo spazio, il tempo o altre grandezze fisiche misurate da un osservatore in moto rispetto a un oggetto o a un evento: 1. le velocità si sommano in maniera differente da quanto si facesse con le trasformazioni galileiane;
teoria della relatività speciale
205
2. le lunghezze si contraggono nella direzione del moto, per un osservatore in moto; 3. gli intervalli temporali si dilatano, per un osservatore in moto; 4. l’ordine temporale con cui avvengono alcuni eventi non è più determinato: dipende da chi li sta osservando; 5. molte altre grandezze fisiche dipendono dalla velocità relativa fra l’osservatore e il sistema osservato, alcune addirittura cambiano tipo (cfr. par. 5.8.1).
5.4.1. Somma di velocità Possiamo facilmente calcolare come funziona la somma delle velocità utilizzando le nuove trasformazioni. La velocità può essere calcolata valutando la grandezza dx/dt, cioè facendo il rapporto fra un certo spazio percorso (dx) diviso per il tempo impiegato a percorrerlo (dt). Dalle trasformazioni di Lorentz abbiamo: x = γ(x’ + Vt’) ; x = γx’ + γVt’ ; da cui: dx = γdx’ + γVdt’ V V V t = γ (t’ + x’ 2 ) ; t = γ t’ + γ x’ 2 ; da cui: dt = γdt’ + γ 2 dx’ c c c Quindi la velocità v del treno, vista dal sistema O, sarà, considerando che dx/dt = v e che dx’/dt’ = v’ (cfr. fig. 5.6): v (Lorentz)=
dx dt
=
γdx’ + γVdt’ v’ + V mentre: v (Galilei) = v’ + V = γV γdt’ + c2 dx’ 1 + v’V 2 c
Vediamo cosa succederebbe se la velocità v’ del treno diventasse uguale a quella della luce (in realtà non è possibile, ma supponiamo che lo sia, oppure che il treno sia un fotone che va a velocità c). Quindi, nella relazione v=
v’ + V se v’ = c , avremo: v = c 1 + v’V 2 c
Il fotone continuerebbe, cioè, a essere visto da entrambi i sistemi di riferimento come un oggetto che va alla velocità della luce.
206
fisica per filosofi
figura 5.6 Velocità del treno calcolata secondo le trasformazioni di Galilei e di Lorentz vista da un sistema O rispetto al quale un sistema O’ si muove con velocità V y
y’ v (Galilei) = v’ + V
V
v (Lorentz) =
v’
O
x’
O’
v’ + V 1 + v’
V c2
x
Il treno ha una velocità ha v’ rispetto al sistema O’. Questo a sua volta si muove con velocità V rispetto al sistema O. Il treno, rispetto al sistema O, ha una velocità v che viene calcolata differentemente secondo le trasformazioni di Galilei o quelle di Lorentz. Nelle formule si è assunto V > 0, come nel disegno; se fosse V < 0 il segno andrebbe cambiato.
Supponiamo ora che sia il sistema di riferimento O’ ad andare alla velocità della luce (trascuriamo il fatto che il treno non potrebbe trovarsi su un sistema che va alla velocità della luce), e, quindi, che V = c ; in tal caso, avremo ancora: v = c Dunque, il treno verrebbe visto come un oggetto che va alla velocità della luce anche dal sistema “a riposo” O. Vediamo ora un caso un po’ più realistico, valido pertanto per delle particelle che possiamo accelerare a velocità prossime a quella della luce, e questo lo possiamo fare (in ogni caso particelle di questo tipo esistono in natura). Supponiamo di avere una particella, con una velocità v’ (il treno del caso precedente) rispetto al sistema O’, che ha una velocità V = 0,9 c = 90% c rispetto al sistema O (cfr. fig. 5.7). Vogliamo calcolare quale sarà la velocità della particella vista dal sistema O. Se abbiamo V = 0,9 c la velocità della particella, vista dal sistema O, sarà (cfr. i valori indicati nella fig. 5.7): v=
v’ + 0,9 c 1 + 0,9 v’ c
teoria della relatività speciale
207
figura 5.7 Velocità v di un sistema che va a velocità v’ rispetto a O’, vista dal sistema O
V v’(O’) O’ O
x’ v(O)
x
V = 0,9 c = 90% c v’ v = v’ ⊕ V 0 0,9 c 0,5 c 0,96 c 0,8 c 0,988 c 0,9 c 0,994 c 0,95 c 0,997 c c c
Il sistema O’ va a velocità V rispetto a O. La velocità v dell’uomo si mantiene sempre inferiore a c, a meno che una delle due velocità (v’ o V) sia uguale a c.
In particolare, se v’ = 0,9 c, avremo: v’(O’) ⊕ V = 0,5 c ⊕ 0,9 c = 0,96 c dove con il simbolo ⊕ abbiamo indicato la particolare “somma” delle due velocità utilizzando la formula relativistica. La velocità misurata dal sistema O continua, quindi, a essere sempre minore di c, a meno che la velocità della particella o del sistema in moto non siano uguali a c, nel qual caso la velocità sarà esattamente c. Perciò la “somma” delle velocità, fatta tramite la relazione derivata dalle trasformazioni di Lorentz, porta a un valore che non supera mai la velocità della luce c. È importante sottolineare il significato di questa affermazione: non è possibile per nessun oggetto e per nessun sistema di riferimento osservare una velocità maggiore di c. La velocità della luce è la velocità massima con cui possiamo osservare/ trasmettere un qualunque segnale nell’universo. E con questo abbiamo risolto il primo problema sperimentale: il risultato nullo dell’esperimento di Michelson e Morley. La velocità della luce è una costante universale, non ha importanza chi la emetta e quale velocità abbia, la luce verrà vista sempre come un segnale che viaggia alla velocità della luce (nel vuoto), indipendentemente dalla direzione in cui è emessa. Questo fatto era stato posto come principio, ora abbiamo anche le relazioni che, legando spazi e tempi, permettono di calcolare cosa succede nella realtà e di fare le relative previsioni.
208
fisica per filosofi
5.4.2. Contrazione delle lunghezze Vediamo ora cosa succede alle dimensioni spaziali di un oggetto visto da due sistemi di riferimento diversi, uno in moto con velocità costante rispetto all’altro. Supponiamo di avere un righello rigido di estremi A, B e di lunghezza L0 (cfr. fig. 5.8) fermo nel sistema (O, x, y). L0 = xB – xA è la lunghezza a riposo, cioè misurata in un sistema di riferimento in cui il righello è fermo. Se vogliamo misurare la lunghezza del segmento AB vista dal sistema in moto (O’) dovremo misurare la posizione dei due estremi nello stesso istante t’ nel sistema O’. Dalle trasformazioni di Lorentz possiamo calcolare la posizione degli estremi del segmento vista da O rispetto a quella vista da O’ e viceversa: x x A = γ(x’A + Vt’A) x’A = γA – Vt’A ―► x xB = γ(x’B + Vt’B) x’B = γB – Vt’B
{
{
Possiamo calcolare, quindi, il valore della lunghezza L misurata in O’ x –x rispetto a quella misurata in O: L = x’B – x’A = B A – V (t’B – t’A). γ Ma la misura degli estremi x’A e x’B in O’ deve essere fatta nello stesso istante t’A = t’B, quindi: x –x L L = B γ A = 0 ≤ L0 . Va notato che γ ≥ 1, quindi L ≤ L0 γ Un oggetto di lunghezza L0, in moto rispetto a un osservatore, è più corto – per l’osservatore – di quanto apparirebbe lo stesso oggetto a un osservatore in quiete rispetto al medesimo (cfr. fig. 5.8a). La contrazione delle lunghezze avviene lungo la direzione del moto, mentre rimangono invariate le dimensioni misurate in direzione perpendicolare al moto (cfr. fig. 5.8b). È importante ricordarsi che un osservatore solidale con l’oggetto non si accorge di subire una contrazione. Al contrario per tale osservatore è l’osservatore in moto a subire la stessa contrazione. La lunghezza L0, quella misurata in un sistema in cui il righello è a riposo, si chiama “lunghezza propria”. Essa è sempre maggiore di qualunque altra lunghezza che è possibile misurare per tale oggetto, da un qualunque sistema di riferimento inerziale in moto rispetto a esso.
teoria della relatività speciale
209
figura 5.8 Contrazione delle lunghezze (b)
(a) y’
y
O’ O
y
V
A x’A xA
L
L L 0 L = γ0 < L0
B
y’
Ly0
Ly
x’
x’B xB
V
x
O
x’
O’
x Ly = L y0
(a) Contrazione delle lunghezze in direzione x, parallela alla velocità relativa fra l’osservatore e il sistema in esame. Un righello a riposo nel sistema (O, x, y) ha una lunghezza L0. Lo stesso righello misurato dal sistema (O’, x’, y’) ha una lunghezza L = L0/γ < L0. Attenzione! Questi sono due grafici concettuali, le “scale” degli assi x e x’ sono diverse e dipendono da chi le osserva. Per questo “graficamente” L = L0.
5.4.3. Dilatazione dei tempi Un orologio standard A, in moto rispetto a un osservatore B, appare a questo andare più lentamente di un identico orologio standard solidale con lo stesso osservatore. Per un osservatore solidale all’orologio A è, viceversa, il tempo dell’osservatore B a rallentare. Chiamiamo τ0 l’intervallo di tempo di un certo evento misurato da un orologio in un sistema di riferimento O a riposo rispetto all’evento, il tempo proprio. Lo stesso intervallo di tempo misurato con un orologio solidale con O’, in moto rispetto a O con velocità costante V è: τ = τ0 ∙ γ ≥ τ0 dove γ ≥ 1, quindi τ ≥ τ0 (cfr. fig. 5.9). Il tempo proprio τ0 è la minima durata misurabile per un evento. Esso è sempre minore di qualunque altra durata che è possibile misurare per tale evento (da un sistema di riferimento in moto rispetto a esso).
210
fisica per filosofi
figura 5.9 Dilatazione dei tempi y
y’ V B
τ = γ τ0 > τ0
τ
O’ O
x’ A
τ0
x
Lo stesso evento (il tempo che ci mette tutta la sabbia a passare dalla parte superiore a quella inferiore della clessidra) ha una durata differente se misurata nel sistema O, fermo rispetto alla clessidra, o nel sistema O’, in moto rispetto alla clessidra. In O misureremo τ0, mentre in O’ misureremo un valore τ ≥ τ0.
5.4.4. Il significato di dilatazione/contrazione dei tempi e delle lunghezze: perché la relatività speciale non l’ha fatta Lorentz Le trasformazioni dello spazio-tempo che fanno passare da un sistema inerziale a un altro inerziale vengono chiamate “trasformazioni di Lorentz” (il quale effettivamente ha scritto le trasformazioni). Ci si chiede, allora, perché si dice che la relatività speciale è opera di Einstein, che nel suo lavoro non cita Lorentz. I punti sono due. Lorentz ha scritto le sue trasformazioni l’anno prima che le scrivesse Einstein, il quale non sapeva del lavoro di Lorentz (altrimenti è probabile che l’avrebbe citato, ma questa è una supposizione). La cosa essenziale è l’interpretazione che i due fisici hanno dato delle stesse trasformazioni. Secondo Lorentz la contrazione/dilatazione non era una modifica dello spazio/tempo, cioè della metrica, ma erano gli oggetti stessi che fisicamente si contraevano, così come i tempi si dilatavano. Il fatto che queste contrazioni/dilatazioni fossero infinitesime portava al fatto che gli effetti non fossero misurabili/apprezzabili. Ma l’ipotesi era che avvenisse una modifica fisica intrinseca dell’oggetto. Se un essere vivente avesse potuto raggiungere velocità prossime a quelle della luce si sarebbe contratto e prima o poi sarebbe diventato una polpetta sanguinolenta.
teoria della relatività speciale
211
Secondo Einstein, invece, non è l’oggetto in sé che si contrae o la durata di un evento che diventa maggiore per l’oggetto stesso. Un oggetto, che si trova nel suo sistema di riferimento e che, quindi, è a riposo rispetto a sé stesso, non si accorge di nulla. Sono gli spazi e i tempi che, secondo le trasformazioni di Lorentz, si contraggono e si dilatano per un osservatore esterno, perciò in funzione della velocità del sistema di riferimento di chi li sta osservando rispetto al sistema di riferimento in cui gli eventi sono a riposo. C’è, inoltre, un ulteriore problema nell’interpretazione data da Lorentz: rispetto a quale sistema dovrebbe variare l’oggetto visto che possiamo immaginare infiniti altri sistemi di riferimento, ognuno con una velocità diversa rispetto al sistema a riposo? La risposta di Lorentz è che la velocità da cui dipendevano le dilatazioni e le contrazioni doveva essere misurata rispetto all’etere, supposto fermo. Quindi si ritornava all’ipotizzare un sistema di riferimento privilegiato. Le formule, dunque, sono le stesse, ma l’interpretazione è completamente diversa. Oggi sappiamo, da innumerevoli test e misure fatte nell’ultimo secolo, che la lettura corretta è quella di Einstein. Lo spazio e il tempo, come proprietà assolute del mondo in cui ci troviamo, non esistono. Essi sono relativi, dipendono da chi li osserva e in quali condizioni si trovano l’osservatore e l’osservato.
5.4.5. Il mistero dei muoni atmosferici I muoni sono delle particelle instabili – per “instabile” si intende una particella che decade in altre particelle dopo un tempo di vita medio τ – con carica elettrica negativa uguale a quella degli elettroni, ma con una massa circa duecento volte maggiore (207). I muoni atmosferici vengono creati dall’interazione di raggi cosmici di altissima energia, che arrivano sulla Terra da tutto l’universo, con gli strati superiori dell’atmosfera (quindi, a circa 15 km dalla superficie terrestre; cfr. fig. 5.10). La velocità dei muoni è molto vicina a quella della luce (v ≅ 99,92% c) ed essi decadono in altre particelle dopo un tempo τ0 = 2,2 μs (in media)6. La metà raggiunge la superficie terrestre e attraversa il nostro corpo (circa 500 al secondo per una persona in piedi). Ma c’è un problema: quale è la distanza media che percorrono i muoni prima di decadere? Il calcolo è facile: d ≅ c ∙ τ0 = 3 ∙ 108 ∙ 2,2 ∙ 10–6 ≅ 660 m
212
fisica per filosofi
figura 5.10 Schema del decadimento dei muoni atmosferici Raggi cosmici
Muone v ≅ c; = 25 Vita media = 2,2 μ s
Spazio Atmosfera terrestre
L0 ≅ 15 km Terra
Queste particelle vengono create nei primi strati dell’atmosfera con velocità molto vicina a quella della luce (γ ≅ 25), e circa la metà di essi raggiunge la Terra, percorrendo circa 15 km.
Ora, l’atmosfera è spessa circa 15 km, i muoni decadono dopo aver percorso circa 660 m. Com’è possibile che circa la metà di essi arrivi sulla superficie terrestre? Il fatto è che la vita media di 2,2 μs è quella misurata in un sistema a riposo. Ma per un osservatore che si trova sulla Terra, rispetto al quale i muoni viaggiano con velocità v, la vita media del muone appare dilatata di un fattore γ che, nel caso dei muoni atmosferici con v = 99,92% c, vale circa 25. Per noi che ci troviamo sulla Terra e che li vediamo muoversi a una velocità molto vicina a quella della luce i muoni hanno una vita media τ = γ ∙ τ0 = 25 ∙ 2,2 μs = 55 μs. Perciò, per noi, i muoni possono attraversare una distanza media: d = c ∙ τ = 3 ∙ 108 ∙ 55 ∙ 10–6 ≅ 1,65 ∙ 104 m ≅ 16,5 km
Dunque, una parte dei muoni può attraversare i 15 km dell’atmosfera e raggiungere la Terra! Equivalentemente la distanza che i muoni devono percorrere, misurata dai muoni stessi, appare contratta del fattore γ. I muoni, pertanto, dal loro punto di vista, vedono l’atmosfera spessa solo L = L0/γ = 15 km/25 ~ 600 m, quindi riescono ad attraversarla. Dalla Terra si vede un muone con la vita più lunga, dal muone si vede l’atmosfera più corta. Il muone, che classicamente non potrebbe attraversare l’atmosfera, in realtà raggiunge la Terra, e può essere rivelato.
teoria della relatività speciale
213
La cosa importante è che il fatto che avviene, cioè che i muoni arrivano sulla Terra, è unico e deve essere lo stesso per tutti gli osservatori. E la teoria spiega, ossia fornisce le formule che spiegano, il fatto reale: i muoni vengono creati all’inizio dell’atmosfera e circa la metà di essi arriva sulla Terra. E questo fatto non è ambiguo, anche se gli spazi e i tempi misurati dai vari osservatori sono differenti. La “realtà” è una sola.
5.5. Lo spazio-tempo Uno dei problemi che si incontra nella descrizione di cosa avviene in relatività, quindi in un mondo in cui spazio e tempo sono legati fra loro, è quello formale di fare i calcoli di eventi spazio-temporali in cui spazi e tempi sono legati tramite le relazioni di Lorentz. Il lavoro di formalizzare la geometria di uno spazio quadridimensionale (x, y, z, t) è stato fatto da Hermann Minkowski che nel suo discorso all’Assemblea degli scienziati della natura e dei medici tedeschi tenutasi a Colonia il 21 settembre 1908 disse: I concetti di spazio e di tempo che desidero esporvi traggono origine dal terreno della fisica sperimentale, e in ciò risiede la loro forza. Sono radicali. D’ora in avanti lo spazio singolarmente inteso, e il tempo singolarmente inteso, sono destinati a svanire in nient’altro che ombre, e solo una connessione dei due potrà preservare una realtà indipendente.
C’è, inoltre, il problema grafico di come immaginarsi e/o disegnare quello che succede visualizzando il percorso spazio-temporale di uno o più eventi. Qui ne daremo una versione semplificata, quasi esclusivamente grafica, per dare un’idea di come si possono descrivere eventi in uno spazio-tempo relativistico. 5.5.1. Grafici spazio-temporali Come prima cosa semplifichiamo il problema: lo spazio ha tre dimensioni, il tempo una; non è pensabile, quindi, disegnare dei grafici in quattro dimensioni che aiutino a rendere intuitivo il concetto di spazio-tempo. Per ora, dunque, consideriamo uno spazio molto più semplice: uno spazio a una dimensione, cioè una linea, una retta per il momento. Su
214
fisica per filosofi
figura 5.11 Spazio a una (a) e due (b) dimensioni t
3 2
x(A ) = 2 ; x(B) = –1
–2
B
O
–1
0 (a)
A 1
2
x
t(A ) = 1 ; x(A ) = 0
A
1 O
x 0
1
2
3
4
(b)
(a) L’asse di uno spazio unidimensionale, il quale si rappresenta con una linea, un’origine, e una scala, la x. L’origine si trova in O e la posizione di un qualunque punto è indicata dalla coordinata x. Serve un solo numero per individuare la posizione di un punto. (b) Spazio a due dimensioni: all’asse x ne aggiungiamo uno che indica il tempo t, con origine, direzione e scala. L’origine del tempo la mettiamo in O (per comodità) e la posizione di qualunque punto su questo asse è indicata dalla coordinata t. Serve un solo numero per individuare il tempo in cui avviene un evento.
una retta possiamo fissare un’origine e una scala: la posizione di un punto sarà data da un solo numero, positivo o negativo. Introduciamo poi una seconda variabile: il tempo, disegnando un’altra retta perpendicolare a quella relativa alla posizione. Anche per il tempo avremo un’origine (l’istante in cui avremo fatto partire l’orologio che segna i tempi) e una scala. Nella fig. 5.11 si può vedere come possiamo costruire uno spaziotempo a due dimensioni. Abbiamo un asse (l’asse x) che indica la posizione di un qualunque evento, e un altro (l’asse t) che indica il tempo in cui avviene un evento. Attenzione! Nello spazio possiamo mettere un punto “fermo”, cioè un punto che non si muove e che, quindi, rimane nella stessa posizione al passare del tempo. Per il tempo è diverso: non possiamo avere un evento fermo nel tempo. Se, perciò, disegniamo un punto è solo perché abbiamo fatto una specie di istantanea a un certo istante di tempo, fotografando la situazione in quel momento, e rappresentando, pertanto, un
teoria della relatività speciale
215
figura 5.12 Spazio-tempo in due dimensioni (a)
t C(0, tC )
C (0, t)
B(x B , tB )
O
A (x A , 0)
(b)
t
O
D(x B , t)
xD
x
(a) Tre eventi, A, B, C, che si trovano/avvengono istantaneamente – quindi, con durata nulla – in tre differenti punti dello spazio-tempo. (b) Linee di universo di due punti fermi (nello spazio): la linea del punto C che sta fermo nell’origine al tempo t = 0 e rimane fermo; la linea del punto D che sta fermo nel punto xD al tempo t = 0 e rimane fermo. Le linee di universo di entrambi i punti al passare del tempo descrivono delle rette parallele all’asse dei tempi t.
evento che accade in un certo istante e in un certo punto dello spazio. In generale disegneremo delle linee nello spazio-tempo: le linee di universo, che rappresentano il percorso che un oggetto compie nello spaziotempo (cfr. fig. 5.12). Vediamo ora come si disegnano nello spazio-tempo a due dimensioni le linee di universo di oggetti in movimento (cfr. fig. 5.13). Dobbiamo fissare un sistema di riferimento: sarà il sistema (O, x, t) che abbiamo disegnato nelle figure precedenti. Disegniamo poi tre linee di universo: L0, la linea di universo di un punto A che parte dall’origine e si muove verso destra con velocità v0; L1, la linea di universo di un punto B che all’istante iniziale si trovava nel punto x1 e che poi comincia a spostarsi verso destra con velocità v0 (la stessa di L1); L2, la linea di universo del punto C che parte sempre da x1 al tempo t = 0, proseguendo poi con velocità v2 verso sinistra. Dal grafico si vede che le due rette A e B sono parallele, i punti relativi non si incontreranno mai, infatti proseguono nel tempo con la stessa velocità nella stessa direzione. Mentre il punto C incontrerà il punto A in P.
216
fisica per filosofi
figura 5.13 Tre linee di universo L0: A parte da x = 0 e si muove con velocità v0 verso destra
t C L2: C parte da x = x1 e si muove con velocità v2 verso sinistra
A
B
P β α O
x1
α
L1: B parte da x = x1 e si muove con velocità v0 verso destra x
La linea L0 del punto A parte dall’origine O al tempo t = 0 e poi si muove verso destra con velocità costante v0 = 1/tanα > 0. La linea L1 del punto B parte dalla posizione x1 al tempo t = 0 e poi si muove verso destra con velocità v1 = v0. I due punti A e B non si incontreranno mai: le due linee di universo sono rette parallele. La linea L2 rappresenta il punto C che al tempo t = 0 si trovava in x1 e poi si muove verso sinistra con velocità v2 = 1/tanα < 0. Il punto A e il punto C si incontreranno: si stanno muovendo, infatti, uno verso l’altro. Il punto di incontro sarà il punto P, dove le due linee di universo avranno le stesse coordinate (posizione, tempo).
5.5.2. Spazio-tempo di Minkowski I grafici spazio-temporali del paragrafo precedente sono utili per avere una prima idea di come funzioni lo spazio-tempo, ma non sono adatti per una trattazione matematica completa in accordo con la relatività speciale. Avere, per esempio, un asse con i tempi e uno con le distanze porta al fatto che la distanza fra due punti qualsiasi sarà una grandezza in cui sono presenti contemporaneamente variabili temporali e spaziali; non essendo grandezze omogenee (non possiamo sommare tempi e lunghezze) avremmo delle relazioni particolarmente complicate, in ogni caso poco intuitive. Minkowski (1864-1909) nel 1908 ha creato una struttura matematica (quindi, formalmente completa) per descrivere lo spazio-tempo della relatività speciale. È uno spazio a quattro dimensioni, le tre dimensioni spaziali (x, y, z) e una dimensione temporale (ct). L’aver moltiplicato il tempo per la velocità della luce nel vuoto (costante) permette di sommare o sottrarre distanze spaziali e distanze temporali, questo perché la grandezza ct ha le dimensioni di uno spazio.
teoria della relatività speciale
217
Lo spazio-tempo di Minkowski è una struttura matematica ben precisa con determinate proprietà. Ne daremo qui alcune caratteristiche di base. Una differenza fondamentale fra lo spazio-tempo euclideo e galileiano e lo spazio-tempo di Minkowski è la definizione di distanza fra due punti. In uno spazio-tempo galileiano, dati due eventi a riposo in un sistema inerziale, possiamo calcolare (misurare) la loro distanza temporale, la loro distanza spaziale o entrambe. Queste due grandezze sono invarianti, nel senso che non dipendono dal sistema di riferimento. La stessa cosa vale se consideriamo un sistema in moto con velocità costante rispetto a un altro; le espressioni, infatti, sarebbero un po’ più complicate, ma il risultato sarebbe lo stesso: lo spazio (la lunghezza di un oggetto) e il tempo (la durata di un evento) sono grandezze invarianti, non dipendono da chi li osserva. Per esempio, in un sistema galileiano, quindi euclideo, potremo misurare un certo dt = t2 – t1 e un certo ds = x2 – x1 (cfr. fig. 5.14). Il tempo è assoluto, e lo spazio anche. La lunghezza ds potremo scriverla, supponendo di trovarsi in uno spazio tridimensionale (O, x, y, z): ds = (x2 – x1)2 + ( y2 – y1)2 + (z2 – z1)2 o anche: ds2 = (x2 – x1)2 + (y2 – y1)2 +(z2 – z1)2 = dx2 + dy2 + dz2. Nello spazio di Minkowski il tempo non è assoluto, sia l’intervallo spaziale ds che quello temporale dt saranno relativi, dipendendo dal sistema di riferimento che li osserva. Tuttavia, esiste una grandezza invariante, e questa è la distanza spazio-temporale fra due eventi, considerando questi ultimi come facenti parte di uno spazio a quattro dimensioni: le tre spaziali (x, y, z) e quella temporale (ct). Questa distanza, al quadrato, viene definita così: ds2 ≝ c2dt2 – (dx2 + dy2 + dz2)
Si tratta di un numero che può essere minore, maggiore o uguale a zero. Questa è la prima differenza formale con una distanza standard fra due punti nella geometria euclidea in cui la distanza ds2 fra due punti è un numero sempre maggiore o uguale a zero. Possiamo provare a calcolare il valore di ds2 per un evento visto dal sistema O oppure dal sistema O’, tenendo conto che le distanze spaziali e le distanze temporali saranno diverse. Consideriamo per semplicità solo
218
fisica per filosofi
figura 5.14 Spazio-tempo galileiano Alice misura: L = 5 cm; t = 2’ 2
2
Bob misura: L’ = ( xb – xa ) + ( yb – ya ) = 5 cm; t’ = 2’
y
Si ha: L = L’; t = t’ Alice
y’
L
O yb
t’ ya O’
t x x’ xb
xa
In uno spazio-tempo galileiano, descritto tramite la geometria euclidea, spazi e tempi sono assoluti. La lunghezza del righello L e la durata del tempo di svuotamento della clessidra t non dipendono dal sistema di riferimento di chi li sta osservando. Questo vale anche se il sistema O si muove con velocità costante rispetto al sistema O’, o viceversa.
uno spazio bidimensionale con velocità relativa di O’ rispetto a O uguale a V, in cui le origini coincidano per t = t’ = 0. Nel sistema O’: (ds’)2 = c2(dt’)2 – (dx’)2 = c2(t’)2 – x’2 2 Nel sistema O: ds2 = c2dt2 – dx2 = c2t2 – x2 = c2γ2 (t’ + x’ V2 ) + c – γ2 (x’ + Vt’)2 = ( ds’)2 avendo inserito in ds2 le espressioni per x e t dalle trasformazioni di Lorentz (cfr. par. 5.3). Vediamo ora com’è fatto questo spazio-tempo (cfr. fig. 5.15): la prima caratteristica è la retta – tratteggiata – a 45° che parte dall’origine. Questa rappresenta la linea di universo di un segnale in cui x = ct, quindi con v = x/t = c. La retta a 45° rappresenta un segnale che va alla velocità c: può essere solo un segnale luminoso (un’onda elettromagnetica nel vuoto) o gravitazionale (cfr. par. 6.7). Nello spazio al di sopra di questa retta avremo punti raggiungibili da O da segnali con velocità V < c, mentre nello spazio inferiore avremo punti che per essere raggiunti da O dovrebbero essere collegati da segnali di velocità V > c, che non possono esistere. Non può esistere, dunque, una relazione causale fra i punti in questa zona e l’origine: vedremo meglio in seguito.
teoria della relatività speciale
219
figura 5.15 Spazio-tempo di Minkowski a due dimensioni (x, ct) ct ctA
A V c xA = xB = xC
xA tA
; dividendo per c si ha
VOA c
=
1 , quindi: tan α c = da cui: α > 45° ⇒ tan α > 1 ⇒ VOA < c tan α =
La linea OC, un segnale luminoso, ha: VOC 1 1 = , da cui VOC = c = 1 tan 45° c xB La linea OB ha una velocità VOB = tB c , β < 45° ⇒ tan β < 1 ⇒ VOB > c VOB = tan β
B
ctB
O
xA
V=c C
ctC
α
La velocità di OA è VOA =
x
I punti della retta V = c, per esempio il punto C, possono essere raggiunti da un segnale che parte dall’origine O solo se questo segnale ha la velocità della luce. I punti al di sopra della retta V = c, per esempio A, possono essere raggiunti da segnali che partono dall’origine O con velocità V < c, quindi può esistere una relazione di causa-effetto fra O e A. I punti al di sotto della retta V = c, per esempio B, potrebbero essere raggiunti da segnali partenti dall’origine O solo se avessero una velocità maggiore di quella della luce, che non può esistere. Fra di loro, dunque, non può esistere una relazione di causa-effetto con O.
Per quanto riguarda le linee di universo possibili nel grafico della fig. 5.15: 1. OA può essere una linea di universo cha passa per O, perché v(OA) < c. In formule: ctA = xA tan α, quindi xA/ctA = vA/c = 1/tan α < 1, cioè vA < c; 2. OB non può essere una linea di universo, perché v(OB) > c. In formule: ctB = xB tan β, quindi xB/ctB = vB/c = 1/tan β >1, cioè vB > c, e nessun segnale può andare da O a B; 3. OC può essere una linea di universo, ma solo per segnali luminosi (fotoni) o gravitazionali (cfr. par. 6.7) perché v(OC) = c. In formule: ctC = xC tan 45°, quindi x/ctC = vC/c = 1/tan 45° = 1, cioè vC = c.
5.5.3. Il cono di luce Con l’espressione “cono di luce” si intende usualmente una parte della rappresentazione grafica dello spazio-tempo di Minkowski in cui si hanno due coordinate spaziali (x, y) e una temporale (ct). In questo caso
220
fisica per filosofi
figura 5.16 Il cono di luce tempo futuro
io
iano iperp te n prese
spaz
O
spa
zio
osservatore tempo passato
Vengono disegnate due coordinate spaziali, il piano orizzontale che contiene la x e la y, e la coordinata verticale, il tempo. L’osservatore si trova nell’origine O. Le linee di universo corrispondenti alla velocità della luce formano un cono centrato nell’origine che divide lo spazio in tre parti distinte: 1. il passato: la parte interna del cono al di sotto dell’origine O; nel passato di O si trovano tutti gli eventi che possono aver avuto una relazione di causa-effetto con l’osservatore: è il passato assoluto; 2. il futuro: nella parte interna al cono al di sopra dell’origine O si trovano gli eventi che potranno avere una relazione di causa-effetto con l’osservatore in O: è il futuro assoluto; 3. quella esterna al cono: in questa zona sono presenti eventi che non possono avere una relazione di causa-effetto con l’osservatore in O; rappresentano il cosiddetto “altrove”.
si può ancora fare un disegno bidimensionale (il foglio), rendendo in prospettiva uno spazio tridimensionale. Nella fig. 5.16 si può vedere uno schema del cono di luce che separa tutto lo spazio in tre zone: il passato assoluto, il futuro assoluto e l’altrove. La superficie conica è caratterizzata dall’avere una distanza spaziotemporale con l’origine ds2 = 0, il passato e il futuro assoluti avranno un ds2 < 0, mentre l’altrove avrà un ds2 > 0.
5.5.4. Problemi di causalità Il fatto che spazi e tempi siano relativi può portare ad alcune stranezze che possono apparire illogiche o impossibili: l’indeterminazione dell’ordine temporale con cui avvengono alcuni eventi.
teoria della relatività speciale
221
figura 5.17 Grafico di due eventi istantanei, cioè di durata trascurabile, (1, 2) che avvengono in posti e istanti diversi visti da due sistemi di riferimento, uno in moto rispetto all’altro (S, S’) ct
ct’
S’(x’, ct’)
c
S(x, ct)
t1 < t2 ma t’1 > t’2
t2 t1
2 1 t’ 1
x’
t’2 O
x
Si vede che nel sistema S: t1 < t2, quindi l’evento 1 avviene prima del 2, mentre nel sistema S’ si ha t’2 < t’1, perciò un osservatore in S’ vede avvenire prima l’evento 2 e poi l’1. Se si suppone che ci sia un rapporto di causa-effetto fra l’evento 1 e il 2 si avrebbe un paradosso. In un sistema di riferimento un osservatore potrebbe vedere l’effetto prima della causa. Ma questo, fortunatamente, non può accadere (cfr. fig. 5.18).
Vediamolo graficamente: nella fig. 5.17 abbiamo disegnato due griglie spazio-temporali, una per il sistema (O, x, ct) e una per il sistema (O’, x’, ct’) che si muove con velocità V rispetto a O. Consideriamo ora due eventi: l’evento 1 e l’evento 2 che avvengono in luoghi diversi e in tempi diversi. Si può vedere come la distorsione degli assi spazio-temporali porta al fatto che nel sistema O abbiamo t1 < t2, quindi l’evento 1 precede l’evento 2, mentre nel sistema O’ abbiamo t2 < t1. Questo potrebbe sembrare assurdo: supponiamo che l’evento 1 fosse una persona A che spara a una persona B, e l’evento 2 la persona B che muore avendo ricevuto la pallottola. Secondo quello che abbiamo detto potremmo trovare un sistema di riferimento in cui prima A spara e poi B muore, e un altro sistema in cui prima B muore e poi A spara: no, le cose non possono andare così. Vediamolo graficamente aiutandoci con i diagrammi spazio-temporali.
222
fisica per filosofi
figura 5.18 Soluzione grafica al problema di causalità esposto nella fig. 5.17 S(O, x, ct)
ct’
ct
S’(O’, x’, ct’)
c
2 t2 t1
1 x’
t’1 t’2
O = O’
x
Abbiamo ridisegnato i due eventi 1 e 2 e i due sistemi di riferimento: il sistema (O, x, y, ct) e il sistema (O’, x’, y’, ct’) in moto rispetto al primo. Abbiamo poi disegnato i due coni di luce relativi all’evento 1 e all’evento 2 (linee continue più spesse a 45°). Si vede chiaramente che ogni evento si trova nell’altrove dell’altro: non può esserci, quindi, nessuna relazione di causa-effetto fra i due. Nell’altrove l’ordine temporale non è definito, ma questo non provoca nessun paradosso. Le zone ombreggiate, invece, sono le zone in comune a possibili eventi nel futuro o nel passato dei due eventi di partenza; fra questi potrebbero esserci o esserci state relazioni di causa-effetto.
La soluzione al problema si trova osservando la fig. 5.18, in cui si vede che ognuno dei due eventi 1 e 2 si trova al di fuori del cono di luce dell’altro, quindi nell’altrove dell’altro. In questa zona non può esserci nessuna relazione di causa-effetto e, dunque, l’ordine temporale è ininfluente. Nota. Gli eventi che si trovano nel nostro “altrove” non possono avere una relazione di causa-effetto con noi ora: questo perché una relazione richiederebbe
teoria della relatività speciale
223
una velocità maggiore di quella della luce, il che non è possibile. Essi possono essere visti nel nostro passato o nel nostro futuro a seconda di chi osserva.
Nello spazio-tempo einsteiniano l’ordine degli eventi non è più determinato in maniera assoluta (come era in meccanica classica) ma dipende dal sistema di riferimento. Le interazioni tra i corpi, secondo la relatività, avvengono alla velocità della luce, e non istantaneamente, come previsto dalla meccanica classica. Perciò un evento ha bisogno di un certo tempo per entrare in relazione con un altro. L’ordine temporale degli eventi, osservati in un determinato sistema di riferimento, dipende, perciò, anche dalla loro distanza. Einstein, dunque, ridefinisce il concetto di simultaneità degli eventi. Due eventi possono risultare simultanei per un osservatore in un determinato sistema di riferimento e non simultanei per un altro che si trovi in un sistema di riferimento differente rispetto al primo. 5.5.5. Il paradosso dei gemelli Il cosiddetto “paradosso dei gemelli” è un esperimento mentale che sembra rivelare una contraddizione nella teoria della relatività speciale. Tale contraddizione, in ultima analisi, risulta inesistente. Ecco come viene usualmente posto il problema (cfr. fig. 5.19). Un uomo e una donna sono due gemelli che, di conseguenza, hanno la stessa età. L’uomo sta sulla Terra, e supponiamo che quest’ultima sia ferma. La donna parte per un viaggio nello spazio con velocità rispetto all’uomo tale che γ = 10, e torna dopo un tempo τ0 di un anno, sul suo orologio. Per l’uomo il tempo passato è τ = γ ∙ τ0, che corrisponde a dieci anni. Quindi, l’uomo ha dieci anni di più di quanti ne avesse alla partenza, mentre la donna ne ha solo uno di più. Ma nel sistema di riferimento della donna è l’uomo che ha fatto il viaggio con velocità γ, quindi la donna dovrebbe vedere il tempo dell’uomo dilatato di γ: dovrebbe essere lei, dunque, a essere dieci anni più vecchia di lui. Chi dei due sarà più vecchio alla fine del viaggio? Soluzione del paradosso I due sistemi non sono equivalenti. L’uomo sta fermo: è un sistema inerziale; la donna, invece, in almeno tre punti (partenza, inversione della velocità, arrivo) cambia la sua velocità, perciò il suo non è un sistema inerziale e non possiamo scrivere le relazioni
224
fisica per filosofi
figura 5.19 Paradosso dei gemelli
γ
τ0 = 1 anno (orologio della donna); γ (donna rispetto all’uomo) = 10 ⇒τ (orologio dell’uomo) = γ ∙ τ0 = 10 anni t0
τ = γ τ0 L’uomo resta sulla Terra, mentre il gemello donna fa un viaggio a velocità tale che γ = 10, rispetto all’uomo. Se il viaggio della donna dura un tempo τ0 pari a un anno, quando torna sulla Terra per l’uomo è passato un tempo τ = γ ∙ τ0, cioè dieci anni.
relativistiche che valgono solo nei sistemi inerziali, quindi con accelerazione nulla. Quello che succede nella realtà è che alla fine è l’uomo a essere più vecchio. L’effetto è stato misurato utilizzando satelliti e aerei molto veloci: le misure confermano le previsioni della teoria della relatività.
5.6. La velocità della luce nel vuoto: è veramente la massima possibile, ma non raggiungibile, per un corpo di massa diversa da zero? Nei paragrafi precedenti abbiamo stabilito che non è possibile arrivare a una velocità maggiore di quella della luce nel vuoto (c), sommando le velocità (cfr. par. 5.4.1). Ma potrebbe essere possibile accelerare un corpo di massa m a una velocità maggiore di quella della luce. Basterebbe fornirgli abbastanza energia. Questo esperimento è stato fatto: ecco come.
teoria della relatività speciale
225
figura 5.20 Grafico delle misure del quadrato della velocità degli elettroni (v2) in verticale, in funzione della loro energia cinetica 16 v2 = 2Ec/m
v2 in unità di 1020 cm2/s2
14 12
c2
10 8 6 4 2 0
0,5
1,0
1,5
2,0
2,5
3,0
3,5
4,0
4,5
Ec in MeV La meccanica classica prevede una relazione lineare fra v2 ed Ec: è la retta inclinata. I circoletti sono i punti sperimentali. Si vede come la meccanica classica non sia rispettata; appare chiaro, invece, che, mentre l’energia degli elettroni aumenta, la loro velocità non supera mai il valore di c. Fonte: adattata da Bertozzi (1964).
1. Facciamo passare degli elettroni attraverso una differenza di potenziale ∆V: gli elettroni acquisteranno un’energia cinetica Ec = (1/2)mv2 = q ∆V, dove q e m sono rispettivamente la carica e la massa dell’elettrone, e v la sua velocità rispetto al sistema di riferimento del laboratorio. 2. Poi facciamo passare gli elettroni attraverso una zona senza nessun campo elettrico o magnetico, dove, quindi, non ci saranno forze su di loro, e ne misuriamo la velocità v. 3. A questo punto li mandiamo contro un pezzo di alluminio. Gli elettroni si fermeranno cedendo tutta la loro energia cinetica all’alluminio, che si riscalderà aumentando la sua temperatura di un certo ∆T. Da questo aumento di temperatura potremo misurare l’energia cinetica che 1 1 mv2 – 0 = mv2 = CΔT avevano degli elettroni; infatti: ΔEc = 2 2 dove C è la capacità termica del pezzo di alluminio.
226
fisica per filosofi
Dall’esperimento, pertanto, variando la differenza di potenziale ∆V applicata agli elettroni, possiamo misurare delle coppie di valori: velocità, energia. Queste due grandezze, secondo la teoria della meccanica classica, dovrebbero essere legate dalla relazione Ec = (1/2)mv2, perciò facendo un grafico della velocità al quadrato e dell’energia cinetica dovremmo avere: v2 = 2Ec/m = kE. Quindi, il grafico di v2 in funzione di Ec dovrebbe essere una retta di coefficiente angolare k = 2/m. Non è così: nella fig. 5.20 si può vedere il risultato di una tipica misura (cfr. Bertozzi, 1964). La velocità dell’elettrone, dunque, non aumenta mai oltre la velocità della luce nel vuoto, in realtà non ci arriva neppure, ma ci va molto vicino. D’altronde la sua energia aumenta, e quindi? Lo vedremo nel paragrafo successivo.
5.7. E = mc2 Finora si è parlato di spazio e di tempo, ma cosa succede alla massa di un corpo? Come influisce la relatività sulla massa? Nel settembre 1905 Einstein pubblica un altro articolo: L’inerzia di un corpo dipende dal suo contenuto di energia? In questo articolo Einstein fa semplicemente un calcolo: I risultati della precedente ricerca [Sull’elettrodinamica dei corpi in movimento] conducono a una conclusione molto interessante che viene ricavata in quanto segue: […] Se un corpo perde l’energia ∆E sotto forma di radiazioni, la sua massa diminuisce di ∆E/c². Il fatto che l’energia sottratta al corpo diventi energia di radiazione non fa alcuna differenza, perciò siamo portati alla più generale conclusione che la massa di qualunque corpo è la misura del suo contenuto di energia; se l’energia varia di ∆E, la massa varia nello stesso senso di ∆E/9 ∙ 1020, misurando l’energia in erg e la massa in grammi. Non è impossibile che nei corpi nei quali il contenuto in energia sia variabile in sommo grado (per esempio nei sali di radio) la teoria possa essere sperimentata con successo (Einstein, 1905a , p. 641, corsivo mio)7.
Quindi: ∆m = ∆E/c², ovvero, ∆E = ∆m ∙ c2 o: E = mc2 Stiamo qui parlando della massa “inerziale”, quella che appare nel secondo principio della dinamica (F = m ∙ a), la grandezza legata alla quantità di “materia” di un corpo. Cosa vuol dire, e come si inserisce questa relazione nell’ambito della relatività? Abbiamo visto che le lunghezze e gli intervalli di tempo dipendono dal sistema di riferimento, cioè dalla velocità di chi li osserva
teoria della relatività speciale
227
rispetto agli oggetti stessi. Ma la massa? Cosa vuol dire che «la massa […] è la misura del […] contenuto di energia» di un corpo? Va fatta una precisazione. Nel suo articolo Einstein assume che si stia parlando della massa e dell’energia misurate in un sistema di riferimento in cui il corpo è fermo. Quindi, non si considera la parte di energia legata alla velocità del corpo, che dipende dal sistema di riferimento da cui si osserva il corpo (anche in meccanica classica la velocità dipende dal sistema di riferimento). Ci sono due modi di affrontare la questione. Quello utilizzato da alcuni libri di testo assume semplicemente che l’energia legata alla massa, se in movimento, vada scritta così: E ≡ m0c2γ e, dato che c è una costante, sarà la massa a essere relativa al sistema rispetto a cui la misuriamo; il suo valore dipenderà, quindi, dal fattore γ (come il tempo): m(v) = γ ∙ m0 ≥ m0, in cui m0 è la cosiddetta “massa a riposo”, quella misurata nel sistema di riferimento in cui il corpo è in quiete. Questo modo di descrivere il fenomeno, anche se formalmente corretto, pone dei problemi di coerenza e di definizione delle grandezze relativistiche, il fatto di avere una massa “variabile” non è agevole dal punto di vista concettuale e operativo. La visione moderna è questa: 1. la massa di un corpo m (misurata a riposo) è un invariante per trasformazioni di Lorentz. Pertanto, non si distingue più fra m e m0. Per “massa” si intende quella misurata a riposo, scritta come m; 2. la quantità di moto relativistica viene definita così: ˉp ≝ γmv ˉ. Con questa definizione la grandezza “quantità di moto” relativistica, per un sistema isolato, si conserva; 3. esiste una combinazione dell’energia e della quantità di moto: E2 – p2c2 = m2c4 che, essendo uguale a m2c4, è invariante per trasformazioni di Lorentz. Quindi l’Energia può essere scritta come: E = m2c4 + p2c2 , espressione che coincide con quella dell’articolo di Einstein. Se v = 0: E (v = 0) = m2c4 = mc2 L’aumento dell’energia con la velocità del sistema, pur mantenendosi la velocità inferiore alla velocita della luce, deriva dalla costante γ che interviene nella quantità di moto p.
228
fisica per filosofi
Analizziamo ora i casi di velocità molto inferiori e vicine a quella della luce. 1. Energia di un corpo in movimento se v 1): γv 2 γv E = m2c4 + p2c2 = mc2 1 + ( c ) ≅ mc2 ∙ c = mvcγ Dall’aumento dell’energia di un corpo di massa m con la velocità, che non è proporzionale a v2 come in meccanica classica, ma tende a infinito
teoria della relatività speciale
229
per v che tende a c, deriva in modo naturale che un corpo con una massa diversa da zero non può mai arrivare alla velocità della luce. Se abbiamo un corpo e vogliamo “accelerarlo”, cioè aumentare la sua velocità, dobbiamo fornirgli un’energia proporzionale alla sua massa, alla sua velocità e al fattore γ. Quando il corpo accelera, la sua velocità aumenta, il fattore γ diventa sempre più grande e alla velocità della luce sarebbe infinito. Sarebbe infinita, quindi, l’energia necessaria per accelerare il corpo fino a c, perciò non ce la faremmo mai, né noi, né nessun altro sistema fisico. Prima del 1905 esistevano due leggi (o principi) di conservazione ben distinte e separate: la legge di conservazione della massa, scoperta da Antoine-Laurent de Lavoisier, e la legge di conservazione dell’energia (primo principio della termodinamica), alla cui scoperta hanno contribuito, nella seconda metà dell’Ottocento, diversi scienziati ( James P. Joule e i già citati Carnot, Thomson, Clausius e Faraday): “nulla si crea e nulla si distrugge, ma tutto si trasforma”. Einstein ha unificato le due leggi in un unico principio di conservazione, che coinvolge tutti i processi fisici di trasformazione della massa in energia e viceversa, dato che l’una può trasformarsi nell’altra secondo una relazione precisa. Ciò che resta costante in un sistema isolato (nell’universo) è la somma della massa-energia.
5.8. Nota conclusiva sulla relatività speciale Vogliamo concludere questo capitolo con alcune note con cui mettere dei punti fermi a quanto scritto finora. 5.8.1. Che fine hanno fatto le asimmetrie magneti/spire? Ricordiamo il problema già discusso nel par. 5.1.2 e riguardiamo la fig. 5.3. Il punto critico era che i due osservatori – Alice e Bob – avrebbero dovuto utilizzare due formule diverse per calcolare la corrente elettrica i che circolava nella spira quando ci fosse stato un moto con velocità costante del magnete rispetto alla spira (e viceversa). Alice attribuiva l’origine della corrente i a un campo elettrico causato dall’interazione fra cariche in movimento e campo magnetico, mentre Bob attribuiva l’origine della stessa corrente a una variazione del flusso del campo magnetico B. Avevamo, quindi, due sistemi inerziali non equivalenti: per
230
fisica per filosofi
ognuno dovevamo utilizzare formule diverse per giustificare lo stesso fenomeno. Questo era un problema. Sembrava che la relatività galileiana non si potesse applicare. Il problema si risolve notando che Bob vede (misura) un campo magnetico in movimento; ma per la fisica classica un campo elettromagnetico in moto viene visto come lo stesso campo a riposo. La teoria della relatività speciale, invece, prevede che anche i campi elettromagnetici (E, B) abbiano le loro trasformazioni quando vengono visti da un sistema in moto rispetto a loro. Queste trasformazioni non sono per nulla ovvie né intuitive. Ecco come si trasformano due campi B’ ed E’, misurati a riposo nel sistema O’, quando vengono misurati da un sistema di riferimento O in moto con velocità costante ± Vx rispetto a O’ (i suffissi x, y, z indicano le componenti dei relativi campi): Ey, z = γ[E’y, z ± VxB’z, y] Quindi, per esempio, il campo B'z, in movimento, viene visto anche come un campo elettrico Ey a riposo. E ancora, il campo E’z, in movimento, viene visto anche come un campo magnetico By a riposo. V Bγ,z = γ B’y, z ∓ c2x E’z , y
[
]
Questi effetti sono sensibili anche se si considerano velocità V molto piccole rispetto alla velocità della luce, se, cioè, γ ≅ 1. La particolarità delle trasformazioni relativistiche dei campi elettromagnetici rispetto a quelle relative alle grandezze meccaniche è questa: le grandezze meccaniche, viste da un sistema di riferimento in moto, cambiano il loro valore tramite la costante γ. Ma le varie grandezze non cambiano “tipo”: le lunghezze vengono viste sempre come lunghezze, i tempi come tempi e così via. I campi elettromagnetici, invece, diventano una grandezza diversa, mantenendo la dipendenza dal fattore γ. Inoltre, si ha anche un cambio di 90° della direzione del vettore iniziale. Un campo B’z, ossia un campo B’ con la sola componente z, viene visto da un sistema che si muove con velocità Vx rispetto a B’, come un campo elettrico Ey = γVxBz! Dunque, non solo il campo B “diventa” un campo E, ma la direzione della grandezza da z diventa y, e questa trasformazione vale anche
teoria della relatività speciale
231
se γ ≅ 1, quindi per velocità piccole. Ecco perché il problema delle grandezze elettromagnetiche veniva visto anche in sistemi con velocità piccole rispetto alla velocità della luce (la spira o il magnete). Il problema di Alice e Bob, delle spire e dei magneti, sparisce. In realtà il campo magnetico in movimento visto da Bob diventa un campo elettrico, guarda caso lo stesso utilizzato da Alice per il suo calcolo. Le due formule, che sembravano diverse, una volta applicate correttamente le trasformazioni relativistiche, sono la stessa formula. E la relatività è salva: le leggi della fisica sono le medesime in tutti i sistemi inerziali, si parli di meccanica, di termodinamica o di elettromagnetismo.
5.8.2. Grandezze invarianti Sembra che tutto sia relativo… È vero, ma ci sono molte grandezze invarianti in tutti i sistemi inerziali, oppure che sono una caratteristica intrinseca del corpo se misurate in un sistema in cui il corpo è a riposo. Ecco un elenco (parziale: quello completo è molto più esteso) di alcune grandezze invarianti per trasformazioni di Lorentz: 1. la velocità della luce nel vuoto c: è una costante universale, c = 299 792 458 m/s (esatta); 2. l’intervallo spazio-temporale: ds2 = c2dt2 – (dx2 + dy2 + dz2), che sostituisce l’invarianza delle lunghezze e dei tempi in fisica classica; 3. la combinazione energia-quantità di moto: E2 – p2c2 = m2c4; 4. la carica elettrica Q. Mentre di seguito un elenco di grandezze di cui possiamo dare un valore definito in un sistema di riferimento a riposo: 1. la lunghezza propria L0 di un oggetto: la lunghezza di un oggetto misurato in un sistema in cui l’oggetto è a riposo è L0 ed è la massima lunghezza fra tutte quelle che qualunque osservatore può misurare; 2. la durata t0 di un evento, il tempo proprio: la durata di un evento misurata in un sistema in cui l’evento è a riposo è t0 ed è la minima durata fra tutte quelle che qualunque osservatore può misurare; 3. la massa m, talvolta chiamata massa a riposo; 4. l’energia E associata a una massa m a riposo: E = mc2.
232
fisica per filosofi
5.8.3. Fotoni in un campo gravitazionale Per concludere questo capitolo vogliamo anticipare un commento che coinvolge il fotone. Un oggetto “scoperto” negli stessi anni in cui veniva scritta la teoria della relatività (Planck, 1900; Einstein, 1905b) e che viene descritto in modo completo dalla meccanica quantistica. Cosa succede a un fotone in un campo gravitazionale, per esempio sulla Terra? Il fotone ha massa nulla; dalle formule della relatività speciale si ha: E2 = m2c4 + p2c2. Per il fotone m = 0, perciò E = pc, ma è anche E = hf (cfr. par. 7.1.3), da cui si ha: p = hf/c, quindi un fotone, pur avendo una massa nulla, possiede una quantità di moto diversa da zero. Un fotone, in un campo gravitazionale, si comporta come se avesse una massa gravitazionale equivalente alla sua energia E: p hf E mG = c = c2 = c2 Un fotone di frequenza f che “cade” sulla Terra per un’altezza z, acquisterà un’energia E = mG gz come se fosse una massa che cade da un’altezza z in un campo gravitazionale g (supposto costante); possiamo scrivere, allora, la conservazione dell’energia: ∆E(0, z) = mG gz ; E(0) – E(z) = mG gz Se questa energia acquistata ∆E è piccola rispetto a quella iniziale la sua frequenza cambierà secondo la relazione: E(0) = E(z) + mG gz → hf (0) ≅ hf (z) +
hf (z) c2 gz
gz da cui: f (0) ≅ f (z) (1 + c2 ) Quindi il fotone “cadendo” aumenta la sua frequenza, cioè diventa più “blu”, se prima era “rosso”. Le misure hanno confermato il calcolo (cfr. Pound, Rebka, 1960; Kittel, Knight, Ruderman, 1970).
teoria della relatività speciale
233
Percorso storico-filosofico 6. Tempo assoluto, tempo relativo, tempo soggettivo Come nel caso dello spazio, anche il tempo costituisce una delle grandezze fondamentali della meccanica e, pertanto, ha un posto di primo piano nell’edificio dei Principi matematici della filosofia naturale di Newton. Analogamente al caso dello spazio, Newton sostiene la necessità di distinguere un tempo relativo e un tempo assoluto per giustificare la misura della durata dei fenomeni naturali. Il tempo relativo è quello definito in riferimento a determinati fenomeni naturali, come il sorgere del Sole che scandisce gli intervalli tra i giorni. Il tempo assoluto, invece, scorre indipendentemente da qualsiasi fenomeno e costituisce il termine di riferimento ultimo per la misura matematica del tempo. Ecco come lo descrive Newton: Il tempo assoluto, vero, matematico, in sé e per sua natura senza relazione ad alcunché di esterno, scorre uniformemente, e con altro nome è chiamato durata; quello relativo, apparente e volgare, è una misura (accurata oppure approssimativa) sensibile ed esterna della durata per mezzo del moto, che comunemente viene impiegata al posto del vero tempo: tali sono l’ora, il giorno, il mese, l’anno (Newton, 1965, pp. 101-2).
Con la teoria della relatività speciale il concetto newtoniano di tempo assoluto viene escluso dalla meccanica. La nuova teoria è introdotta da un esperimento mentale sulla sincronizzazione degli orologi mediante segnali luminosi, da cui risulta che la simultaneità degli eventi è una nozione relativa al sistema di riferimento. Nella nuova meccanica relativistica, pertanto, non esiste un’unica “linea” del tempo valida in assoluto e per tutti i luoghi dello spazio. Come abbiamo visto, l’ordinamento spazio-temporale rispetto a un dato evento O risulta definito dal cono di luce, che delimita tre regioni: passato assoluto, presente assoluto e una regione (che abbiamo chiamato “altrove”) il cui rapporto temporale con l’evento O dipende dal sistema di riferimento dell’osservatore. Rispetto a questa formulazione matematica i filosofi hanno fin dall’inizio provato a interpretare il rapporto tra tempo e realtà della nuova fisica. Per alcuni, la relatività della simultaneità a seconda degli osservatori implica che la realtà non esiste soltanto nel presente. Infatti, come abbiamo appena ricordato, certi eventi che da un osservatore sono percepiti come successivi possono essere considerati simultanei da un al-
234
fisica per filosofi
tro osservatore. Dunque, secondo questi filosofi, la teoria favorirebbe il cosiddetto “eternalismo”, in base al quale non esistono differenze vere e proprie tra passato, presente e futuro, e ogni istante dello spazio-tempo sarebbe reale come gli altri. Lo stesso Einstein sostenne questa tesi: Per noi che crediamo nella fisica, la differenza tra passato, presente e futuro ha solo il significato di un’illusione, per quanto tenace (Einstein, 1995, p. 459).
Per i sostenitori di tale interpretazione, questo è il solo modo per giustificare fatti paradossali come la dipendenza del tempo dal percorso fatto dagli osservatori. Per usare un’immagine del fisico Brian Greene (2004, p. 159), l’universo sarebbe come un enorme filone di pane che può essere affettato in molti modi a seconda della scelta degli osservatori, ma ciò che esiste è l’intero filone, non le singole fette. Altri interpreti sostengono che si può definire un presente relativistico, capace di accordarsi meglio con quello del senso comune, proponendo diverse definizioni di questo presente. Un tratto comune di tali concezioni è definire il presente come localizzato intorno all’osservatore, per esempio come un punto o come una regione estesa di spazio-tempo definita mediante la possibilità dell’osservatore di interagire con altri eventi. È importante sottolineare che tutte le posizioni fin qui richiamate, per quanto diverse, fanno uso della fisica relativistica per trarne un’interpretazione oggettiva della nostra esperienza temporale e non intendono ridurre il presente a un fatto puramente mentale9. Rispetto a quest’ultimo aspetto diversi filosofi fanno valere un approccio diverso. Henri Bergson, nel Saggio sui dati immediati della coscienza (1899), sostiene che vi sia una differenza fondamentale tra il tempo della scienza e il tempo della coscienza: il primo sarebbe una misura matematica riferita alle cose esterne, mentre il secondo sarebbe il tempo vissuto, il solo che definisce la durata. Per Bergson, in effetti, è soltanto nella coscienza che si danno le condizioni per fare esperienza dello scorrimento del tempo, mentre il tempo oggettivo non è che una proiezione fatta a partire da questo tempo più fondamentale: «al di fuori di me, nello spazio, vi è un’unica posizione della lancetta e del pendolo, in quanto non resta nulla delle posizioni passate». Quindi il tempo vero e proprio, inteso come durata, per Bergson non esiste nella materia, che è «esteriorità reciproca senza successione» (Bergson, 2001, p. 71). Per Bergson il tempo della coscienza possiede una continuità qualitativa, cioè è caratterizzato da una «successione di stati qualitativi che
teoria della relatività speciale
235
si fondono, si penetrano, senza contorni precisi» (ivi, p. 68). Per spiegare l’unità nella variazione che caratterizza la durata, Bergson utilizza l’esempio della melodia: i diversi stati psicologici che si fondono nella durata danno origine a un fenomeno unitario così come le diverse note successive danno origine a una melodia ininterrotta. La melodia è un’unità che non è riducibile alla somma delle sue note, è qualcosa di qualitativamente diverso. Allo stesso modo la durata può essere scomposta in stati successivi, ma questa operazione analitica non rende conto della sua unità qualitativa. Da questa scomposizione ha origine l’idea del tempo misurabile, che pertanto nasce da una “proiezione” del tempo interiore sugli oggetti materiali. Bergson rivolge queste obiezioni anche contro la relatività di Einstein, contestando la procedura di definire il tempo mediante gli orologi: la stessa nozione di simultaneità degli orologi presupporrebbe, infatti, una comprensione più fondamentale del tempo. Negando questa precondizione della teoria fisica, Einstein sosterrebbe una concezione del mondo in cui non c’è spazio per il futuro indeterminato e la libertà umana. In un celebre incontro del 1922, Einstein replicò che «non esiste un tempo dei filosofi» più fondamentale di quello della scienza, ma solo «un tempo psicologico diverso da quello del fisico» (La Théorie de la relativité: séance du 6 avril 1922, in “Bulletin de la Société française de philosophie”, 22, 1922, 3). Posizioni simili a quella di Bergson sono sostenute negli stessi anni da Edmund Husserl nelle sue Lezioni sulla fenomenologia della coscienza interna del tempo (1904). Per Husserl il tempo fenomenologico – quello esperito dalla coscienza – è il tempo fondamentale, che nessuna teoria fisica può contraddire. Il tempo obiettivo della scienza, invece, è un tempo derivato, costruito a partire dall’evidenza originaria del tempo fenomenologico. Tra le caratteristiche di quest’ultimo vi è il fatto che il presente non si riduce mai a un istante puntuale, ma possiede un’estensione, in cui si sovrappongono la memoria del presene appena trascorso (ritenzione) e l’anticipazione del futuro imminente (protensione). Il presente, dunque, è caratterizzato da una triplice qualità temporale. Questa peculiarità del presente fenomenologico – osserva Husserl – era stata già intuita da Agostino nel libro xi delle Confessioni (398 circa), dove il filosofo affermava che vi sono, tutti interni al presente, un passato delle cose ricordate, il presente del vissuto e il futuro delle cose attese. Il riferimento ad Agostino è ribadito anche in altri luoghi dell’opera di Husserl, che ripete l’adagio noli foras ire (“non uscire da te stesso”) per
236
fisica per filosofi
sottolineare il primato dell’esperienza vissuta interiormente rispetto alle teorie scientifiche. Nella sua ultima opera, La crisi delle scienze europee e la fenomenologia trascendentale (1938), Husserl riconferma l’esigenza di ristabilire il primato del “mondo della vita”, caratterizzato (tra le altre cose) dal tempo fenomenologico, rispetto alla matematizzazione del mondo operata delle scienze. Nei decenni successivi, come abbiamo visto (cfr. nota 9 e il capoverso corrispondente), le scienze cognitive proveranno a integrare in un unico quadro la prospettiva della soggettività e quella della fisica. In ogni caso la compatibilità tra diversi concetti di tempo non esclude l’irriducibilità dell’uno all’altro, quale era stata fatta valere da filosofi come Bergson e Husserl.
6 Teoria della relatività generale La teoria esposta nel seguito costituisce l’estensione più vasta pensabile della teoria indicata in generale al giorno d’oggi come “teoria della relatività”. Einstein (1916, p. 769)
Le leggi generali della natura sono da esprimersi con equazioni che valgano per tutti i sistemi di coordinate […] [questo postulato] sottrae allo spazio e al tempo l’ultimo residuo di oggettività fisica. Einstein (1916, p. 776)
relatività generale Primo principio della relatività generale In un corpo la massa inerziale e la massa gravitazionale sono uguali. Secondo principio della relatività generale Le leggi della fisica devono essere di natura tale da valere rispetto a un sistema di riferimento in moto arbitrario.
6.1. Introduzione La relatività generale è, matematicamente, una teoria oltremodo complessa. Einstein stesso disse che era il problema più complicato che avesse mai affrontato. Impiegò circa dieci anni a sviluppare tutta la teoria, presentata all’Accademia prussiana delle scienze il 25 novembre 1915. L’articolo originale fu pubblicato qualche mese dopo (cfr. Einstein, 1916). Nelle pagine successive ne daremo una visione semplificata, soffermandoci in particolare sui problemi scientifici ed epistemologici da cui nacque, sugli effetti (alcuni dei quali aspettavano una spiegazione che le teorie precedenti non davano) e sugli aspetti che ci coinvolgono nella vita di tutti i giorni.
238
fisica per filosofi
Il punto chiave è questo: la meccanica classica, quella di Newton e di Galilei, ha dei grossi problemi, sia in ambito strettamente logico che nella descrizione quantitativa di alcuni fenomeni. E questa volta il moto relativo non c’entra, la soluzione non può derivare dalla relatività speciale. Ci deve essere qualcosa di nuovo. Questo qualcosa sarà l’effetto delle masse (e, quindi, dell’energia) sulla struttura dello spazio-tempo, che verrà nuovamente ridefinito, dopo la modifica fatta dalla relatività speciale. Il famoso articolo del 1916 inizia così: «La teoria esposta nel seguito costituisce l’estensione più vasta pensabile della teoria indicata in generale al giorno d’oggi come “teoria della relatività”» (ivi, p. 769). Si vede subito come questa volta Einstein voglia trovare una soluzione “definitiva” al problema della descrizione dello spazio, del tempo, della materia e dell’energia contenuta in essi. Nel paragrafo successivo verrà riportata in breve la struttura originale dell’articolo di Einstein riassumendo il contenuto concettuale dei vari paragrafi. Chi non volesse seguire questa descrizione può passare direttamente al par. 6.3 in cui presenteremo la descrizione dei principi che stanno alla base della teoria e delle principali conseguenze.
6.2. Struttura dell’articolo originale di Einstein del 1916 Come accennato, analizziamo qui l’articolo originale di Einstein (1916) passandone in rassegna i diversi paragrafi che lo compongono e che richiamiamo con la loro numerazione originaria. Paragrafo 1, Osservazioni sulla teoria della relatività speciale. La modificazione che la teoria dello spazio e del tempo ha subito a causa della teoria della relatività speciale è veramente profonda; ma un punto importante rimane intatto. Infatti anche secondo la teoria della relatività speciale le leggi della geometria si devono interpretare direttamente come le leggi sulle possibili posizioni relative di corpi rigidi (a riposo), più in generale le leggi della cinematica come leggi che descrivono il comportamento di regoli e orologi. A due punti materiali prefissati di un corpo (rigido) a riposo corrisponde perciò sempre un segmento di lunghezza completamente determinata, indipendente dalla posizione e dall’orientamento del corpo, come pure dal tempo; a due prefissate posizioni delle lancette dell’orologio rispetto a un sistema di riferimento (consentito) corrisponde sempre un intervallo temporale di lunghezza determinata,
teoria della relatività generale
239
indipendente dalla posizione e dal tempo. Si mostrerà subito che la teoria della relatività generale non può attenersi a questa semplice interpretazione fisica dello spazio e del tempo (ivi, p. 770).
In queste poche righe c’è l’essenza del problema e del modo in cui sarà affrontato: in relatività speciale era possibile definire per un oggetto (per un intervallo di tempo), la lunghezza a riposo L0 (la durata a riposo τ0). Esistevano, quindi, degli assoluti che definivano le grandezze spaziali e quelle temporali. Nella nuova teoria questo non sarà più possibile. Paragrafo 2, Sulle ragioni che raccomandano un’estensione del postulato della relatività. In questo paragrafo Einstein mostra come la meccanica classica e la relatività speciale contengano un difetto epistemologico e arriva ad affermare: «Le leggi della fisica devono essere di natura tale da valere rispetto a un sistema di riferimento in moto arbitrario» (ivi, p. 772). Ciò vuol dire che si dovrà abbandonare la richiesta che l’equivalenza delle leggi della fisica sia valida solo per sistemi inerziali. Si presenta e si discute l’esempio dell’ascensore (cfr. par. 6.3.2), e si chiarisce che qualunque teoria generale dovrà includere una teoria della gravitazione. Paragrafo 3, Il continuo spazio-temporale. Postulato della covarianza generale per le equazioni che devono esprimere le leggi naturali generali. Einstein chiarisce come vadano intesi lo spazio e il tempo nella vecchia teoria e in quella nuova: Nella meccanica classica e anche nella teoria della relatività speciale le coordinate dello spazio e del tempo hanno un significato fisico immediato […]. Quest’idea dello spazio e del tempo è sempre presente ai fisici, anche se per lo più in modo inconscio […] ma mostreremo ora che bisogna abbandonarla e sostituirla con una più generale (ivi, p. 773-4).
Einstein enuncia, quindi, il primo postulato della relatività generale (l’equivalenza di tutti i sistemi di riferimento nella descrizione delle leggi della natura), il cosiddetto “postulato della covarianza generale”1: «Le leggi generali della natura sono da esprimersi con equazioni che valgano per tutti i sistemi di coordinate» chiarendo perché questo postulato che «sottrae allo spazio e al tempo l’ultimo residuo di oggettività fisica» (ivi, p. 776) sia naturale (cosa che non è ovvia).
240
fisica per filosofi
Paragrafo 4, Relazione delle quattro coordinate con i risultati delle misure spaziali e temporali. Espressione analitica per il campo gravitazionale. Einstein enuncia la struttura che avrà lo spazio-tempo chiarendo che: La gravitazione, secondo la teoria della relatività generale, gioca pertanto un ruolo eccezionale rispetto alle altre forze, in particolare rispetto a quelle elettromagnetiche, poiché le 10 funzioni […] che rappresentano il campo gravitazionale determinano allo stesso tempo le proprietà metriche dello spazio misurabile tetradimensionale (ivi, p. 779).
Einstein esprime e chiarisce la caratteristica fondamentale della teoria: il fatto che il campo gravitazionale, che è generato dalle masse, agisce sulla struttura dello spazio-tempo, modificandone la metrica (la distanza fra i punti dello spazio-tempo). Paragrafi 5-20: qui Einstein presenta la descrizione matematica della nuova struttura dello spazio-tempo curvo e la teoria completa della relatività generale. Paragrafo 21, Teoria di Newton come prima approssimazione. Einstein mostra come, nel caso di un campo gravitazionale debole quale quello creato dal Sole a grande distanza da esso, o dalla Terra, o da tutti gli altri pianeti, le equazioni della relatività generale si riducano alla legge di gravitazione universale di Newton. Paragrafo 22, Comportamento dei regoli e degli orologi in campi gravitazionali statici. Curvatura dei raggi di luce. Moto del perielio delle orbite planetarie. Vengono calcolati gli effetti predetti nel paragrafo 1 sulle misure di spazi e di tempi, sulla curvatura della luce nei pressi del Sole, che verrà misurata da Arthur S. Eddington nel 1919, e sul perielio di Mercurio. È l’ultimo paragrafo dell’articolo sulla relatività generale, che si chiude con l’espressione della precessione dell’orbita di Mercurio calcolata secondo la relatività generale, e con queste parole: Il calcolo dà per il pianeta Mercurio una rotazione dell’orbita di 43” per secolo, che corrisponde esattamente alla constatazione degli astronomi (Leverrier); essi trovano infatti nel moto del perielio di questo pianeta un residuo della suddetta entità, non spiegabile con le perturbazioni dovute agli altri pianeti (ivi, p. 822).
Nei paragrafi successivi vedremo brevemente le linee generali che stanno alla base della teoria e i relativi sviluppi nella descrizione del nostro universo.
teoria della relatività generale
241
6.3. La gravità e altri problemi della meccanica classica La relatività speciale prevede che non possano esistere segnali che viaggiano a velocità maggiore di quella della luce. Ma esiste la forza di gravità, quella descritta dalla legge di gravitazione universale di Newton: mgM F = G r2 Questa è una relazione di uguaglianza fra le due quantità a sinistra e a destra dell’uguale. Ciò vuol dire che un osservatore potrebbe misurare la forza F su un corpo di massa mg, poi potrebbe calcolare la grandezza G(mgM)/r2 e, supponendo che non esistano altre forze oltre a quella gravitazionale che agiscono sul corpo di massa mg, dovrebbe riscontrare un’uguaglianza (tenuto conto dei margini di incertezza sperimentali) fra il valore misurato e quello calcolato. Immaginiamo ora di scrivere questa relazione per la Terra e per il Sole in un certo istante, e che la Terra si sposti un po’ muovendosi lungo la sua orbita. Essa sarà ora attratta con una forza diversa (in modulo e direzione): ma quando inizierà a “sentire” questa forza diversa? Istantaneamente? Secondo Newton, sì. La relazione dice che le due grandezze vanno misurate nello stesso istante. Questo, secondo la teoria della relatività speciale, non è possibile; i sistemi sono in movimento, ma in questo caso l’effetto è trascurabile. Il fatto è che la Terra “sente” qualunque cambiamento del Sole con almeno 8 minuti di ritardo; infatti, se l’effetto che subisce è causato dal Sole, allora questo effetto, che è un segnale, non può viaggiare a una velocità maggiore di quella della luce, che appunto impiega circa 8 minuti ad andare dal Sole alla Terra. Quella formula, così com’è scritta, non va bene, va modificata o cambiata integralmente. Vi sono anche altri fenomeni che non trovano spiegazione dalla meccanica classica: la precessione del perielio dell’orbita di Mercurio, per esempio. L’orbita con cui Mercurio ruota intorno al Sole è un’ellisse, ma questa ellisse non è “ferma” in un sistema di riferimento solidale con il Sole; il piano di rotazione e, dunque, il suo asse ruotano leggermente nel tempo, compiendo un piccolo cono intorno all’asse medio di rotazione. Questo fenomeno, chiamato precessione, era stato misurato con grande accuratezza: le misure erano molto precise2, ma nessuna teoria poteva giustificare interamente i valori determinati. Anche tenendo conto di tutte le interazioni con gli altri pianeti, le osservazioni fatte erano in disaccordo con i calcoli eseguiti utilizzando la forza gravitazionale. La mi-
242
fisica per filosofi
sura della precessione dell’asse di Mercurio forniva un valore di 5 600”/ secolo, mentre il calcolo dell’interazione con gli altri pianeti forniva 5 557”/secolo, una differenza di 43”/secolo, piccola ma rivelabile, e in ogni caso molto minore dell’incertezza della misura. Sembrava che molti problemi nascessero quando c’era di mezzo la forza di gravità. È questo il punto da cui Einstein parte per rianalizzare, ancora una volta dopo le modifiche introdotte nella relatività speciale, il concetto di spazio e di tempo. 6.3.1. Equivalenza fra la massa inerziale e la massa gravitazionale Dell’equivalenza fra massa inerziale e massa gravitazionale si è già accennato nel par. 2.7. Ora approfondiremo il problema. La legge che descrive la dinamica dei corpi in movimento è la seconda legge della dinamica: F = mi ∙ a, dove mi viene chiamata massa inerziale. La legge che descrive la forza gravitazionale è la legge di gravitazione universale di Newton: mgM F = G r2 , dove mg viene chiamata massa gravitazionale. Galilei nel 1638 afferma che queste due grandezze (mi, mg) sono uguali: «se si levasse totalmente la resistenza del mezzo, tutte le materie discenderebbero con eguali velocità» (Galilei, 1933b, p. 116); e lo prova con alcuni esperimenti (non molto precisi). Qualche anno dopo anche Newton ribadisce la cosa3. Altri scienziati ripetono la misura nel corso dei secoli. A oggi mi e mg sono risultate uguali entro una parte su 1014, ma si tratta sempre di un’uguaglianza sperimentale. In linea di principio potrebbero differire molto meno di quanto sia possibile apprezzare sperimentalmente. Einstein nel 1916 fa qualcosa di più e di diverso: crea una nuova teoria della gravitazione in cui il punto di partenza è il principio dell’equivalenza fra massa inerziale e massa gravitazionale. Perché? Tutto parte da un altro Gedankenexperiment, un “esperimento mentale”4. Einstein suppone di trovarsi in un ascensore, in varie condizioni, e si chiede cosa osserverebbe una persona che si trovasse dentro l’ascensore, senza poter vedere fuori (concettualmente è qualcosa di molto simile all’esperimento mentale di Galilei in cui l’autore immagina
teoria della relatività generale
243
di trovarsi nella stiva di una nave che si muove con velocità costante nell’acqua, facendo una serie di prove e osservazioni da cui deduce di non potersi accorgere se la nave stia ferma o no rispetto alla Terra). Ma prima vediamo come si scrive la seconda legge della dinamica per un sistema di riferimento accelerato, quindi non inerziale. 6.3.2. La seconda legge della dinamica in sistemi non inerziali e l’esperimento mentale dell’ascensore – La seconda legge della dinamica viene scritta usualmente così: F = m ∙ ā, – dove F è la forza risultante che agisce sul corpo di massa m, mentre ā è la sua accelerazione; entrambe le grandezze sono misurate in un sistema inerziale, un sistema che si muove, quindi, con velocità costante rispetto a un altro sistema inerziale (abbiamo discusso dove finisce la “catena” dei sistemi inerziali nel par. 2.2.3). Cosa succede se ci troviamo in un sistema non inerziale? Possiamo scrivere qualcosa di analogo? La risposta è sì. Si può procedere come segue: supponiamo che il sistema di riferimento non inerziale si muova con accelerazione ā0. In questo caso la seconda legge della dinamica può essere scritta così: – F (totale sentita dalla massa che accelera con accelerazione ā) = – = F e – mā0 = mā Ciò vuol dire che, anche in assenza di forze esterne (quindi con – – F e = 0) il corpo di massa m sentirà una forza F = – mā0, una forza, cioè, in direzione contraria all’accelerazione del corpo e, dunque, del sistema di riferimento in cui si trova. È quello che succede quando ci troviamo su un aereo che sta accelerando per decollare (cfr. fig. 6.1): l’aereo accelera e noi veniamo spinti all’indietro da una forza proporzionale all’accelerazione dell’aereo. Per noi non fa differenza se la forza che ci spinge sia reale – qualcuno che ci spinge – oppure se è l’effetto dell’accelerazione dell’aereo. Noi non possiamo accorgerci della differenza fra i due casi. Riprendiamo ora l’osservazione di Einstein; supponiamo di trovarci dentro un ascensore, in due situazioni differenti: 1. l’osservatore si trova dentro un ascensore che poniamo nello spazio vuoto – molto lontano da qualunque corpo celeste, idealmente nello spazio fra una galassia e l’altra; questo ascensore ha un’accelerazione a
244
fisica per filosofi
figura 6.1 Cosa succede a una persona che si trova in un aereo che sta accelerando al decollo
a0
F = –ma0
Punto di vista da un sistema di riferimento solidale con la Terra che vede l’aereo che sta accelerando
Punto di vista del passeggero sull’aereo che sta accelerando
Anche se sulla persona non agisce nessuna forza reale, la persona sente una forza che la spinge all’indietro.
verso l’alto. L’osservatore sente, quindi, una forza che lo spinge verso il – basso. Questa forza sarà F A = – mā (cfr. fig. 6.2a); 2. lo stesso ascensore si trova sulla superficie terrestre, fermo rispetto alla Terra che ipotizziamo altrettanto ferma (il moto intorno al Sole e quello di rotazione sono inessenziali). In questo caso l’osservatore sentirà una forza che lo attrae verso il basso: è la forza di gravità dovuta – all’accelerazione gravitazionale g: F B = – mg ˉ (cfr. fig. 6.2b). Quello che nota Einstein è che, se a = g, l’osservatore non ha modo di distinguere fra le due situazioni, sente in ogni caso una forza che lo spinge verso il basso: se vale l’equivalenza mi = mg, non esiste modo di discernere tra gli effetti di un campo gravitazionale uniforme o di un’accelerazione costante. Attenzione! I due casi sono indistinguibili in una sola posizione, se ci spostassimo lungo la verticale l’accelerazione di gravità g cambierebbe. L’indistinguibilità è locale. Quindi: 1. le due masse, quella inerziale e quella gravitazionale, devono essere uguali, e questo viene posto come principio; 2. è sempre possibile trovare un sistema (di riferimento) in cui gli effetti della forza di gravità siano identici a quelli di un’accelerazione costante (localmente);
teoria della relatività generale
245
figura 6.2 Esperimento mentale di una persona in un ascensore in due condizioni differenti ((a))
(b)
a
Ascensore che accelera, nello spazio
g
Ascensore fermo, sulla Terra
(a) Ascensore in moto accelerato nello spazio vuoto, senza forza di gravità. (b) Ascensore fermo sulla Terra, in presenza della forza di gravità. Einstein asserisce che, per una persona che si trovi dentro l’ascensore, le due situazioni sono indistinguibili, se a = g, quindi le leggi della fisica nei due sistemi di riferimento devono essere equivalenti, anche se uno dei due sistemi è accelerato.
3. ma allora possiamo scrivere una legge di relatività per tutti i sistemi di riferimento, anche per quelli non inerziali. Nell’articolo sulla relatività generale, dunque, Einstein scrive: Non resta quindi altra possibilità che assumere tutti i sistemi di coordinate pensabili come in linea di principio ugualmente legittimi per la descrizione della natura (Einstein, 1916, p. 776).
Da questo punto parte Einstein per enunciare la teoria della relatività generale. Risolverà tutti (?) i problemi legati alla gravità. Il punto essenziale è che questo verrà fatto ridefinendo ancora una volta i concetti di spazio e di tempo.
6.4. I due principi della relatività generale e il principio di Mach La relatività generale si fonda su due principi. 1. Il principio di equivalenza: In un corpo la massa inerziale e la massa gravitazionale sono uguali.
246
fisica per filosofi
2. Il principio sulla relatività dei sistemi di riferimento: Le leggi della fisica devono essere di natura tale da valere rispetto a un sistema di riferimento in moto arbitrario.
Il principio di equivalenza può essere scritto in due versioni: 1. quella forte afferma che in un campo gravitazionale qualsiasi è sempre possibile trovare un sistema di riferimento rispetto al quale scegliere un intorno di un punto in cui gli effetti dell’accelerazione dovuti al campo gravitazionale sono nulli; 2. quella debole asserisce che la massa inerziale, cioè la proprietà intrinseca del corpo materiale di opporsi alle variazioni di moto, e la massa gravitazionale, che rappresenta la proprietà di un corpo di essere sorgente e di subire l’influsso di un campo gravitazionale, sono numericamente uguali. Gli appellativi di “forte” e “debole” si giustificano dal momento che se vale il principio di equivalenza nella forma forte deve valere anche quello nella forma debole, mentre da un punto di vista logico l’implicazione non è reversibile. Questa caratteristica fa sì che, sebbene il principio in forma debole sia stato sperimentalmente confermato con precisione elevatissima, ciò non è sufficiente a garantire lo stesso grado di certezza anche alla forma forte, che deve essere dunque considerata ancora come un postulato. In un articolo del 1918 Einstein discute approfonditamente i principi della relatività generale inserendo, accanto al secondo principio, anche il principio di Mach (cfr. Einstein, 1918) secondo cui: Il campo G, che descrive le proprietà dello spazio, è completamente determinato dalle masse dei corpi.
Una discussione su questo punto delicato, tuttavia, va oltre gli scopi di questo libro.
6.5. Un nuovo concetto: lo spazio-tempo curvo è reale Ecco cosa diceva la fisica classica: Esiste lo spazio assoluto, esiste il tempo assoluto. Lo spazio è piatto, vale, cioè, la geometria di Euclide. In questo spazio valgono le leggi della dinamica. Esistono la legge di gravitazione universale e le leggi dell’elettromagnetismo che descrivono le interazioni fra le masse e le cariche elettriche. Tutti i sistemi inerziali sono equivalenti (sono indistinguibili).
teoria della relatività generale
247
Ecco, invece, cosa dice la relatività speciale: Esiste lo spazio-tempo. Spazi e tempi sono relativi e dipendenti uno dall’altro. Tutti i sistemi inerziali sono equivalenti. Lo spazio è piatto, vale, cioè, la geometria di Euclide. La legge di gravitazione non entra nella descrizione della relatività speciale o, se vogliamo, ne fa parte come una delle tante forze che possiamo inserire nelle interazioni fra sistemi fisici.
Infine, ecco cosa dice la relatività generale: Le masse “curvano” lo spazio-tempo. Lo spazio-tempo non è piatto, quindi in generale non vale la geometria di Euclide. I corpi si muovono seguendo le linee di universo di uno spazio curvo, cioè le geodetiche; non serve invocare la forza di gravità (povero Newton!). La relatività speciale continua a essere valida, ma viene estesa a sistemi accelerati, non inerziali.
Cosa vuol dire che lo spazio-tempo quadridimensionale è curvo? Non è un concetto facile, è più semplice prendere come esempio uno spazio curvo in due dimensioni, tralasciando per ora la curvatura della terza dimensione spaziale e quella del tempo. Uno spazio curvo noto a tutti è quello di una superficie sferica: la superficie terrestre, per esempio, oppure una palla. In questo spazio la geometria euclidea non vale più. Per esempio, possiamo avere triangoli in cui la somma degli angoli interni è maggiore di 180° (cfr. fig. 6.3a). Oppure, dati due punti, il tragitto più corto che li unisce sarà una curva; nel caso della sfera deve essere un cerchio massimo, una circonferenza, cioè, che passa per i due punti e per il centro della sfera (cfr. fig. 6.3b). Questa è la ragione per cui gli aerei che devono andare da Roma a New York, che si trovano circa alla stessa latitudine, puntano verso l’Inghilterra, vanno verso la Groenlandia e poi “scendono” verso New York: è il tragitto più breve. Vediamo ora un esempio un po’ più complicato: quello in cui anche il tempo è curvo. Consideriamo due persone che pensano di trovarsi in uno spazio piatto, e che stanno ferme nello spazio vuoto (oppure sulla Terra, su una superficie orizzontale senza alcun attrito). Ecco la descrizione di quello che accade fatta dalle due persone: misurano la loro distanza e vedono che questa diminuisce. Da qui concludono che esiste una forza che li attrae l’uno all’altro. Infatti, noi diciamo che le due persone hanno una certa massa, per cui si attraggono secondo la legge di gravitazione universale. Possiamo disegnare le loro linee di universo in uno spazio-tempo piatto (cfr. fig. 6.4b).
248
fisica per filosofi
figura 6.3 Effetti in uno spazio non euclideo curvo (a)
(b)
90°
90°
La 90°
La < Lb
90°+90°+90° = 270°
Lb (a) La somma degli angoli interni di un triangolo è maggiore di 1800. (b) La linea più breve fra due punti è una geodetica: la linea LA è più corta della linea LB.
Consideriamo ora le due persone libere di muoversi ripetendo l’esperimento in uno spazio-tempo curvo: queste persone potranno spiegare il loro avvicinamento senza dover introdurre nessuna forza esterna (cfr. fig. 6.4c). Secondo la relatività generale lo spazio-tempo è uno spazio curvo di dimensione 4 (x, y, z, t). Le traiettorie di un corpo in presenza di massa sono le “geodetiche”5, che non sono necessariamente delle linee rette. 6.5.1. Lo spazio-tempo è curvato dalle masse Dove va a finire la forza di gravità nella nuova teoria? La forza di gravità non ci serve più, non esiste (è solo comodo usarla per fare i calcoli in alcune condizioni). Quello che succede è che lo spazio senza masse è piatto. Lo spazio in presenza di masse viene “curvato” dalle masse, che di conseguenza si muovono in uno spazio curvo “cadendo” le une verso le altre e muovendosi di conseguenza. La realtà fisica dello spazio-tempo è descritta da un’equazione che lega la presenza di materia/energia alla metrica, cioè alla geometria dello spazio-tempo curvo. La metrica è una funzione di quattro variabili indipendenti: (x, y, z, t). Come disse John Wheeler: «La materia dice allo spazio-tempo come incurvarsi, e lo spazio curvo dice alla materia come muoversi» (cfr. Misner; Thorne, Wheeler, 1973, p. 5).
teoria della relatività generale
249
figura 6.4 Moto in uno spazio-tempo a due dimensioni, una spaziale (x) e una temporale (t) (a)
(b) ()
(c) ()
t
t
t
L1 F
F
L0 O
x
L1 O
L0 x
O
L1 x
Le linee sottili rappresentano alcune linee di universo. (a) L1 è la linea di universo dell’uomo indicato. L’uomo rimane a una distanza costante rispetto alla linea di universo passante per l’origine O. (b) Abbiamo due persone, ferme nello spazio, che al passare del tempo vedono la loro distanza diminuire. Imputano questo all’esistenza di due forze uguali e contrarie (la forza dovuta alla legge di gravitazione universale). (c) Come nel caso precedente, solo che lo spazio-tempo è curvo, le linee di universo sono curve. Le due persone vedono la distanza relativa che diminuisce e attribuiscono ciò al fatto che si stanno muovendo su linee curve, come se si trovassero su una pista per bob. Non serve invocare nessuna forza di attrazione.
Questa è l’equazione (in realtà sono una serie di equazioni) del campo di Einstein che descrive il comportamento dello spazio-tempo e delle masse-energie presenti nello spazio: 8πG Gμv = c4 Tμv La parte di sinistra (il tensore di Einstein) descrive la geometria (curva) dello spazio-tempo, quella di destra (il tensore stress-energia) è proporzionale alla distribuzione delle masse e delle energie nello spazio. In questa versione non è stata inserita la cosiddetta “costante cosmologica” relativa ad un universo che Einstein supponeva essere statico. In seguito si è visto che l’universo non è statico, ma dinamico: dal Big Bang in poi l’universo si sta espandendo, quindi la costante cosmologica di Einstein non era necessaria6. L’equazione di Einstein è una delle più difficili di tutta la fisica. Non esistono soluzioni esatte valide in generale, ma sono state scritte varie soluzioni valide in sistemi particolari. Per esempio, già nel lavoro originale Einstein fa un calcolo approssimato
250
fisica per filosofi
del moto di un punto in presenza di una “debole” perturbazione dello spazio-tempo, vale a dire non troppo vicino a masse non troppo grandi. La conclusione sono due equazioni equivalenti alla legge della gravitazione di Newton descritta nello spazio piatto della meccanica classica.
6.6. Conseguenze delle equazioni del campo di Einstein Ciò che produce la curvatura dello spazio è la materia stessa. La curvatura determina a sua volta il moto della materia nello spazio. La distribuzione di materia e il suo moto non possono essere descritti indipendentemente dal campo gravitazionale da essi prodotti. Vediamo alcune conseguenze delle equazioni del campo di Einstein. 1. Effetti su misure spaziali e temporali: le lunghezze radiali (cioè dirette lungo un raggio che dal centro di massa di un corpo va verso l’esterno) e gli intervalli di tempo dipendono dalla presenza di masse “nelle vicinanze”. Questo vuol dire che se prendiamo un righello e ne misuriamo la lunghezza in direzione radiale rispetto a una massa otterremo un valore che dipende dalla curvatura dello spazio in quel punto, che sarà tanto maggiore quanto più vicini ci troveremo alla massa. Mentre un orologio andrà a velocità differente a seconda della distanza dalla massa sorgente della curvatura spazio-temporale (cfr. fig. 6.5). figura 6.5 Effetti di un campo gravitazionale sulla struttura dello spazio-tempo
M
tA
LA < L B tA < tB
tB r
rA
LB
LA rB
Per un osservatore esterno un righello di lunghezza L è più corto e il tempo t scorre più lentamente se misurato vicino alla massa che genera il campo gravitazionale. I valori rA e rB sono le distanze medie dei righelli dal centro di massa della sfera di massa M.
teoria della relatività generale
251
Attenzione! Queste variazioni non possiamo misurarle con degli strumenti che si trovano dove sono gli oggetti (il righello o l’orologio). Non è il righello in sé che si accorcia o l’orologio in sé che rallenta. È lo spazio e il tempo che vengono modificati. La misura deve essere fatta idealmente da un osservatore esterno. In formule: r r 2GM 2GM L(r) = L0 1 − rc2 = L0 1 − rs ; t (r) = t0 1 − rc2 = t0 1 − rs La grandezza rS = 2GM/c2 è il cosiddetto “raggio di Schwarzschild”; il fattore rs è legato alla scala degli effetti relativistici. Può succedere che l’oggetto che crea la curvatura spazio-temporale abbia una densità molto grande, tale che tutta la sua massa si trovi entro una sfera di raggio rs. In questo caso se ponessimo il righello e l’orologio a una distanza dal centro di massa r uguale a rs, si avrebbe rs/r = 1 e succederebbero cose strane: sia la lunghezza del righello L0 che la durata dell’evento t0 diventerebbero uguali a zero. Spazio e tempo sembrano sparire, in realtà è la descrizione matematica che va scritta diversamente. Per la Terra, per esempio, si ha che il suo raggio di Schwarzschild è di 2GMT/c2 = rs = 9 mm. Quindi, vedremmo questi effetti se tutta la massa della Terra fosse confinata in una sferetta del diametro di 9 mm. Ma la densità media della Terra non è così alta, non è possibile confinarla tutta in 9 mm di diametro, perciò sulla Terra non dobbiamo preoccuparci di questi effetti al limite della descrizione fisico-matematica. Se, invece, abbiamo un corpo le cui dimensioni sono inferiori del corrispondente raggio di Schwarzschild, allora abbiamo un oggetto particolare: il cosiddetto “buco nero”. 2. Effetti sulla luce: un raggio di luce, al pari di un oggetto dotato di massa, deve subire l’azione del campo gravitazionale, ed eventualmente esserne “curvato”. Una delle prime verifiche sperimentali dirette della realtà dello spazio-tempo curvo si ebbe da parte di Eddington nel 1919 dall’osservazione di un’eclisse solare (cfr. fig. 6.6). Si osservò una deflessione ∆θ di circa 1,7" (questo angolo corrisponde al diametro di una moneta da un euro vista dalla distanza circa 3 km). La teoria aveva la prima verifica sperimentale diretta: la luce curva o “cade” in un campo gravitazionale.
252
fisica per filosofi
figura 6.6 Curvatura di un raggio luminoso che passa nelle vicinanze di una massa osservatore
Δθ Posizione apparente della stella
d
Terra
Posizione vera della stella Sole Il campo gravitazionale del Sole curva lo spazio vicino ad esso. La luce della stella quindi percorre una curva. L’effetto, per un osservatore sulla Terra, è di vedere uno spostamento della sorgente di un certo angolo. Questa osservazione è stata una delle prime conferme sperimentali della validità della relatività generale.
6.6.1. Un effetto quotidiano: il gps Ogni telefono cellulare di ultima generazione può determinare la nostra posizione con una precisione di circa 10 m. Il corretto funzionamento di un localizzatore gps dipende in maniera critica dalle formule della relatività generale e speciale applicate alla debolissima curvatura dello spaziotempo causata dalla Terra e alla velocità dei satelliti in orbita intorno a quest’ultima. Il sistema di localizzazione utilizza (almeno) 28 satelliti che ruotano intorno alla Terra su orbite differenti. Il funzionamento del gps, per sommi capi, è questo: i satelliti del gps inviano in continuazione verso la Terra delle serie di impulsi di onde elettromagnetiche. Questi impulsi contengono tutta una serie di informazioni, compresa la posizione del satellite e il tempo in cui l’impulso è partito, misurato da un orologio atomico che si trova sul satellite. L’impulso del gps viene ricevuto dal cellulare, dal ritardo fra emissione e ricezione si misura la distanza fra il satellite e il cellulare, sapendo che la velocità della luce è costante. In realtà i calcoli sono più complessi dato che l’orologio del cellulare non è preciso come quello del satellite. Ma questo non cambia la sostanza di ciò che accade. Combinando i dati di 4 satelliti si può calcolare la posizione del cellulare sulla superficie terrestre. Ma gli orologi sui satelliti sono sottoposti alla forza di gravità, che è differente da quella sulla Terra. Quindi, misurano un tempo differente da quello che misurerebbero sulla Terra; il ritardo misurato dal cellulare, dunque, non è solo quello dovuto alla distanza percorsa dall’impulso elettromagnetico.
teoria della relatività generale
253
Ricordiamoci che il tempo (la durata di un evento) in presenza di una massa viene ridotto e dipende dalla distanza dal centro di massa: r rs = 2GM/c2. t(R) ≅ t∞ 1 − s dove r Se inseriamo nella formula i vari dati – la massa e il raggio della Terra, l’altezza dei satelliti – arriviamo a una correzione, su un giorno, di circa 53 μs. Dobbiamo poi considerare la correzione a causa della relatività speciale (il satellite viaggia a una velocità di circa 13 600 km/h). Alla fine il gps ci fornisce l’indicazione di dove siamo con una precisione di circa 10-20 m (meno di 1 m per quelli militari). Se non avessimo apportato le correzioni dovute alla relatività generale e alla relatività speciale avremmo avuto un errore, nella posizione, di vari chilometri (circa 5 km): il gps darebbe un’indicazione sbagliata e sarebbe inutilizzabile.
6.7. L’ultima previsione verificata: le onde gravitazionali L’11 febbraio 2016 David Reitze, portavoce dell’esperimento statunitense ligo (Advanced Laser Interferometer Gravitational-Wave Observatory)7, annunciò alla comunità scientifica mondiale un risultato atteso da decine di anni: la rivelazione diretta delle onde gravitazionali, previste nell’ambito della teoria della relatività generale da Einstein (1918). I fisici Kip Thorne, Barry Barish e Rainer Weiss della collaborazione ligo hanno ricevuto nel 2017 il premio Nobel per la rivelazione delle onde gravitazionali. 6.7.1. Cosa sono le onde gravitazionali e come sono state rivelate Per capire cosa sia un’onda gravitazionale possiamo servirci di un’analogia con le onde elettromagnetiche. Le equazioni di Maxwell descrivono tutti i fenomeni (classici) che coinvolgono cariche elettriche ferme e/o in movimento. In particolare prevedono che, se abbiamo delle cariche elettriche accelerate (cioè, che si muovono con velocità non costante), allora abbiamo un’emissione di onde elettromagnetiche che viaggiano alla velocità della luce. Disponendo di un opportuno rivelatore (un’antenna) possiamo rivelare queste onde. È quello che succede quando sentiamo squillare il cellulare o quando vediamo la tv. Nel caso delle equazioni del campo di Einstein si può ragionare allo stesso modo. Se abbiamo delle masse accelerate opportunamente8 le equazioni della rela-
254
fisica per filosofi
tività generale hanno una soluzione che rappresenta un’onda che si propaga nello spazio vuoto alla velocità della luce. Ma, attenzione, non si tratta di un’onda elettromagnetica, bensì di un’onda gravitazionale. La deformazione che viaggia è la deformazione dello spazio-tempo. Questa deformazione, quando raggiunge un corpo, modifica per qualche frazione di secondo lo spazio-tempo entro cui si trova il corpo e, quindi, la misura delle dimensioni del corpo stesso, depositando in esso una quantità di energia infinitesima. Il problema è che questo effetto è piccolissimo, lo stesso Einstein pensava che non sarebbe mai stato misurato con la tecnologia disponibile all’epoca. I tentativi per la rivelazione diretta delle onde, possibile solo per eventi galattici catastrofici tipo l’esplosione di una supernova o eventi che coinvolgono buchi neri, iniziarono negli anni Settanta dello scorso secolo, ma è solo nei primi anni del nuovo che furono realizzati sistemi in grado di rivelare effettivamente questi debolissimi segnali. La collaborazione ligo-Virgo nacque con l’idea di utilizzare come rivelatore un interferometro di Michelson in cui due raggi luminosi, percorrendo due cammini fra loro perpendicolari, vengono fatti incontrare e, tramite il fenomeno dell’interferenza, permettono la rivelazione di una piccolissima variazione nella lunghezza relativa dei due cammini. L’evento misurato dagli interferometri di ligo il 14 settembre 2015 alle ore 9:50:45 utc consisteva in una deformazione dello spazio percorso dai raggi laser (circa 50 km) di circa 2 · 10–18 m e della durata di circa 50 ms. La sorgente era la collisione di due buchi neri di 29 e 36 masse solari avvenuta circa 1,3 miliardi di anni fa (Abbott, 2016). È interessante notare come l’apparato sperimentale utilizzato è concettualmente identico a quello di Michelson a Morley del 1887: allora un risultato “negativo” servì a corroborare quella che poi sarebbe stata la teoria della relatività speciale del 1905. Nel 2015 un apparato simile, tramite un risultato “positivo”, ha fornito una prova diretta che corrobora la teoria della relatività generale del 1916.
Percorso storico-filosofico 7. Spazio e geometria Abbiamo visto che la teoria della relatività generale introduce una rivoluzionaria relazione tra la gravitazione e lo spazio-tempo. Come scrive Einstein nell’articolo che presenta la nuova teoria: «le 10 funzioni gμν che rappresentano il campo gravitazionale determinano allo stesso
teoria della relatività generale
255
tempo le proprietà metriche dello spazio misurabile tetradimensionale» (Einstein, 1916, p. 779, trad. mia). Einstein presenta la nuova teoria come soluzione di un difetto epistemologico della meccanica: il postulato di relatività deve essere esteso in modo tale che le stesse leggi di natura si possano applicare a tutti i sistemi di riferimento, siano essi in moto inerziale o accelerato. Il risultato è una teoria in cui lo spazio-tempo è dotato di una geometria non euclidea, le cui proprietà metriche variano a seconda della presenza della materia. Questo mutamento concettuale si appoggia sulla formulazione delle geometrie non euclidee, avvenuta nel corso dell’Ottocento a partire dai lavori di Nikolaj I. Lobačevskij (1792-1856) e János Bolyai (1802-1860). Ma la nuova teoria è resa possibile da un’ulteriore mossa teorica, poiché stabilisce una relazione tra le proprietà fisiche della materia, in particolare la massa, e quelle geometriche dello spazio, in particolare la metrica, che definisce la misura delle distanze. Entrambe queste innovazioni concettuali, relative allo spazio geometrico e a quello fisico, dipendevano da un ampio percorso teorico risalente alla prima età moderna. Partiamo dalla trasformazione del concetto di spazio a cui Einstein stesso fa riferimento, ovvero la rivoluzione nella geometria dell’Ottocento determinata dalla formulazione delle geometrie non euclidee, che mettono in discussione la validità del quinto postulato degli Elementi di Euclide (circa 300 a.C.), o “postulato delle parallele”. Secondo quest’ultimo, se una retta taglia altre due rette determinando dallo stesso lato angoli interni la cui somma è minore di 180°, prolungando indefinitamente le due rette esse si incontreranno dalla parte dove la somma dei due angoli è minore di due angoli retti. In una moderna riformulazione il postulato afferma: data una retta e un punto P esterno a essa, è possibile tracciare una e una sola parallela passante per quel punto. Le nuove geometrie si basano sull’eliminazione di questo postulato, mostrando che è possibile avere una geometria coerente in cui le rette suddette sono infinite (geometria iperbolica) oppure nulle (geometria ellittica, introdotta da Bernhard Riemann, 1826-1866). Di conseguenza, anche il teorema sulla somma degli angoli interni di un triangolo risulta dipendente dai postulati adottati e non sempre quest’angolo risulta uguale a 180°, come nella geometria euclidea, e come ritenuto per secoli evidente. Questa rivoluzione geometrica presuppone una precedente rivoluzione epistemologica, per cui diventa possibile in generale mettere in discussione le proprietà geometriche dello spazio. Da Euclide fino all’età moderna la geometria si occupa di linee, triangoli, cerchi, sfere e altre
256
fisica per filosofi
figure, ma non dello spazio. Pertanto, benché fosse noto fin dall’antichità che la geometria euclidea conteneva un postulato privo di evidenza e indimostrato, la ricerca su questo problema non riguarda lo spazio. L’idea che la geometria sia una “scienza dello spazio” costituisce una grande rivoluzione epistemologica che, come ha mostrato Vincenzo De Risi (2015), matura gradualmente nella cultura moderna e raggiunge il culmine nel Settecento. Nell’antichità è escluso ogni rapporto tra le figure e lo spazio in cui queste sono immerse, per cui la misura degli intervalli spaziali presuppone la struttura euclidea. Anche la fisica aristotelica, che si occupa dei luoghi occupati dalle sostanze, non considera lo spazio come oggetto di studio geometrico. Un allargamento dell’indagine all’ambiente che circonda le figure prima che in geometria ha inizio in filosofia, laddove ci si interroga su cosa sia l’estensione cosmica in cui sono immersi i corpi e che serve da base anche alla definizione degli oggetti geometrici. Un importante esponente moderno di tale posizione è Cartesio, ma questo tipo di ricerca risale al neoplatonismo antico. Una fase successiva di questo processo teorico si trova nell’opera di una serie di autori che, dal platonismo rinascimentale fino a Newton, considerano l’ambiente fisico come spazio, distinto dalla materia e suscettibile di un’indagine puramente geometrica. Come mostra il caso di Newton, che applica le proprietà euclidee allo spazio assoluto, in questa fase la geometria resta quella classica, ma si pongono le condizioni di un passaggio ulteriore: esaminare le proprietà geometriche dello spazio per farne uso nella fisica. Questo passaggio è effettuato a partire dalle indagini di filosofi e scienziati tra il xvii e il xviii secolo, da Leibniz ai molti geometri che nel Settecento riprendono la questione del postulato delle parallele, e raggiunge il suo culmine a partire da Karl F. Gauss e dai già citati Lobačevskij e Bolyai all’inizio dell’Ottocento, quando la possibilità di geometrie alternative è finalmente dimostrata. Parallelamente a questi sviluppi della geometria, nel pensiero dell’Ottocento si pone il problema della possibile differenza tra spazio geometrico e spazio fisico. In filosofia la questione era stata riaccesa con particolare vigore dopo che Kant, nella Critica della ragion pura, aveva presentato la sua concezione dello spazio come forma pura dell’intuizione, sostenendo che le conoscenze geometriche fossero giudizi a priori, e includendo tra i suoi esempi la proposizione secondo cui tra due punti c’è solo una linea retta (poi negato da alcune geometrie non euclidee).
teoria della relatività generale
257
Il dibattito sulle tesi kantiane si diffonde per tutta l’Europa e dura fino al xx secolo: ai kantiani si oppongono soprattutto pensatori di orientamento empirista, secondo cui tutte le conoscenze, incluse quelle geometriche, deriverebbero dall’esperienza. In quest’ultima prospettiva, la certezza che lo spazio fisico sia euclideo diventa anch’essa dipendente dall’esperienza. Il grande scienziato e filosofo tedesco Helmholtz (cfr. Percorso storico-filosofico 4) effettua un’importante rielaborazione delle tesi kantiane compatibile con l’empirismo: Helmholtz afferma che lo spazio è una condizione generale dell’esperienza, ma questo non comporta che lo spazio fisico abbia una struttura conosciuta a priori; gli specifici assiomi geometrici possono essere sottoposti a prova sperimentale. Helmholtz, nei Fatti della percezione (1877), distingue, dunque, la geometria intuitiva dalla «geometria fisica, fondata su un gran numero di esperienze» (Helmholtz, 1996b, p. 646). Inoltre, nei suoi lavori sulla fisiologia della percezione, Helmholtz applica la geometria allo studio dello spazio dell’esperienza sensoriale sottolineando come, per esempio, lo spazio del nostro campo visivo non abbia la stessa struttura dello spazio geometrico euclideo. Resta aperta la questione di quale sia effettivamente la geometria dello spazio fisico. Un altro grande filosofo e scienziato, Henri Poincaré (1854-1912), afferma che la scelta tra geometrie diverse per descrivere i dati empirici non sarebbe determinata in modo univoco da questi ultimi, e pertanto dipenderebbe da una convenzione, concludendo che lo spazio euclideo resta l’ipotesi preferibile. Ma la questione è ormai dibattutissima e diviene tra i principali temi d’indagine della ricerca sui fondamenti della matematica fiorita tra la fine del xix e l’inizio del xx secolo. La discussione di quest’epoca produce una tripartizione concettuale, che il filosofo Rudolf Carnap riassume, molti anni dopo, in uno scritto intitolato Lo spazio (1922), distinguendo tre concetti: spazio formale (definito in termini astratti da un sistema di assiomi), spazio fisico e spazio intuitivo (corrispondente alla natura dei nostri sensi). Su questo sfondo, e con particolare attenzione alla trattazione dell’assiomatica data dal matematico David Hilbert, Einstein formula la sua nuova teoria della relatività. In una conferenza intitolata Geometria ed esperienza Einstein scrive: Com’è possibile che la matematica, che è un prodotto del pensiero umano indipendente da ogni altra esperienza, se la cavi così bene al confronto con l’esperienza? Può quindi la ragione umana senza l’esperienza e solo mediante il puro pensiero penetrare a fondo nelle proprietà delle cose reali?
258
fisica per filosofi
Su questo punto secondo me si deve rispondere in breve: laddove le leggi della matematica corrispondono alla realtà, esse non sono certe, e laddove sono certe, esse non corrispondono alla realtà. Piena chiarezza su questo stato dei fatti mi pare derivi in primo luogo da quella linea di pensiero sulla proprietà generali della matematica che è conosciuta sotto il nome di “assiomatica”. Il progresso raggiunto dall’assiomatica sta nel fatto che con essa si separa nettamente il contenuto logico formale da quello empirico o intuitivo; solo quello logico formale costituisce secondo l’assiomatica l’oggetto della matematica, e non il contenuto intuitivo o d’altro tipo accoppiato a quello logico-formale (Einstein, 1921, pp. 3-4, corsivo mio).
La posizione einsteiniana costituisce, dunque, l’episodio cruciale di una lunghissima storia di ricerche filosofiche sullo spazio, che anche dopo la relatività generale non hanno smesso di occupare scienziati e filosofi.
7 Meccanica quantistica L’idea che un elettrone esposto a radiazione possa scegliere liberamente l’istante e la direzione in cui spiccare il salto è per me intollerabile. Se così fosse, preferirei fare il ciabattino, o magari il biscazziere, anziché il fisico. Einstein, Born, Born (1973, p. 98)
Questa relazione di incertezza specifica i limiti entro cui si può applicare la descrizione di particella. Ogni utilizzo delle parole “posizione” e “velocità” con un’accuratezza che eccede quella data dall’equazione […] è senza significato, come l’utilizzo di parole il cui significato non è definito. Heisenberg (1930)
meccanica quantistica Principi (ridotti e semplificati) “à la Copenaghen” (1927) 1. Lo stato di un sistema è dato assegnando la funzione d’onda complessa ψ(r, t) che contiene tutta l’informazione relativa al sistema. 2. La funzione d’onda ψ(r, t) è un’ampiezza di probabilità, non può essere misurata direttamente. 3. Il modulo quadro della funzione d’onda permette di calcolare la probabilità di trovare il sistema nella posizione r, al tempo t: P(r, t) = |ψ(r, t)|2. 4. L’evoluzione temporale di un sistema si ha risolvendo l’equazione di Schrödinger: iħ
∂ψ = Hψ ∂t
dove H è una funzione, legata all’energia totale del sistema, che agisce sulla funzione d’onda ψ. Principio di indeterminazione di Heisenberg (1927-30) Ne abbiamo due versioni: 1. versione soft (“a disturbo”): alcune coppie di grandezze microscopiche non possono essere misurate contemporaneamente con una precisione arbitraria, perché l’azione della misura cambia il loro stato in modo non prevedibile;
260
fisica per filosofi
2. versione hard (“intrinseca”): alcune coppie di grandezze microscopiche non possono essere misurate contemporaneamente con una precisione arbitraria, perché non possiedono contemporaneamente valori fisici definiti. Principio di esclusione di Pauli (1925) Due fermioni identici non possono stare nello stesso stato individuale (un fermione è una particella con spin semintero).
7.1. Introduzione Riprendiamo l’elenco delle evidenze sperimentali che agli inizi del Novecento non trovavano spiegazioni nell’ambito della fisica classica dal par. 5.1. Con il contributo di Einstein, però, hanno trovato una soluzione i primi quattro punti, o tramite la relatività speciale o tramite la relatività generale. Gli altri troveranno una spiegazione con la meccanica quantistica e le teorie cosmologiche successive. Riepiloghiamo brevemente, allora, i problemi rimasti da risolvere. 1. Il colore degli oggetti in funzione della temperatura: perché oggetti scaldati ad alta temperatura hanno colori diversi a seconda della temperatura, indipendentemente dal tipo di materiale? 2. La quantità di radiazione elettromagnetica, emessa da un corpo nero1: la teoria prevede che questa energia sia infinita, ma ovviamente ciò non è possibile. 3. L’elettrone che ruota intorno al nucleo dell’atomo senza caderci dentro: secondo l’elettromagnetismo classico un elettrone che ruota dovrebbe irradiare energia, quindi perdere energia e cadere dentro il nucleo dopo un tempo brevissimo. Perché questo non succede? 4. Le proprietà assolutamente costanti degli elementi: perché tutti gli atomi dello stesso tipo – ferro, calcio, rame ecc. – hanno esattamente le stesse proprietà che sono costanti nel tempo? 5. Le differenze di comportamento fra gli elementi: perché un elettrone in meno fa molta più differenza che molti elettroni in meno (54Xe ≠ 53I; ma 54Xe ≅ 36Kr)? 6. Il colore del cielo: perché è nero di notte e azzurro di giorno? (Keplero, 1601; Olbers, 1826)
meccanica quantistica
261
7.1.1. La meccanica quantistica, una teoria completamente nuova La meccanica quantistica e la relatività2 sono due teorie, entrambe rivoluzionarie, che hanno cambiato radicalmente la nostra visione del mondo. Tuttavia, c’è una differenza fondamentale fra le due. La relatività modifica la nostra visione dello spazio-tempo. Può sembrarci strano che i tempi e gli spazi siano relativi, ma quello che succede non è assurdo: abbiamo oggetti più corti, tempi dilatati, ma la misura non è “illogica”. La meccanica quantistica, invece, introduce delle spiegazioni talvolta “incomprensibili”: la sua logica non è quella a cui siamo abituati. Si tratta di una nuova rappresentazione degli elementi della realtà microscopica che talvolta contrastano con il senso comune. I fisici sovente incontrano problemi quando cercano di interpretare i risultati della meccanica quantistica: spesso si è obbligati ad accettare le sue previsioni, senza doverle necessariamente capire fino in fondo. Questa è la ragione per cui molti fisici non l’hanno accettata, o la rifiutano in toto, e cercano, ancora oggi, teorie alternative. Nel paragrafo successivo vedremo, tanto per fare qualche esempio, cosa hanno detto della meccanica quantistica una serie di fisici illustri. È da notare che molti di questi hanno preso il premio Nobel per le loro ricerche sulla meccanica quantistica. 7.1.2. Dichiarazioni e affermazioni varie sulla meccanica quantistica Nella comunità scientifica la struttura della meccanica quantistica poneva dei problemi a molti fisici, e in parte li pone tuttora. Come anticipato, vediamo alcuni esempi di affermazioni sulla meccanica quantistica fatte da insigni studiosi (le prime quattro affermazioni riguardano, nello specifico, la quantizzazione delle orbite atomiche operata da Bohr nel 1911). Se questa è la via per raggiungere la meta devo rinunciare a fare fisica (Paul Ehrenfest, cit. in Mehra, Rechenberg, 1982, vol. vi, p. 251). In questo momento la fisica è ancora una volta terribilmente confusa. In ogni caso è troppo difficile per me, e io vorrei essere un attore comico del cinema o qualcosa del genere e non aver mai sentito parlare di fisica (Pauli, 1925, cit. in Kuhn, 1970, p. 40).
262
fisica per filosofi
L’idea che un elettrone esposto a radiazione possa scegliere liberamente l’istante e la direzione in cui spiccare il salto è per me intollerabile. Se così fosse, preferirei fare il ciabattino, o magari il biscazziere, anziché il fisico (Einstein nella lettera a Max Born del 29 aprile 1924, in Einstein, Born, Born, 1973, p. 98, corsivo mio). Non sono competente a tenere questa relazione […] anche perché non accetto il punto di vista puramente statistico su cui si basano le nuove teorie (Einstein, cit. in Pais, 1986, p. 459). Più la teoria dei quanti ha successo, più sembra una sciocchezza (Einstein nella lettera a Heinrich Zangger del 20 maggio 1912). Se pensassi che questo stupidissimo saltellare dei quanti avesse un fondamento di verità, mai mi sarei sporcato le mani con la meccanica quantistica! (Schrödinger, cit. in Heisenberg, 1984, p. 85) Non vorrei lasciarmi indurre ad abbandonare la causalità rigorosa senza aver prima lottato in modo assai diverso da come s’è fatto finora (Einstein nella lettera a Born del 29 aprile 1924, in Einstein, Born, Born, 1973, p. 98). [Situazione inaccettabile da tutti coloro che non sono] disponibili ad abbandonare senza combattere una causalità rigorosa (Einstein). Non mi piace, e mi spiace di averci avuto a che fare (attribuita a Schrödinger). Quanto più penso agli aspetti fisici della teoria di Schrödinger, tanto più repellenti li trovo (Heisenberg a Wolfang E. Pauli, 8 giugno 1926, in Cassidy, 1996, p. 236). È indubitabile, a mio parere, che questa teoria contenga un frammento della verità ultima (Einstein, 1931). Infatti chi non rimane sconvolto, quando si imbatte per la prima volta nella teoria quantistica, non può assolutamente averla compresa (Bohr, cit. in Kumar, 2012, p. 9). Penso si possa tranquillamente affermare che nessuno capisce la meccanica quantistica (Feynman, cit. ivi, p. 340).
C’è un aspetto che, tuttavia, domina al momento su tutte le obiezioni: la meccanica quantistica è la teoria più precisa che abbiamo per descrivere il nostro universo e, insieme alla relatività generale, la più completa.
meccanica quantistica
263
Per dare un’idea della precisione riportiamo due valori di una certa grandezza che può essere misurata in laboratorio e calcolata dalla teoria con grande precisione: il momento magnetico dell’elettrone. Questa grandezza, secondo la fisica classica, dovrebbe essere esattamente uguale a 1 in unità del cosiddetto “magnetone di Bohr”3. I dati, però, risultano leggermente diversi e questa differenza, che chiameremo a, può essere calcolata utilizzando il modello completo della meccanica quantistica. Ecco i risultati: 1. dell’esperimento (cfr. Hanneke, Fogwell Hoogerheide, Gabrielse, 2011): a eexp = 0,001 159 652 180 73 ± 0,000 000 000 000 28 2. della teoria (cfr. Aoyama et al., 2015): a eteo = 0,001 159 652 181 64 ± 0,000 000 000 000 76 Questo vuol dire che la teoria prevede ciò che poi viene misurato con una precisione relativa di circa 6 ∙ 10–10. Tanto per dare un’idea di questa precisione, sarebbe come avere una teoria che calcola la distanza in linea d’aria fra un ago inserito sulla cima dell’obelisco in piazza del Popolo a Roma e un altro ago messo sulla punta della Madonnina del duomo di Milano, che è di circa 500 km, con la precisione di 0,3 mm (3 decimi di millimetro!), e di poter controllare che la previsione è in accordo con la misura fatta. 7.1.3. Nascita e primi passi della meccanica quantistica: Planck, Einstein, Bohr, de Broglie Ripercorriamo le diverse tappe della storia della meccanica quantistica. 1. 1900, Planck: la meccanica quantistica nasce il 14 dicembre 1900 quando Planck affronta e risolve il problema dell’emissione di energia infinita da parte di un corpo nero presentando una relazione alla Società di fisica tedesca (cfr. Planck, 1900). Il problema è questo: supponiamo di avere una scatola vuota, cioè un contenitore chiuso con le pareti a una certa temperatura T, uniforme, quindi in contatto con una sorgente a temperatura T. Le cariche elettriche presenti nelle pareti si muoveranno a causa dell’agitazione termica, perciò emetteranno una radiazione elettromagnetica che riempirà la ca-
264
fisica per filosofi
vità. A loro volta le onde elettromagnetiche presenti nella cavità, urtando contro le pareti della scatola, trasferiranno energia elettromagnetica alle pareti. All’equilibrio si raggiungerà una situazione in cui l’energia trasferita ogni secondo dalle pareti al campo elettromagnetico presente nella scatola sarà uguale all’energia trasferita ogni secondo dal campo elettromagnetico alle pareti. Pertanto, si potrà calcolare l’espressione del cosiddetto “spettro elettromagnetico” della radiazione all’interno della scatola, che sarà una funzione della frequenza delle onde elettromagnetiche e della temperatura T delle pareti della scatola. Questa funzione era stata calcolata, era la cosiddetta “legge di Rayleigh-Jeans”. Facendo ora un piccolo foro su una delle pareti si può calcolare l’energia elettromagnetica che esce dal foro ogni secondo, per unità di superficie. Il grosso problema di questa espressione è che, eseguendo il calcolo su tutte le frequenze possibili, si ha come risultato il grafico della fig. 7.1a. L’intensità totale della radiazione emessa è proporzionale all’area sotto la curva; ma la curva tende all’infinito, quindi anche l’intensità della luce emessa risulta infinita. Questo ovviamente non è vero. D’altronde la curva descrive correttamente i dati sperimentali per le basse frequenze, perciò non può essere completamente errata. Inoltre, viene derivata dalle equazioni di Maxwell che si sono dimostrate corrette in moltissime applicazioni. È un problema a cui per un bel po’ nessuno sa trovare una soluzione. Il punto critico è che nella formula deve apparire come variabile la temperatura, dunque la termodinamica, e combinare formule dell’elettromagnetismo (quindi, dei campi elettromagnetici) con quelle della termodinamica (il mondo dell’irreversibile) non è una questione semplice. Planck risolve il problema con un’ipotesi ad hoc: per ogni frequenza l’energia fra radiazione (luce) e materia deve essere scambiata per multipli interi di una grandezza costante: il quanto di energia. Il quanto di energia, per un’onda di frequenza f, vale E = hf; h = 6,63 ∙ 10–34 J ∙ s è la costante di Planck. Da dove viene questa assunzione? In realtà Planck inizia individuando il problema nel come scrivere l’entropia legata alla radiazione elettromagnetica e arrivando in seguito all’ipotesi della quantizzazione dell’energia elettromagnetica scambiata con le pareti. Scrive Planck: alla fine iniziai a costruire espressioni per l’entropia completamente arbitrarie che […] sembravano soddisfare quasi completamente tutti i requisiti della termodinamica e della teoria elettromagnetica. Sono stato particolarmente attratto da una delle espressioni così costruite […] che, per quanto si può giudicare al
meccanica quantistica
265
figura 7.1 Andamento dell’intensità della radiazione che uscirebbe da un contenitore a una certa temperatura T in funzione della frequenza f dell’onda elettromagnetica (a)
(b)
Intensità di radiazione
Legge di Rayleigh-Jeans Curva classica Curva quantistica Accordo tra le curve a frequenze molto basse Frequenza Previsioni teoriche
Intensità di radiazione (MJy/sr)
Verso la catastofe ultravioletta 400 300
T = 2,728 ± 0,004 K
200 100 0
0
150
300 450 Frequenza (GHz)
Risultati sperimentali, legge di Planck
(a) Previsioni teoriche secondo la legge di Rayleigh-Jeans e secondo l’ipotesi di Planck. (b) Risultati dell’esperimento cobe sulla misura della radiazione di fondo cosmico, dati da Fixsen (1996). Le barre di errore corrispondono a 400 σ (deviazioni standard).
momento, interpola i dati sperimentali sinora pubblicati con la stessa precisione delle migliori equazioni proposte per lo spettro [della radiazione] […]. Mi permetto pertanto di attirare la vostra attenzione su questa nuova formula che io considero la più semplice possibile dal punto di vista della teoria elettromagnetica della radiazione […]. Se E [l’energia del campo elettromagnetico] è considerata come una quantità divisibile in modo continuo, questa distribuzione è possibile in un numero infinito di modi. Tuttavia, noi supponiamo – questo è il punto essenziale di tutto il procedimento – che E sia composta di un numero ben definito di parti uguali e useremo d’ora innanzi la costante della natura h = 6,55 × 10−27 erg sec. Questa costante, moltiplicata per la frequenza f dei risonatori ci dà l’elemento di energia ε (Planck, 1900).
Quindi, l’espressione in cui compare la quantizzazione dell’energia nasce dal tentativo di avere una formula matematica che fornisse delle previsioni accettabili. Planck non spiega perché funziona… ma funziona! Le previsioni teoriche descrivono perfettamente i dati sperimentali (cfr. fig. 7.1b).
266
fisica per filosofi
2. 1905, Einstein: il 17 marzo 1905 Einstein risolve il problema dell’effetto fotoelettrico (cfr. Einstein, 1905b); se mandiamo luce su un metallo possiamo “strappare” elettroni al metallo, ma solo se la luce ha una frequenza minima. La descrizione classica dell’esperimento è questa: dentro ogni metallo ci sono degli elettroni liberi di muoversi. Per strappare questi elettroni al metallo serve una certa energia di soglia Es che dipende dal metallo. Se inviamo della luce (onde elettromagnetiche) sul metallo questa interagirà con gli elettroni cedendo loro l’energia associata alla sua intensità. Questa intensità, secondo le leggi dell’elettromagnetismo, è proporzionale al quadrato dell’ampiezza dell’onda. Quindi, se con una certa ampiezza non riusciamo a estrarre gli elettroni dovrebbe essere sufficiente aumentare l’ampiezza e, dunque, l’intensità della luce incidente per arrivare a strapparne un certo numero. Questo comportamento non è verificato dall’esperienza. Quello che si trova sperimentalmente è che la chiave per strappare elettroni al metallo sta nella frequenza del segnale luminoso. Se la luce ha una frequenza inferiore a una certa frequenza di soglia fs non si riescono a strappare elettroni, indipendentemente dall’intensità della luce inviata sul metallo. Ma se si supera anche di poco la frequenza di soglia allora inizia il processo fotoelettrico. Si ha perciò un’emissione di elettroni strappati al metallo che risulta poi proporzionale all’ampiezza dell’onda (cfr. fig. 7.2). La spiegazione data da Einstein nell’articolo per cui gli verrà dato il premio Nobel nel 1921, è la seguente. L’energia della luce è distribuita nello spazio con discontinuità: la luce è trasportata da fotoni di energia E = hf. Se abbiamo più fotoni, abbiamo più energia, E(n) = n ∙ hf, ma ogni singolo fotone continua ad avere la stessa energia hf. Il processo dell’estrazione degli elettroni dal metallo è questo: si invia luce di una certa frequenza f sul metallo. Ogni fotone, se interagisce con un elettrone, gli può cedere al massimo l’energia hf. Se questa energia è maggiore dell’energia di soglia (se, cioè, hf ≥ ES), allora possiamo strappare l’elettrone al metallo. Se questa energia è minore non c’è niente da fare, possiamo inviare anche molti fotoni al secondo sul metallo – aumentando l’intensità della luce – ma ogni fotone interagirà singolarmente con un elettrone, perciò nessuno di questi riuscirà a strappare l’elettrone al metallo. Le relazioni che si derivano da questa ipotesi confermano i dati sperimentali. La luce è composta di fotoni. Ma c’è un problema: la luce non era un’onda?
meccanica quantistica
267
figura 7.2 Schema di principio dell’effetto fotoelettrico
Singoli fotoni di energia Ef = hf Elettroni nel metallo con energia di soglia ES Metallo Nel metallo sono presenti degli elettroni. Inviando luce sulla superficie metallica riusciamo a strappare gli elettroni al metallo, ma solo se la frequenza della luce è tale che ogni fotone abbia un’energia maggiore o uguale dell’energia di soglia Es necessaria per estrarre gli elettroni dal metallo.
Se la radiazione, ossia la luce, è quantizzata, perché non vediamo tanti lampi luminosi in sequenza quando guardiamo una luce? Tralasciamo per il momento il problema – che affronteremo nei paragrafi successivi – di descrivere lo stesso oggetto come un’onda oppure come una quantità discreta. Il problema di non vedere i singoli fotoni come singoli lampi di luce è lo stesso per cui quando raccogliamo un po’ di acqua con la mano non vediamo le singole molecole di acqua. Sono troppe e troppo piccole. Analogamente l’energia del singolo quanto di luce – il fotone – è molto piccola. Supponiamo, per esempio, di avere una lampadina molto debole che emette una luce rossa con la potenza di 1 W. Questo vuol dire che ogni secondo viene emessa un’energia di 1 J. E supponiamo che tutta questa energia arrivi dentro il nostro occhio. L’energia di 1 Joule in fotoni “rossi” corrisponde a un numero di fotoni N = 1 J/(Energia di un fotone “rosso”) = 1/hf = 1/(6,6 ∙ 10–34 ∙ 450 ∙ 1012) ≅ 3 ∙ 1018 fotoni! Sono tre miliardi di miliardi di fotoni al secondo. Per questo non vediamo i singoli fotoni. 3. 1913, Bohr: nel 1913 Bohr (1885-1962) propone alcune ipotesi per spiegare la stabilità degli atomi e le righe spettrali. La sua teoria si basa su tre postulati: a) in un atomo, quindi in uno stato legato e stabile con gli elettroni che “ruotano” intorno ad esso, gli elettroni possono muoversi con le leggi della fisica classica solo su orbite chiuse che soddisfino la condizione che il
268
fisica per filosofi
momento angolare dell’elettrone sia un numero intero di volte la costante di Planck diviso per 2π. La condizione di quantizzazione, dunque, è: h L = mvr = n = nħ , il simbolo ħ = h/2π, è chiamato “h tagliato”. 2π b) un elettrone che ruota su un’orbita definita dalla relazione esposta nel punto a non emette radiazione, quindi la sua energia E rimane costante; c) un elettrone che ruota su una delle orbite di cui sopra può assorbire o emettere energia elettromagnetica solo se salta da un’orbita all’altra. In questo caso la frequenza f dell’onda elettromagnetica scambiata soddisfa la relazione: hf = E2 – E1 Deve essere chiaro che queste tre sono solo delle ipotesi, che oltretutto sembrano abbastanza incoerenti. Bohr utilizza alcune formule della fisica classica, la forza di Coulomb che si esercita fra le cariche, le relazioni fra momento angolare, energia cinetica e energia potenziale ecc., mentre ne rigetta altre imponendo delle condizioni che sono in contrasto con la teoria classica: gli elettroni che si trovano su un’orbita hanno un’accelerazione diversa da zero, ma non emettono energia. Eppure la “teoria” funziona. Svolgendo alcuni semplici conti si possono calcolare i raggi su cui orbitano gli elettroni, le energie di ogni elettrone per ogni singola orbita e le lunghezze d’onda delle righe di emissione4 degli atomi investiti da radiazione elettromagnetica (cfr. fig. 7.3). Le lunghezze d’onda delle righe osservate sperimentalmente erano descritte dalla formula empirica, trovata nel 1888 da Johannes Rydberg: 1 1 1 = RH ( 22 – n2 ) dove n = 3, 4, 5. Queste lunghezze d’onda, per λ piccoli valori di n, sono descritte correttamente dalle ipotesi di Bohr. Quindi, il modello di Bohr descrive correttamente i valori delle lunghezze d’onda relative alle righe emesse dagli atomi, spiega perché gli atomi sono stabili, spiega perché sono tutti identici. Ma resta il problema: perché l’elettrone si comporta così? A questa domanda Bohr non dà risposta. Non si sa come, ma funziona. 4. 1924, de Broglie: nella sua tesi di dottorato presentata nel 1924, LouisVictor P. R. de Broglie (1892-1987) propone un’ipotesi teorica rivolu-
meccanica quantistica
269
figura 7.3 Righe di emissione/assorbimento di un atomo in cui gli elettroni saltano da un’orbita all’altra Emissione/assorbimento nel visibile
Livelli energetici 5 4 3 2 1
Nucleo atomico
Emissione/assorbimento nell’ultravioletto Orbite degli elettroni
+
Le righe corrispondono alle frequenze per cui vale la relazione hf = Ei – Ej, dove Ei ed Ej sono le energie dei livelli di partenza/arrivo. In figura sono mostrate alcune delle transizioni relative alle prime due serie caratteristiche di ogni atomo che corrispondono a scambi con il primo livello energetico (luce ultravioletta) o con il secondo livello (luce nel visibile).
zionaria. A ogni particella di massa m e velocità v è “associata” un’onda di lunghezza d’onda λ: λ=
h mv
Ogni particella, quindi, si comporta anche come un’onda. Al momento non è chiaro cosa voglia dire, quello che conta è che per descrivere le proprietà della particella, per esempio dell’elettrone che ruota intorno al nucleo, dovremo utilizzare le leggi della fisica che si riferiscono all’elettrone come a una particella puntiforme – per esempio, per calcolare la forza che si esercita fra l’elettrone e il nucleo – e, allo stesso tempo, le leggi delle onde considerando l’onda associata di lunghezza d’onda λ. Questa ipotesi – per ora bizzarra – spiega egregiamente il modello di Bohr. Se, infatti, consideriamo un’onda che si trova su una circonferenza chiusa – come se fosse l’onda associata a una corda che vibra – allora il moto stazionario5 della corda non può essere un moto qualunque. La corda, nelle sue oscillazioni, deve soddisfare le condizioni al contorno, cioè dopo un giro si deve “richiudere” con delle precise relazioni di fase per permettere alla corda di continuare a oscillare con la stessa lunghezza d’onda. Altrimenti avremmo un’interferenza distruttiva e il moto della corda, dunque la sua l’oscillazione, andrebbe rapidamente a zero (cfr. fig. 7.4).
270
fisica per filosofi
figura 7.4 Schema ideale di una corda chiusa ad anello che vibra su una circonferenza media di lunghezza L (a)
(b) L
λa
λb L = n λb
L ≠ n λa
La lunghezza L della circonferenza è un multiplo intero della lunghezza d’onda λb con cui vibra la corda
La lunghezza L della circonferenza non è un multiplo intero della lunghezza d’onda λa con cui vibra la corda
Nel caso (a) abbiamo L ≠ nλa; la corda non si chiude esattamente su sé stessa, l’oscillazione non può essere stazionaria. Nel caso (b), invece, L = 8λb; la corda si chiude su sé stessa e può avere oscillazioni stazionarie. Nei disegni l’ampiezza dell’oscillazione è stata aumentata per maggiore visibilità; va considerato che in realtà l’oscillazione è molto piccola, quindi quasi coincidente con la circonferenza.
La condizione perché esista un’onda stazionaria in una corda che vibra lungo una circonferenza di raggio medio r è, allora: 2πr = n ∙ λ Se ora sostituiamo al valore di λ quello della particella cui è associato secondo l’ipotesi di de Broglie avremo: 2πr = n ∙ λ = n ∙
h mv
che, riscritta, diventa: mvr = n ∙
h = nħ 2π
meccanica quantistica
271
Siamo arrivati, cioè, all’ipotesi di Bohr. Questa posizione giustifica l’ipotesi della quantizzazione del momento angolare proposta da Bohr, ma introducendo una nuova ipotesi: che a ogni particella puntiforme (per ora) sia associata un’onda delle cui caratteristiche bisogna tener conto per prevedere il comportamento della particella. Non è ancora una “spiegazione”, anzi sembra introdurre un nuovo elemento, ma vedremo come questa ipotesi sia la più vicina alla realtà del mondo microscopico. Resta, tuttavia, un problema: de Broglie afferma che a ogni particella è associata un’onda, e con questa assunzione dà una giustificazione alla quantizzazione delle orbite atomiche. Ma perché, allora, non la utilizziamo per descrivere il moto di un corpo molto più grande, come quello dei pianeti intorno al Sole, che non sembrano avere orbite quantizzate? La questione, per il momento, è squisitamente numerica, non concettuale. La lunghezza d’onda di de Broglie associata a un corpo è λ = h/mv e gli effetti legati alle proprietà delle onde diventano osservabili quando il corpo interagisce con oggetti delle dimensioni di λ. È analogo a ciò che succede con le onde luminose. Se un raggio di luce incontra un oggetto “macroscopico” – una lente, per esempio –, possiamo utilizzare l’ottica geometrica per descriverne il comportamento, non siamo costretti a usare il fatto che il raggio di luce sia in realtà un’onda elettromagnetica. Ma se il raggio luminoso incontra, per esempio, delle fenditure con larghezze circa della stessa lunghezza d’onda del raggio luminoso o inferiori, allora abbiamo i fenomeni di diffrazione e di interferenza e dobbiamo utilizzare la descrizione del fascio luminoso come onda. Ed ecco le lunghezze d’onda di de Broglie associate ad alcuni oggetti appartenenti al nostro universo: a) la Terra che ruota intorno al Sole: λ=
6,6 ∙ 10–34 h ≅ 4 ∙ 10–63 m = MTVT 6 ∙ 1024 ∙ 30 ∙ 103
b) una palla da tennis molto veloce: λ=
h 6,6 ∙ 10–34 ≅ 2 ∙ 10–34 m = mv 60 g ∙ 200 km/h
c) un granello di polvere (del diametro di 1 μm e con densità di 1 g/cm3) che fluttua nell’aria: λ=
6,6 ∙ 10–34 h ≅ 1,3 ∙ 10–16 m = mv 0,5 ∙ 10–15 ∙ 1 cm/s
272
fisica per filosofi
d) un elettrone (nell’atomo di idrogeno H): λ=
h 6,6 ∙ 10–34 ≅ 3,2 ∙ 10–10 m = mv 0,9 ∙ 10–30 2,3 ∙ 106
Si vede che nei primi tre casi illustrati all’oggetto è associata una lunghezza d’onda di molti ordini di grandezza inferiore alle dimensioni non solo dell’oggetto in questione, ma di qualunque particella materiale conosciuta. Qualunque effetto legato alla natura ondulatoria del sistema è, quindi, completamente trascurabile. Invece, il raggio classico rH dell’atomo di idrogeno è di circa 1 ∙ 10–10 m; la sua circonferenza è, dunque, di circa 3,1 ∙ 10–10 m, che è dello stesso ordine di grandezza della sua lunghezza d’onda di de Broglie. È per questo che gli effetti ondulatori, per tale elettrone, diventano sensibili.
7.2. I principi della meccanica quantistica Nel 1927 e negli anni seguenti Schrödinger, Heisenberg, Paul Dirac e molti altri fisici, partendo dalle osservazioni precedenti, creano quella meravigliosa costruzione che è la meccanica quantistica. Formalizzata, appunto, nel 1927 verrà implementata e modificata negli anni successivi, mantenendo però il significato e la struttura data inizialmente dai suoi fondatori. Ne daremo qui una versione molto semplificata, conservando i punti concettualmente importanti. In particolare, discuteremo in dettaglio alcuni esperimenti tipici per dare un’idea di come funzioni la teoria quando viene applicata alle osservazioni fatte o che vorremmo fare. La meccanica quantistica ha la particolarità di essere stata enunciata da diversi scienziati utilizzando formalismi diversi che a prima vista sembravano completamente differenti fra di loro. Fra il 1925 e il 1927 ne nascono due versioni: quella ondulatoria, creata da Schrödinger, che utilizzerà il concetto di funzione d’onda, e quella delle matrici, creata da Heisenberg, che impiegherà il formalismo delle matrici. Sarà Dirac, qualche anno dopo, a mostrare l’equivalenza delle due formulazioni introducendo un’ulteriore modalità di descrizione. Qui parleremo della meccanica quantistica ondulatoria, più semplice da descrivere in maniera elementare e anche la più visualizzabile6. Nella tab. 7.1 abbiamo riportato i più importanti principi della meccanica quantistica confrontandoli con quelli della meccanica classica per avere un’idea delle maggiori differenze fra questi due approcci. Nella ta-
meccanica quantistica
273
tabella 7.1 Estratto semplificato dei principi della meccanica quantistica ondulatoria confrontati con i principi della fisica classica I principi della meccanica quantistica (1927)
I principi della fisica classica
Lo stato di un sistema è dato assegnando la sua funzione d’onda ψ(x, t) che contiene tutta l’informazione relativa al sistema; la funzione d’onda è un’ampiezza di probabilità complessa, non può essere misurata direttamente.
Lo stato di un sistema* è dato assegnando la posizione, la velocità, il tempo, la massa, la carica ecc.; ognuna di queste grandezze può essere misurata, in linea di principio.
Si ha che P(x, t) = |ψ(x, t)|2; il modulo quadro della funzione d’onda permette di calcolare la probabilità di trovare il sistema nella posizione x, al tempo t, se venisse misurato**.
Se effettuiamo una misura (per esempio, della posizione del sistema) abbiamo un risultato deterministico x, soluzione delle equazioni del moto, che esprime dove fosse il sistema nell’istante della misura.
L’evoluzione temporale di un sistema si ha risolvendo l’equazione di Schrödinger: iħ(∂ψ/∂t) = Hψ, dove H è una funzione, che agisce sulla funzione d’onda, legata all’energia totale del sistema (l’equazione di Schrödinger è deterministica).
L’evoluzione temporale di un sistema si ha risolvendo il sistema di equazioni del – secondo principio della dinamica: F = m ∙ ā = dp̄/dt. Le soluzioni sono le equazioni del moto del sistema.
Principio di indeterminazione di Heisenberg: alcune coppie di grandezze non possono essere misurate contemporaneamente con una precisione arbitraria; secondo la teoria non possiedono contemporaneamente valori fisici definiti.
Le grandezze che descrivono un corpo sono indipendenti e, in linea di principio, possono tutte essere misurate anche contemporaneamente, con un’incertezza che dipende dall’operazione di misura.
Principio di esclusione di Pauli: due fermioni*** identici non possono stare nello stesso stato individuale. – – Le forze (le interazioni) F necessarie per scri- Le forze (le interazioni) F sono quelvere l’energia di un sistema (l’equazione di le dovute al campo gravitazionale e ai – – Schrödinger) sono quelle dovute ai campi campi elettromagnetici E e B . – – elettromagnetici E e B ; in seguito verranno aggiunte le interazioni deboli (1933, Enrico Fermi) e quelle forti (1953, Murray Gell Mann) e un’altra interazione, il cosiddetto “campo di Higgs” (2012), che determina le masse di alcune particelle ; il campo gravitazionale non è inserito nella descrizione della meccanica quantistica * Per semplicità consideriamo qui un sistema semplice, una piccola sfera materiale che si può muovere in una sola direzione, la x. Se avessimo un sistema più complicato dovremmo dare le sue dimensioni spaziali, la sua forma, la composizione chimica ecc. Ma la sostanza non cambia. ** Rigorosamente se la variabile x fosse continua dovremmo parlare di una densità di probabilità dP(x, t) = |ψ(x, t)|2 dx associata alla probabilità di trovare il sistema nell’intervallo dx. Qui e in seguito trascureremo questo dettaglio formale. *** I fermioni sono le particelle, sempre dotate di massa, che compongono la materia (cfr. par. 8.2).
274
fisica per filosofi
bella alcune formule sono state semplificate per non appesantire troppo la trattazione aggiungendo simboli nuovi. In particolare, si suppone che il sistema si possa muovere in una sola direzione (la x), quindi servirà una sola variabile per determinarne la posizione nello spazio. Il cuore della meccanica quantistica, nella formulazione di Schrödinger, consiste nel descrivere lo stato di un sistema, di un qualunque sistema, assegnandogli una certa funzione, chiamata funzione d’onda, e nel calcolare il risultato di una qualunque misura fatta sul sistema tramite operazioni algebriche fatte su questa funzione d’onda e sull’equazione di Schrödinger che ne determina l’evoluzione nel tempo. Nei paragrafi successivi vedremo di chiarire il significato da attribuire alla funzione d’onda e come si può operare su di essa per prevedere il comportamento di un qualunque sistema fisico. 7.2.1. La funzione d’onda Il primo principio della meccanica quantistica afferma: La descrizione dello stato di un sistema (di una particella, per esempio) è data dalla funzione d’onda ψ(x, t).
La funzione d’onda è una funzione complessa, quindi è formata da due parti, una reale e una immaginaria (ψ = ψRe + iψIm). La funzione d’onda, che contiene tutta l’informazione relativa al sistema, è un’ampiezza di probabilità.
Questo vuol dire che la funzione d’onda non rappresenta una grandezza fisica misurabile direttamente – come potrebbe essere, per esempio, la posizione di un corpo, la sua massa o la frequenza con cui sta vibrando una corda – ma è una funzione matematica. Tale funzione è legata alla probabilità di ottenere un certo risultato per una qualunque misura che volessimo fare sul sistema. In particolare, il modulo quadro della funzione d’onda è legato alla probabilità di trovare il sistema (la particella) in un certo intervallo di spazio e in un certo istante (legge di Born; cfr. Born, 1927). dP = |ψ|2 dx è la probabilità di trovare la particella nell’intervallo dx se la particella viene misurata. ₁ |ψ| indica il modulo della funzione d’onda: |ψ| = +[ψ2Re + ψ2Im]−₂ .
meccanica quantistica
275
Questo è un punto importante cui prestare attenzione: la probabilità così calcolata non è la probabilità che la particella si trovi in un certo stato, che venga misurata oppure no, dando per scontato che la particella si troverà sicuramente in un certo stato. Se non viene misurata la particella non ha una posizione definita. La particella ha, in potenza, la probabilità di essere trovata – in seguito a una misura – in una certa zona di spazio. E questa probabilità non è epistemica, non è dovuta, quindi, a una nostra mancanza di informazione. Si tratta di una probabilità intrinseca al sistema. La probabilità classica, invece, è una probabilità epistemica legata a una nostra mancanza di informazione su molti parametri del sistema (cfr. par. 3.8.1). Se conosciamo la funzione d’onda in un certo istante quello che vorremmo sapere è come evolverà questa funzione nel tempo. Il comportamento nel tempo e nello spazio di particella di massa m, soggetta a un potenziale V(x, t) è descritto dall’equazione di Schrödinger: iħ
ħ2 ∂ ∆ψ (x, t) + V (x, t) ψ (x, t) ψ (x, t) = Hψ (x, t) = – 2m ∂t
L’equazione di Schrödinger permette di calcolare l’espressione della ψ(x, t) e la sua evoluzione nel tempo e nello spazio. Sostituisce il secondo principio della dinamica di Newton.
È importante notare che il risultato dell’equazione di Schrödinger è completamente deterministico, non è probabilistico. Pertanto: 1. dato un sistema e le forze che agiscono su di esso (o i campi in cui è immerso) possiamo calcolare esattamente quale sarà la funzione d’onda e la sua evoluzione nel tempo; 2. data la funzione d’onda in un qualunque istante potremo calcolare (solo) la probabilità di trovare la particella di massa m in un certo punto o altre sue caratteristiche fisiche… «e più non dimandare» (Dante, Inferno, iii, v. 96). Vediamo ora di fare un esempio di come viene trattato un caso molto semplice dalla meccanica classica e dalla meccanica quantistica. Consideriamo una particella (una pallina) di massa m, di estensione trascurabile, posta su un piano orizzontale senza attrito. Supponiamo anche di trovarci sulla Terra, quindi esisterà la forza di gravità, ma questa forza, essendo diretta secondo la verticale, non avrà nessuna influenza sul moto della particella in direzione orizzontale.
276
fisica per filosofi
Calcolo del moto di una particella secondo la meccanica classica. Lanciamo la particella in una certa direzione perpendicolare alla forza di gravità (la x, per esempio) con una certa velocità v0. Il moto della particella può essere calcolato utilizzando la seconda – legge di Newton. In questo caso avremo F = m ∙ ā, che, scritta lungo l’asse x, diventa Fx = m ∙ ax; ma la forza è nulla, perciò avremo: 0 = m ∙ ax, quindi ax = 0. Questa è un’equazione differenziale che, risolta, fornisce la velocità e la posizione della particella in funzione del tempo: v(t) = v0 ; x(t) = v0 ∙ t dove abbiamo supposto che all’istante iniziale t = 0 la particella si trovasse nell’origine, vale a dire in x = 0, con velocità v0 in direzione x. Si tratta di un moto rettilineo uniforme. Se volessimo sapere la posizione della particella in un certo istante t* ci basterebbe sostituire il tempo nella formula relativa e potremmo sapere/prevedere che la particella, nell’istante t*, si troverà nel punto x* = v0 ∙ t*. Questa posizione è esatta, nel senso che le incertezze che potremmo avere dipendono solo dall’incertezza con cui abbiamo misurato velocità e posizione iniziali e di quella con cui vogliamo determinare il tempo. Ma si tratta solo di incertezze sperimentali. In linea di principio possiamo essere precisi quanto vogliamo. E se misuriamo la posizione della particella troveremo un valore in accordo con quello previsto, sempre entro le incertezze della misura. Calcolo del moto di una particella secondo la meccanica quantistica. Il punto di partenza è esattamente lo stesso. Una particella lanciata in direzione x con velocità iniziale v0 in direzione x su un piano senza attrito7. Dobbiamo scrivere l’equazione di Schrödinger (che sostituisce F = m ∙ a) e risolverla per questo caso particolare con le condizioni iniziali che abbiamo posto. Il procedimento è laborioso, possiamo dare il risultato finale: la soluzione dell’equazione di Schrödinger sarà la funzione d’onda associata alla particella; ne scriviamo una tipica per una particella 5 libera, non soggetta, cioè, a forze8: ψ(x, t) = ∑1 Ai cos (kix + ωit). Non è necessario discutere i dettagli di questa funzione, l’importante è notare che si tratta della somma di varie onde che si propagano nello spazio (x) e nel tempo (t). Queste onde hanno ognuna un’ampiezza Ai e una lunghezza d’onda λi = 2π/ki. La frequenza fi = ωi/2π è legata alla velocità di propagazione dell’onda vi = λi ∙ fi.
meccanica quantistica
277
figura 7.5 Grafico delle cinque onde che compongono la funzione d’onda associata alla particella libera in funzione della variabile x, in ascissa, calcolate al tempo t = 0 ψi (x, t) 3
ψ1
2
ψ2 ψ3 ψ4 ψ5
1 -40
-20
20
40
–1 –2 –3 5
ψ (x, t) = ∑i ψi (x, t) '
La somma algebrica di queste cinque onde è la funzione d’onda.
Il risultato della somma delle onde di cui al grafico della fig. 7.5 è il cosiddetto “pacchetto d’onde” mostrato nella fig. 7.6. Questa denominazione sta a indicare che l’onda risultante non è più un’onda estesa da meno infinito a più infinito come erano le onde di partenza, ma la parte sensibilmente diversa da zero è compresa tutta all’interno di un certo intervallo spaziale, in cui si trova, appunto, il pacchetto d’onde risultante. E analogamente è limitata nello spazio la funzione P(x) legata alla probabilità di trovare la particella in un punto se eseguissimo una misura di posizione. È utile fare un grafico di questa funzione, fissato, per esempio, un certo istante t = t*, in funzione della posizione x, e il grafico corrispondente della P(x, t) associata alla funzione d’onda. Nella fig. 7.6 abbiamo il grafico della funzione d’onda (parte reale e parte immaginaria) corrispondente alla somma delle cinque onde viste sopra, e della probabilità P(x, t) calcolata facendo il modulo quadro di ψ(x, t)9. Vediamo ora l’evoluzione temporale del moto della particella. Dovremo utilizzare sempre la soluzione dell’equazione di Schrödinger e vedere come evolve in funzione del tempo data la condizione iniziale. Nella fig. 7.7 abbiamo riportato un grafico (approssimato) di tre probabilità P(t) = |ψ(x, t)|2 per tre istanti di tempo diversi. Si può vedere come allo scorrere del tempo succedono vari fenomeni. La curva si
278
fisica per filosofi
figura 7.6 Grafico della funzione d’onda corrispondente alla somma delle cinque onde della fig. 7.5 e della probabilità P(x, t) (a)
(b)
ψRe (x, t*)
Parte reale
P(x, t* ) = | ψ( x, t* )| x
t = t*
Parte immaginaria
ψIm (x, t*)
x
2
x0
x
x0 (a) Pacchetti d’onde ψ(x, t*) che descrivono la funzione d’onda al tempo t = t*; viene mostrata sia la parte reale che quella immaginaria. (b) Probabilità P(x, t*) associata alla funzione d’onda mostrata in (a). Entrambe le figure sono centrate nel punto x = x0.
sposta verso destra, in particolare il centro della curva – cioè, la coordinata del massimo, che corrisponde alla posizione più probabile del centro di massa della particella – si sposta verso destra con velocità v0, il moto di questo punto è lo stesso che si avrebbe calcolando il moto con la seconda legge di Newton. La curva ha una certa “larghezza” che aumenta con il tempo, l’indeterminazione di un’eventuale misura aumenta. Il valore del massimo si abbassa: questo serve a garantire che l’integrale – ossia, l’area sotto la curva – sia sempre uguale a 1; in altri termini, la probabilità di trovare la particella in un qualunque punto dello spazio – se la particella esisteva all’istante iniziale – deve essere la certezza. E adesso vediamo un punto fondamentale: cosa succede se a un certo istante di tempo decidiamo di misurare una delle grandezze che caratterizzano la particella. Supponiamo di volerne misurare la posizione x. Daremo ora l’interpretazione della meccanica quantistica proposta nel 1927 da Bohr e da Heisenberg. È la cosiddetta “interpretazione di Copenaghen”, dalla città dove Bohr lavorava e dove aveva creato un cenacolo di studi sulla meccanica quantistica; questa dizione fu utilizzata per la prima volta da Heisenberg nel 1955 (cfr. Kumar, 2012).
meccanica quantistica
279
figura 7.7 Grafico approssimativo di tre probabilità P(x, t) = |ψ(x, t)|2 per tre istanti di tempo diversi t0, t1 e t2 P(x, t)
t = t0 P(x, t0)
t0 < t1 < t2 t = t1 P(x, t1)
t = t2
P(x, t2)
x
La funzione d’onda iniziale è quella associata a una particella libera che si muove in direzione x con una certa velocità iniziale v0 verso destra.
L’interpretazione alla Copenaghen dice questo: se eseguiamo una misura sulla particella per determinarne la posizione, allora la relativa funzione d’onda “collassa” intorno al risultato della misura. La funzione d’onda cambia forma, diventa molto stretta (attenzione, non infinitamente stretta), la posizione, appena dopo la misura, è “praticamente certa”. Di tutti i risultati possibili che avevamo prima della misura se ne attualizza uno solo. A questo punto, se non compiamo nessuna ulteriore misura, l’evoluzione del sistema ricomincia a essere descritta dalla nuova equazione di Schrödinger, scritta con le nuove condizioni iniziali. Abbiamo detto che la localizzazione della particella avviene quando facciamo una misura di posizione. Qualcuno – stiamo parlando anche di Heisenberg o Bohr (per alcuni dettagli, cfr. Percorso storico-filosofico 8) – poteva/può essere indotto a pensare che, quindi, la localizzazione avvenga solo se interviene una “persona” che fa una misura. Pertanto, che in un universo senza persone senzienti le particelle non verrebbero mai localizzate, attribuendo questa localizzazione addirittura alla consapevolezza di un essere senziente. Non è corretto. Ciò che causa il collasso della funzione d’onda è una qualunque interazione del mondo esterno con il sistema in esame. L’interazione, specie nel mondo microscopico, può essere dovuta anche a un’interazione debolissima, per esempio a un solo fotone che urta la particella. Vedremo meglio questo punto
280
fisica per filosofi
discutendo l’esperimento delle due fenditure nel par. 7.3, ma per ora deve essere chiaro che una misura è semplicemente un’interazione con il mondo esterno, ci sia o no qualcuno che poi osserva il risultato di questa interazione. 7.2.2. Il significato della probabilità in meccanica quantistica In meccanica classica la probabilità associata a un evento è dovuta al fatto che, in genere, non conosciamo tutte le variabili del sistema (per esempio, il lancio di un dado o il tiro con l’arco.) È la probabilità cosiddetta “epistemica” cioè legata a una mancanza di conoscenza. In teoria se potessimo misurare tutto, conosceremmo tutto e potremmo prevedere l’evoluzione dell’universo (cfr. Laplace, 1814 ). In meccanica quantistica, invece, la descrizione completa dello stato di un qualunque sistema, è data dalla funzione d’onda ψ(r, t) che rappresenta l’ampiezza di probabilità associata al sistema. La funzione d’onda ci dà il massimo dell’informazione possibile su un sistema, quindi ogni previsione che si volesse fare sui risultati di un’eventuale misura è probabilistica. È la cosiddetta probabilità “non epistemica”, ossia non dovuta a una mancanza di conoscenza dello stato iniziale di un sistema. La probabilità è intrinseca alla realtà. Questo è uno dei punti più controversi nella descrizione della realtà data dalla meccanica quantistica. Lo stesso Einstein combatté fino alla fine contro questa interpretazione, cercando la parte “mancante” della teoria che avrebbe permesso di tornare all’ipotesi di una realtà inconoscibile (per le nostre carenze sperimentali) ma definita. Come vedremo nel par. 7.4, Einstein, con Boris Podolsky e Nathan Rosen, nel tentativo di attaccare la completezza della meccanica quantistica nel 1935 portarono a rilevare un aspetto legato al formalismo della teoria: la non località di alcuni processi fisici. Essendo questa una caratteristica che allora appariva impossibile perché non coerente, per esempio, con la relatività speciale, sembrò una seria obiezione alla completezza della meccanica quantistica. Vedremo nel par. 7.6 come il problema fu risolto dai calcoli di John S. Bell e dagli esperimenti di Alain Aspect: la natura, in alcuni casi, non è locale. C’è una caratteristica importante che riguarda la funzione d’onda e l’equazione di Schrödinger: l’equazione è lineare. Questo vuol dire
meccanica quantistica
281
che se esistono due soluzioni, allora potrà esistere anche una qualunque combinazione lineare delle due soluzioni. Quindi, potrà esistere una soluzione che è la somma oppure la differenza delle due. Questa proprietà è legata al fatto che quella di Schrödinger è formalmente un’equazione differenziale lineare, la soluzione della quale è una funzione (una combinazione di funzioni) la cui forma matematica è quella di un’onda definita nel tempo e nello spazio. Come per una corda che vibra, se abbiamo due modi di vibrazione, potremo avere anche la vibrazione somma o differenza dei due, analogamente le soluzioni più generali dell’equazione di Schrödinger potranno essere somme e differenze delle soluzioni semplici (semplici onde sinusoidali), con la differenza che le soluzioni non sono stati fisici misurabili direttamente, ma ampiezze di probabilità. Ciò sarà utile nel paragrafo successivo per capire l’essenza del comportamento onda/particella dei corpi microscopici.
7.2.3. Il principio di indeterminazione Il principio di indeterminazione è uno dei cardini della meccanica quantistica: ha la sua rilevanza non solo per il suo significato formale, ma per il significato concettuale che gli si attribuisce e che, come vedremo, non è univoco. Va detto, per sgomberare il campo da equivoci, che Heisenberg nei suoi lavori non utilizzò quasi mai il termine “principio”: ricorse all’espressione “relazioni di indeterminazione” o “relazioni di inesattezza o imprecisione”, e in quasi tutte le traduzioni in altre lingue si utilizzarono vocaboli diversi. Vedremo il perché di questa ambiguità. Di tale principio daremo due versioni; una è la prima – quella che si trova in quasi tutti i libri di testo – e la chiameremo la versione soft: si riferisce all’articolo originale del 1927 (cfr. Heisenberg, 1927); la seconda, la versione che chiameremo hard, fu enunciata da Heisenberg nel 1930 (cfr. Heisenberg, 1930). Il primo aspetto è che il principio di indeterminazione viene scritto sempre per una coppia di grandezze fisiche, non per una sola grandezza. Vediamolo nella versione più nota, quella soft, in cui la coppia di grandezze fisiche è [posizione, quantità di moto], cioè [x, p]10 dove p = mv.
282
fisica per filosofi
il principio di indeterminazione (versione soft) Per ogni sistema fisico esistono alcune coppie di grandezze fisiche che non possono essere conosciute contemporaneamente con valori arbitrariamente precisi. Il prodotto delle relative incertezze dovrà essere sempre maggiore o uguale alla costante ħ. Se la coppia è [x, p] la relazione sarà: ∆x ∙ ∆p ≥ ħ.
In questa formula ∆ rappresenta l’incertezza che lo sperimentatore avrà sulle variabili che seguono il simbolo11. È importante sottolineare che le coppie di grandezze fisiche che appaiono nella relazione non sono coppie qualunque, scelte a caso fra tutte le grandezze necessarie per scrivere un sistema fisico. Il principio di indeterminazione viene scritto per tutte le coppie di grandezze che soddisfano una certa condizione, le cosiddette “grandezze coniugate”; il dettaglio va oltre gli scopi di questo libro. Il principio di indeterminazione, in questa lettura, pone un limite alla precisione con cui potremo conoscere, avendole misurate, alcune coppie di grandezze fisiche. Il punto fisico è questo: se, data, per esempio, una particella, vogliamo conoscere una delle grandezze fisiche che la caratterizzano, dovremo interagire con essa. Per esempio, se vogliamo determinarne la posizione potremo illuminarla. Ma la luce, anche se si tratta di un solo fotone, trasmetterà parte della sua quantità di moto alla particella in modo casuale12. Dunque, la particella, appena misurata, avrà una velocità e, quindi, una quantità di moto diversa – casualmente – da quella che aveva in precedenza: non potremo più conoscere con precisione quella iniziale. Questa è la versione cosiddetta “a disturbo” del principio di indeterminazione, cioè la nostra conoscenza di alcune coppie di grandezze fisiche che caratterizzano un sistema è limitata dalla nostra interazione con il sistema per cui, misurando la prima grandezza, ne rendiamo indeterminata la seconda. In questa versione, pertanto, il punto chiave è l’interazione dell’osservatore sul sistema in esame che preclude la conoscenza dello stato del sistema. Stato, che, in teoria, potrebbe essere perfettamente definito. Va detto che, anche se viene chiamato “principio”, quello di indeterminazione non è un principio per tutte le coppie di grandezze per cui possiamo scriverlo: la maggior parte delle relazioni di indeterminazione che coinvolgono coppie di grandezze fisiche può essere dimostrata a partire dal formalismo della meccanica quantistica. Heisenberg, infatti, nei suoi articoli parla di “relazioni” di indeterminazione. Solo per una coppia di grandezze fisiche non è possibile dare una dimostrazione matematica: la coppia [energia, tempo]. In questo caso si può parlare di vero e proprio principio.
meccanica quantistica
283
Vediamo qualche esempio di come funziona il principio di indeterminazione, sempre per la coppia posizione, quantità di moto. Supponiamo di avere una particella di massa m, che si muove in direzione x con velocità v. Scriveremo così il principio di indeterminazione: ∆x ∙ ∆p ≥ ħ ma p = mv, quindi: ∆x ∙ ∆mv ≥ ħ. Ora suppongo che m sia costante, e la relazione diventa: ħ h = ∆x ∙ m∆v ≥ ħ oppure: ∆x ∙ ∆v ≥ . Questa è la relazione m 2πm che ora applicheremo a vari sistemi. Consideriamo un oggetto macroscopico ma molto piccolo: un granello di polvere che fluttua nell’aria. Diamo alcuni valori realistici delle grandezze che caratterizzano il granello di polvere (per il calcolo che faremo non è necessario dare esattamente i valori che seguono, basta l’ordine di grandezza): diametro Φ ~ 1 μm; massa m ~ 10–15 kg; velocità v ~ 1 mm/s. Supponiamo ora di poter osservare il granello di polvere, a un certo istante, con un microscopio molto potente (al limite della risoluzione di un microscopio) con una risoluzione di 0,1 μm = 1 ∙ 10–7 m. Questa sarà l’incertezza con cui determiniamo la posizione del granello di polvere. Calcoliamo adesso, tramite il principio di indeterminazione, l’incertezza sulla velocità, supponendo di poterla misurare quasi contemporaneamente. Abbiamo ∆x ∙ ∆v ≥ ħ/m, quindi: ∆v ≥
ħ = 1 ∙ 10–12 m/s = 1 ∙ 10–9 mm/s! m ∙ ∆x
L’incertezza sulla velocità, dunque, esiste, ma è di un miliardesimo di millimetro al secondo per una velocità di 1 mm/s. Non riusciremo mai ad avere una misura così precisa. In pratica, la velocità è perfettamente determinata. Il principio di indeterminazione si può applicare, ma per gli oggetti macroscopici è assolutamente ininfluente per le osservazioni fatte e/o per la conoscenza che vorremo avere dell’oggetto. Tutto nasce dal fatto che a denominatore della relazione abbiamo la massa m dell’oggetto; la grandezza ħ/m è perciò molto piccola per oggetti macroscopici, al limite completamente trascurabile. Consideriamo ora un esempio microscopico, molto microscopico: l’elettrone che gira intorno al protone in un atomo di idrogeno.
284
fisica per filosofi
L’elettrone ruota con una velocità approssimativa v ≅ 2 ∙ 106 m/s; supponiamo di averne misurata la velocità con un’incertezza relativa del 10%. L’elettrone ha una massa m ≅ 9 ∙ 10–31 kg, quindi l’incertezza sulla posizione sarà: ∆x ≥
ħ 1 ∙ 10–34 ≅ 5 ∙ 10–10 m = m ∙ ∆v 9 ∙ 10–31 ∙ 0,2 ∙ 106
Ma il raggio di Bohr dell’elettrone nell’atomo di idrogeno è rH ~ 0,5 ∙ 10–10 m. Cioè, dieci volte più piccolo dell’indeterminazione. È come se dicessimo che un certo tavolo ha una lunghezza di 1 m più o meno 10 m: ha poco senso. L’indeterminazione, pertanto, non solo diventa essenziale, ma c’è qualcosa di fondamentale: con questi numeri (approssimativi) sembra che proprio non riesca a sapere dove sta l’elettrone. E ora vediamo la versione del principio di indeterminazione che abbiamo chiamato hard, enunciata con chiarezza da Heisenberg (ibid.). il principio di indeterminazione (versione hard) Per ogni sistema fisico esistono alcune coppie di grandezze fisiche che non “possiedono” contemporaneamente valori arbitrariamente precisi. Il prodotto delle relative incertezze dovrà essere sempre maggiore o uguale alla costante h/2π. Se la coppia è [x, p] la relazione sarà: ∆x ∙ ∆p ≥ ħ.
Come si può vedere, la relazione è identica alla versione soft. E infatti il punto è delicato: la differenza sta solo nell’interpretazione della relazione matematica. Nella versione soft si enunciava l’impossibilità di “conoscere” alcune grandezze fisiche. Ma in linea di principio si poteva supporre che queste grandezze possedessero dei valori definiti e che il problema era l’impossibilità nel misurarli con alta precisione. Nella versione hard, invece, si dichiara esplicitamente che alcune grandezze non possiedono valori definiti, siano esse misurate o no. È una questione di principio con un significato molto più profondo dell’azione “a disturbo” relativa alla versione soft. Vediamo come lo dice Heisenberg nelle sue lezioni del 1930. ∆x ∙ ∆px ≥ h Questa relazione di incertezza specifica i limiti entro cui si può applicare la descrizione di particella. Ogni utilizzo delle parole “posizione” e “velocità” con un’accuratezza che eccede quella data dall’equazione […] è senza significato, come l’utilizzo di parole il cui significato non è definito (ivi, p. 26).
meccanica quantistica
285
E aggiunge una nota, di seguito: A questo proposito ci si dovrebbe ricordare in particolare che il linguaggio umano permette la costruzione di frasi che non comportano conseguenze e che quindi non hanno alcun contenuto, nonostante il fatto che queste frasi producano una sorta di immagine nella nostra immaginazione; per esempio, l’affermazione che oltre il nostro mondo esiste un altro mondo, con cui ogni connessione è impossibile in linea di principio, non porta ad alcuna conseguenza sperimentale, ma non produce nessuna immagine nella nostra mente. Ovviamente questa frase non può essere né provata né falsificata. Bisognerebbe stare particolarmente attenti nell’utilizzo delle parole “realtà”, “in realtà” ecc., dato che queste parole molto spesso portano ad affermazioni del tipo già menzionato (ivi, p. 27).
La posizione di Heisenberg è questa: nel mondo microscopico abbiamo dei sistemi fisici che non possono essere descritti con le stesse parole che utilizziamo per descrivere i sistemi macroscopici13. Alcune di queste parole, nel mondo microscopico, hanno un significato limitato (o possono anche non avercelo) e non ha perciò senso che ne diamo un valore numerico esatto. Potremo applicare la descrizione classica con dei limiti, quelli dati dalle relazioni di indeterminazione. Le relazioni di indeterminazione di Heisenberg, quindi, pongono un limite di principio alla nostra possibilità di parlare dei valori che assumono alcune coppie di grandezze fisiche. Possiamo provare a chiarire questa posizione prendendo un esempio classico (nel senso della fisica classica) che ha alcuni punti in comune con quanto detto sopra. Prendiamo in esame una delle tante coppie di grandezze per cui, in meccanica quantistica, possiamo scrivere una relazione di indeterminazione: la coppia [energia, tempo]. Avremo: ∆E ∙ ∆t ≥ ħ in cui il significato è che ∆t rappresenta l’intervallo di tempo minimo necessario a un sistema per variare la sua energia di ∆E; la descrizione del significato della relazione tempo-energia è più complessa, l’abbiamo semplificata. Consideriamo ora un sistema “classico”: un suono emesso da uno strumento che arriva al nostro orecchio, o che viene registrato in un punto dello spazio. E supponiamo che questo suono sia quello emesso da un orchestrale per permettere agli altri colleghi di accordare i loro
286
fisica per filosofi
strumenti. Questo suono sarà tipicamente quello emesso dalla corda di un violino, che produrrà una nota per un tempo sufficientemente lungo. Nessuno utilizzerà come sorgente un colpo di tamburo, anche se è possibile avere un tamburo che emette una nota riferimento. Perché? Il fatto è che, se andiamo a misurare la frequenza emessa da uno strumento, sollecitato in un certo modo, avremo che essa è tanto più precisa quanto più lungo è il tempo per cui viene emessa. Mentre un suono molto breve (un colpo di tamburo, ma anche una nota di violino emessa per un tempo brevissimo) sarà composto dalla somma di molte frequenze vicine. Sarà quasi impossibile distinguere con esattezza la nota fondamentale. Quanto detto a parole non è altro che il principio della trasformata di Fourier, un teorema matematico; la trasformata di Fourier permette di esprimere una funzione che varia nel tempo in funzione delle frequenze di cui è composto il segnale. Senza addentrarci nei dettagli matematici, vediamone il significato fisico. Quello che succede è che un suono che dura un tempo molto lungo può essere rappresentato da una sola frequenza, mentre un suono molto breve sarà composto dalla somma di varie frequenze. Se caratterizziamo il suono con due grandezze – la frequenza emessa f e la durata t del segnale sonoro – avremo, per ogni tipo di segnale, anche l’incertezza sulle frequenze emesse e sulla durata del segnale: con ∆f possiamo indicare l’incertezza della frequenza emessa e con ∆t la sua durata, cioè l’incertezza sul tempo di arrivo. Bene, il teorema di Fourier stabilisce fra l’altro che fra queste grandezze esiste la relazione: ∆f ∙ ∆t ≅ 1
Questa relazione appartiene alla fisica classica e deriva semplicemente dal fatto che stiamo considerando dei fenomeni descritti da onde o da combinazioni di onde definite nello spazio e nel tempo. E ora un passaggio ardito: moltiplichiamo la relazione di cui sopra per h, la costante di Planck. Avremo h ∙ ∆f ∙ ∆t ≅ h, oppure ∆(hf) ∙ ∆t ≅ h. Ma hf è l’energia E di un fotone, in meccanica quantistica, perciò questa relazione possiamo scriverla anche come ∆E ∙ ∆t ≅ h. Notate che abbiamo mischiato variabili e proprietà quantistiche con quelle classiche: questa, quindi, non è una dimostrazione, ma serve a far vedere come utilizzando alcune variabili classiche possiamo arrivare a una relazione che coinvolge le variabili della relazione di indeterminazione di Heisenberg: energia, tempo e la costante di Planck.
meccanica quantistica
287
Il cuore di tutto è la rappresentazione, à la Schrödinger, di un sistema quantistico. Un sistema è descritto sempre da una funzione d’onda che possiede tutte le caratteristiche formali delle onde, per cui possiamo farne la trasformata di Fourier e trarne le conseguenze del caso, ricordandosi sempre che la ψ è un’ampiezza di probabilità. 7.2.4. Il principio di esclusione di Pauli Nel 1925 Pauli (1900-1958) enunciò il principio che porta il suo nome e per cui ricevette il premio Nobel per la Fisica nel 1945. Il principio può essere espresso così (cfr. Cohen-Tannoudji, Diu, Laloe, 1977): Due fermioni identici non possono trovarsi nello stesso stato individuale.
Per comprendere questa espressione è necessario chiarire il significato di alcuni termini. Intanto la parola “fermione” – che verrà ripresa nel par. 8.2. I fermioni comprendono tutte le particelle con massa che hanno uno spin semintero (± 1/2, ± 3/2, ± 5/2), dove lo spin è uno dei numeri quantici che caratterizzano qualunque particella legato al valore del suo momento angolare intrinseco. Il punto importante è che sono fermioni il neutrone, il protone, l’elettrone, quindi tutti gli atomi e tutte le molecole sono composti da fermioni. Il principio di Pauli, pertanto, possiamo applicarlo a tutta la materia stabile di cui è composto il nostro universo. Per fermioni “identici” e nello stesso “stato individuale” si intendono due fermioni del medesimo tipo, quindi o due elettroni o due protoni, che inoltre sono descritti individualmente dalla stessa funzione d’onda. Per “individualmente” si intende che sono descritti dalla stessa funzione d’onda, ognuno separatamente. Questa impossibilità riferita a fermioni identici e nello stesso stato individuale è il cuore del principio. Se consideriamo, per esempio, due elettroni identici che ruotano intorno a un protone, la loro funzione d’onda ci dice che con una certa probabilità si troveranno in una certa corona sferica che ha come raggio medio la distanza media dell’elettrone dal nucleo. Ora, in teoria, nulla ci vieterebbe di pensare a più elettroni identici che si trovano in quella corona sferica. Lo spazio sarà essenzialmente vuoto anche se avessimo decine di elettroni identici che si trovano in media alla stessa distanza dal protone. Il principio di Pauli ci dice che ciò è impossibile. In quella
288
fisica per filosofi
zona possiamo avere al massimo due elettroni, uguali in tutto eccetto che per la grandezza spin, che per uno sarà 1/2, mentre per l’altro sarà –1/2. I due elettroni, quindi, non saranno identici (saranno descritti da numeri quantici differenti, perciò anche la loro funzione d’onda sarà diversa) e potranno trovarsi nella stessa zona di spazio. Questo principio è quello che spiega l’impenetrabilità dei corpi. Classicamente nulla vieterebbe agli elettroni di due atomi di entrare gli uni nello spazio dell’altro, compenetrandosi. Gli atomi sono essenzialmente vuoti: ci sarebbe spazio a sufficienza per inserire più elettroni intorno ai nuclei. Ma il principio di Pauli vieta questa situazione, per cui la compenetrazione, che dal punto di vista spaziale o delle repulsioni elettromagnetiche sarebbe possibile, non può avvenire. Il principio di Pauli, enunciato nel 1925, ha una sua giustificazione teorica, per alcuni casi particolari, utilizzando il formalismo della meccanica quantistica sviluppato dopo il 1927, comprendente la descrizione di particelle con spin.
7.3. Un esperimento famoso: le due fenditure Per capire la natura quantistica delle particelle microscopiche e il cosiddetto dualismo onda-particella è utile discutere in dettaglio un famoso esperimento: quello delle due fenditure. Si tratta di estendere a sistemi qualunque l’esperimento delle due fenditure fatto con un raggio di luce già discusso nel par. 4.6.1. Questo esperimento è presentato in tutti libri di fisica, talvolta in maniera molto semplificata, talvolta approfondendo tutti i dettagli concettuali e formali; è praticamente impossibile darne una versione originale. Qua seguiremo l’approccio che riteniamo più utile per la comprensione dei fenomeni coinvolti pur senza troppi formalismi: quello dato da Feynman nelle sue famose lezioni e ripreso in altri suoi libri (cfr. Feynman, 2002). Concettualmente l’esperimento delle due fenditure è quello mostrato in fig. 7.8: si ha una sorgente di… (lo specificheremo), un ostacolo indistruttibile con due fenditure parallele, uno schermo su cui raccogliere, e misurare, ciò che è passato attraverso le due fenditure. Quello che faremo è di considerare l’esperimento delle due fenditure cambiando la sorgente che invia “qualcosa” verso le due fenditure e osservando cosa si vede sullo schermo posto dopo le fenditure in cui possono essere eventualmente presenti dei rivelatori di ciò che è stato
meccanica quantistica
289
figura 7.8 Schema concettuale di tutti gli esperimenti con le due fenditure
Sorgente di…
Ostacolo con due fenditure
? Schermo + rivelatore di…
Da sinistra a destra abbiamo: una sorgente che emette proiettili, fotoni (luce), particelle microscopiche; un ostacolo infinitamente rigido con due fenditure parallele; uno schermo con cui raccogliere, e misurare, ciò che è passato attraverso le fenditure.
emesso dalla sorgente. È importante sapere che gli esperimenti che illustreremo, pur avendo una parte ideale necessaria per analizzarne più facilmente i risultati, sono stati tutti realizzati in laboratorio in versioni concettualmente simili a quelle che discuteremo qui. Primo esperimento Supponiamo che la sorgente sia una pistola che spara proiettili macroscopici contro lo schermo che in questo caso è un muro con due fenditure ben più larghe della larghezza di ogni proiettile (cfr. fig. 7.9). Le ipotesi che facciamo sono queste: la pistola è “ballerina”, non è ben fissata sulla sua base, quindi spara proiettili più o meno verso le due fenditure, ma con un angolo casuale, talvolta più in alto, talvolta più in basso. I proiettili sono indistruttibili, perciò non possono dividersi in pezzi quando urtano il muro o i bordi delle due fenditure. Anche il muro è indistruttibile, dunque sia il muro che le fenditure non si rompono quando vengono raggiunte dai proiettili. La pistola spara un proiettile alla volta e sullo schermo c’è un apparato che rivela punto per punto i proiettili quando arrivano, contandoli. Per ogni configurazione, pertanto, potremo fare un grafico della probabilità che arrivi un proiettile per ogni punto dello schermo. Le fenditure, chiamate F1 e F2, possono essere tutte e due chiuse, tutte e due aperte oppure una aperta e una chiusa, potremo scegliere ognuna delle quattro configurazioni.
290
fisica per filosofi
figura 7.9 Esperimento delle due fenditure: la sorgente è una pistola che spara proiettili macroscopici in direzione casuale x
x P1
P12
F1 F2
P2
Se una sola delle due fenditure è aperta, la F1, per esempio, i proiettili passeranno per essa e sullo schermo avremo la probabilità P1. Analogamente, se è aperta solo la F2. Sullo schermo, quindi, avremo la probabilità P1 oppure la probabilità P2. Se entrambe le fenditure sono aperte i proiettili potranno passare attraverso la F1 oppure attraverso la F2. Sullo schermo, dunque, si avrà la somma delle due probabilità indipendenti P1 e P2, probabilità sarà P12 = P1 + P2.
La probabilità di arrivo dei proiettili nella posizione x e con le fenditure nella condizione C sarà: Numero di proiettili che arrivano nella posizione x | fenditure nella condizione C PC (x) = Numero di proiettili totali sparati dalla sorgente Le possibili opzioni per C sono: 1. C = 0: tutte e due le fenditure sono chiuse; 2. C = 1 oppure C = 2: solo la F1 è aperta oppure solo la F2 è aperta; 3. C = 12: tutte e due le fenditure sono aperte. Il risultato dell’esperimento è questo: 1. C = 0: tutti i proiettili urtano contro un ostacolo, sullo schermo non arriva niente. P0(x) = 0, dappertutto. 2. C = 1 oppure C = 2: i proiettili che arrivano sullo schermo passano attraverso la F1 oppure attraverso la F2; il rivelatore che conta i proiettili che arrivano sullo schermo avrà due figure associate alla probabilità di arrivo, una per la F1, P1(x), e una per la F2, P2(x). Queste figure sono un po’ allargate rispetto alla larghezza della fenditura perché qualche proiettile
meccanica quantistica
291
figura 7.10 Esperimento delle due fenditure con la sorgente che emette luce verso di esse x
x
F1 F2
I1
I12
I2
Se una sola delle due fenditure è aperta, allora sullo schermo si ha l’intensità I1 oppure l’intensità I2. Se le due fenditure sono entrambe aperte l’intensità risultante è I12. Si ha, quindi, una figura di interferenza, non la semplice somma delle intensità.
urterà il bordo della fenditura venendo deviato verso l’alto o verso il basso. P1(x) o P2(x) hanno la forma di una campana. 3. C = 12: i proiettili passeranno attraverso la F1 oppure la F2, la probabilità sarà la somma delle probabilità14 del caso precedente. P12(x) = P1(x) + P2(x). Secondo esperimento La sorgente emette luce di lunghezza d’onda λ e le due fenditure hanno una larghezza confrontabile con λ (cfr. fig. 7.10). In questo caso il rivelatore sarà un rivelatore di luce che misurerà punto per punto l’intensità della luce I(x) che arriva sullo schermo. L’intensità dell’onda è proporzionale al quadrato della sua ampiezza (massima), I ∝ A2, dove in questo caso l’ampiezza è quella del campo elettrico dell’onda elettromagnetica associata all’onda. Il risultato dell’esperimento è questo (le opzioni sono le stesse dell’esperimento precedente): 1. C = 0: non arriva luce sullo schermo. I0(x) = 0. 2. C = 1 oppure C = 2: la luce passa attraverso la F1 oppure la F2. La figura dell’intensità sullo schermo è allargata per il fenomeno della diffrazione. I1(x) ∝ |A1(x)|2; I2(x) ∝ |A2(x)|2. 3. C = 12: in ogni punto dello schermo arriva luce sia dalla F1 che dalla F2. Si ha il fenomeno dell’interferenza dei due raggi di luce. L’intensità della luce si deve calcolare prima sommando le ampiezze delle due onde e poi facendone il quadrato, per avere l’intensità totale.
292
fisica per filosofi
figura 7.11 Esperimento delle due fenditure con la sorgente che emette un elettrone per volta x
x
PP11
P12
F1
F2
P P2
2
Sullo schermo c’è un rivelatore di elettroni che si può spostare lungo lo schermo per misurare P(x), la probabilità di arrivo nelle varie configurazioni delle due fenditure.
I12(x) ∝ |A1(x) + A2(x)|2 ∝ I1(x) + I2(x) + 2 I1 (x) ∙ I2 (x) cos δ, dove δ è la differenza di fase fra l’onda che arriva dalla F1 e quella che arriva dalla F2; questa differenza di fase è un angolo che dipende dal punto di arrivo dello schermo. Potrà essere un qualunque numero fra 0 e π, quindi l’intensità presenterà una serie di massimi e di minimi: la cosiddetta “figura di interferenza”. Terzo esperimento La sorgente emette elettroni con velocità v in direzioni casuali; le fenditure hanno una larghezza confrontabile con la lunghezza d’onda di de Broglie associata agli elettroni (cfr. fig. 7.11). L’esperimento è analogo al caso dei proiettili, sullo schermo avremo un comune rivelatore (contatore) di particelle. La sorgente sarà tale da emettere un elettrone alla volta e il contatore conterà, per ogni posizione, il numero di elettroni arrivati (nella versione più sofisticata potremo avere anche tanti contatori per ogni valore della x, o addirittura una pellicola fotografica che viene impressa all’arrivo di ogni elettrone). Eseguendo l’esperimento secondo le modalità dei casi precedenti – con la F1 oppure la F2 aperta – vediamo che il contatore si comporta come nel caso del rivelatore dei proiettili: conta ogni volta che arriva un elettrone. Alla fine potremo calcolare la probabilità di arrivo misurata
meccanica quantistica
293
in ogni posizione x: avremo due curve P1(x) o P2(x) esattamente come si aveva per i proiettili. E adesso apriamo tutte e due le fenditure. Ora la curva di probabilità risultante ha la stessa forma di quella che si era ottenuta nel caso delle onde: presenta una serie di massimi e minimi, indizio, questo, che si ha il fenomeno dell’interferenza. Questo è un esperimento molto delicato e difficile, ma è stato fatto e vale la pena di vedere il risultato sperimentale: nella fig. 7.12 abbiamo le foto dello schermo quando viene raggiunto da 10, 200, …, 200 000 elettroni. Si può vedere come sullo schermo, su cui arriva un elettrone per volta, dopo circa 6 000 elettroni inizia a comparire la figura di interferenza con massimi e minimi del numero di elettroni arrivati in funzione della posizione15. Questo è un problema. Nel caso delle onde era ovvio: l’onda, che era presente in tutto lo spazio a sinistra delle fenditure, passava da entrambe le fenditure, poi si ricombinava (si sommava) sullo schermo con fasi diverse e l’intensità risultante, che ricordiamo essere il quadrato dell’ampiezza totale dell’onda, era appunto una figura di interferenza. Ma ora per le fenditure passa un solo elettrone alla volta (ricordiamoci che l’elettrone è una particella indivisibile, non possiamo avere mezzo elettrone che passa da una parte e mezzo dall’altra). Quindi, sembra che gli elettroni si comportino come onde, mentre è chiaro che partono come particelle e che arrivano come particelle (potremmo mettere altri rivelatori vicino alla sorgente per verificare che vengono emessi sempre singoli elettroni). Perché? Questo è uno degli esperimenti in cui la fisica classica non riesce a fare alcuna predizione, neanche approssimata, di quello che si osserva nella realtà. Il comportamento degli elettroni non è assolutamente spiegabile in termini classici. Ecco come questo esperimento viene trattato dalla meccanica quantistica: l’elettrone è sempre descritto da una funzione d’onda; quando si trova immerso nel filamento della sorgente la sua funzione d’onda è una funzione d’onda particolare: è localizzata. Una volta emesso, la sua funzione d’onda inizia a propagarsi nello spazio. Quando la funzione d’onda raggiunge le due fenditure si modifica, e dalle due fenditure escono due funzioni d’onda che a loro volta si propagano in tutto lo spazio a destra delle fenditure. Ogni punto dello schermo sarà raggiunto dalle due funzioni d’onda ψ1(x, t) e ψ2(x, t) uscite dalle due fenditure che si sommeranno e il cui quadrato (il modulo quadro, in realtà) darà la probabilità di trovare l’elettrone in ogni singolo punto dello schermo.
294
fisica per filosofi
figura 7.12 Risultati dell’esperimento delle due fenditure fatte con una sorgente di elettroni singoli (Tanamura, 2012) Numero di elettroni sullo schermo
10
200
6 000
40 000
6 000 200 000
Le varie figure corrispondono a raffigurazioni dello schermo con un diverso numero di elettroni arrivati, da 10 elettroni fino a 200 000 elettroni. Si vede che da 6 000 elettroni in poi comincia ad apparire una figura di interferenza, anche se sullo schermo arriva un elettrone per volta.
Se decidiamo di misurare la posizione degli elettroni sullo schermo, con un qualunque rivelatore, e vogliamo fare una previsione del risultato, potremo solo calcolare la probabilità che sullo schermo venga rivelato un elettrone in un certo punto x. Questa probabilità è il modulo quadro della funzione d’onda totale: P12 = |ψ12|2 = |ψ1 + ψ2|2 = |ψ1|2 + |ψ2|2 + 2|ψ1| ∙ |ψ2| ∙ cos δ dove δ è la differenza di fase fra le due funzioni d’onda16. Questa, però, è esattamente la formula che ci dà, sotto opportune condizioni, una figura di interferenza. Quindi, avremmo risolto tutto. Ora abbiamo una teoria che ci permette di fare una previsione su quello che misuriamo, cosa che la fisica classica non faceva. La meccanica quantistica funziona! Nella tab. 7.2 abbiamo riassunto i punti essenziali dei tre esperimenti che abbiamo fatto. Tuttavia, rimane il problema di capire cosa sia successo. Come fa l’elettrone a mostrare interferenza se ne parte/passa/arriva sullo schermo solo uno alla volta? Da dove passa l’elettrone?
meccanica quantistica
295
tabella 7.2 Risultati dei tre esperimenti delle due fenditure, e come vengono descritti dalla meccanica quantistica Oggetto emesso dalla sorgente
Probabilità (intensità) misurata in ogni punto
P12; I12 (probabilità; intensità) Le due fenditure sono aperte
N proiettili
Oggetto singolo
Discreta P(x) = n(x)/N
P1+ P2 (figura con un massimo)
Onde, luce
Onda di ampiezza A(x, t)
Sorgente
N elettroni, emessi Funzione uno per volta, tutti d’onda con la stessa veloci- di λ ~ h/p e/o tà ve (in modulo) particella di me, ve
Grandezza continua I12 = |A1(x) + A2(x)|2 = I1 + —— I(x) = |A(x)|2 I2 + 2√I1 ∙ I2 cos δ (figura di interferenza) Discreta P(x) = n(x)/N
P12 ≠ P1 + P2 P12 = |ψ12|2 = |ψ1|2 + |ψ2|2 + 2|ψ1| ∙ |ψ2| ∙ cos δ (figura di interferenza)
Cerchiamo di “osservare” questi elettroni nel loro cammino per vedere da quale fenditura passino, per esempio inserendo una sorgente di luce tra le due fenditure (cfr. fig. 7.13). La sorgente di luce illumina tutto lo spazio emettendo fotoni; se nel loro cammino uno o più fotoni incontrano un oggetto (l’elettrone) vengono diffusi e noi li possiamo vedere. Vedremo un lampo vicino alla F1 (o la F2) se l’elettrone sarà uscito vicino a essa. Quindi, ora possiamo sapere da dov’è passato l’elettrone. Ma in questo caso la figura di probabilità sullo schermo sarà la stessa dell’esperimento con i proiettili: l’interferenza è sparita. Quello che possiamo pensare è che la luce “disturba” l’elettrone, magari perché è troppo intensa. In fondo gli elettroni sono molto piccoli, può darsi che i fotoni abbiano un’energia troppo grande e spostino gli elettroni distruggendo la delicata figura di interferenza. Allora proviamo a osservarli con una luce più debole, meno intensa. Una luce più debole non significa un’energia minore perché, data la frequenza f dell’onda, ogni fotone avrà un’energia E = hf. Significa solo che avremo meno fotoni al secondo (anche questa è una frequenza, ma non ha nulla a che fare con la frequenza f legata all’energia del fotone); qualcuno intercetterà l’elettrone, così da vedere da dove passa, qualcuno, invece, non intercetterà l’elettrone e non vedremo da dov’è passato. Possiamo selezionare sullo schermo tutti gli elettroni di cui conoscevamo la fenditura di
296
fisica per filosofi
figura 7.13 Risultato dell’esperimento delle due fenditure se proviamo a vedere da dove passa l’elettrone x
x
P
1
P12
F1
F2
P
2
Per vedere da dove passa l’elettrone poniamo una sorgente di luce vicino alle fenditure. Così sappiamo da dove passa l’elettrone, ma l’interferenza sparisce.
passaggio e che, dunque, sono stati illuminati, e tutti gli elettroni arrivati senza essere stati illuminati. Nel primo caso potremo vedere da dov’è passato l’elettrone, ma l’interferenza sarà sparita. Nel secondo avremo l’interferenza, ma non saremo riusciti a sapere da dove sono passati gli elettroni. Allora proviamo a diminuire l’energia del fotone, perciò diminuiamo la frequenza f, cioè aumentiamo la lunghezza d’onda λ del fotone. Andiamo a vedere cosa succede a tutti gli elettroni per cui abbiamo avuto un lampo di luce e… la figura di interferenza è riapparsa! Evviva! Quindi ora, pur mantenendo la figura di interferenza, potremmo sapere da dov’è passato l’elettrone? No! Purtroppo la cosiddetta “risoluzione ottica”, quella che determina se gli oggetti che vediamo sono “a fuoco” oppure se l’immagine è “sfuocata”, è dell’ordine di λ, la lunghezza d’onda della luce utilizzata. Se abbiamo una luce di lunghezza d’onda λ non potremo distinguere due oggetti (due punti) più piccoli e più vicini della lunghezza d’onda della luce che li illumina. Vedremo una sola figura sfuocata in cui le immagini dei due oggetti sono parzialmente sovrapposte. Nel nostro caso quello che succede è che per poter vedere la figura di interferenza dobbiamo utilizzare una luce con una lunghezza d’onda che non ci permette di vedere da dov’è passato l’elettrone: al massimo possiamo sapere che è passato, ma non la sua posizione.
meccanica quantistica
297
Abbiamo, pertanto, due sole possibilità: 1. rinunciamo a sapere da dove sono passati gli elettroni: abbiamo una figura di interferenza, gli elettroni sembrano comportarsi come onde; 2. riusciamo a vedere da dove sono passati gli elettroni: non abbiamo una figura di interferenza, gli elettroni sembrano comportarsi come proiettili. Sembra un puzzle, ma la meccanica quantistica ci dà un’interpretazione semplice. Quello che succede è che quando un fotone urta contro un elettrone è come se avessimo un urto fra due palle da biliardo. Tutto è determinato, dunque, dalle energie e dagli impulsi delle due particelle. Nel caso del fotone la quantità di moto è p = h/λ: se la quantità di moto del fotone è piccola, quindi se la lunghezza d’onda è grande, lo stato dell’elettrone viene disturbato poco, la parte di funzione d’onda che si trovava in quella porzione di spazio resta quasi identica e può interferire con la parte di funzione d’onda che è passata indisturbata dall’altra fenditura; se, invece, il fotone ha un grande quantità di moto, e perciò una piccola lunghezza d’onda, l’elettrone nell’urto viene modificato notevolmente, la sua funzione d’onda cambia e si perde la condizione che permetteva di avere interferenza. In questa descrizione ci sono due punti chiave. Intanto è una prima dimostrazione di come funziona il principio di indeterminazione di Heisenberg nella versione “a disturbo”: non possiamo sapere con precisione arbitraria la posizione di una particella e anche la sua velocità (la sua quantità di moto) perché se osserviamo una delle due grandezze modificheremo l’altra in maniera casuale aumentandone l’incertezza. Se conosciamo bene la posizione, la velocità sarà molto indeterminata (nessuna interferenza). Se, invece, vediamo l’interferenza questo vuol dire che la velocità sarà ben determinata ma non potremo sapere da dov’è passato l’elettrone. Il secondo punto critico è: ma allora l’elettrone è un’onda o una particella? E da dove passa quando arriva sullo schermo? Ecco tutte le possibilità: 1. o il cammino attraverso la F1 o il cammino attraverso la F2: no, se fosse così sullo schermo dovremmo vedere la figura somma delle due probabilità, senza minimi e massimi; se vediamo l’interferenza vuol dire che abbiamo la somma di due “oggetti” passati da F1 e da F2; 2. tutti e due i cammini contemporaneamente: no, l’elettrone è indivisibile, ogni volta che lo guardiamo (lo misuriamo) troviamo sempre un solo elettrone, mai mezzo elettrone; 3. nessuno dei due cammini (gli elettroni potrebbero aver fatto un percorso strano a noi ignoto): no, se chiudiamo le due fenditure non vediamo nessun elettrone arrivare sullo schermo.
298
fisica per filosofi
figura 7.14 Sorgente S che emette un elettrone per volta e strumento che rivela un elettrone alla volta sullo schermo (a)
(b) y
y ψ1 F1
F1 S
x
F2
0/A
B
C
D
F2
ψ2
ψ1 + ψ 2 dy x
E/F
In (a) vengono indicati, con 0 e A-F, tutti gli istanti che descrivono il comportamento del sistema dall’emissione iniziale fino alla ricezione sullo schermo. In (b) è mostrata la somma delle due funzioni d’onda appena prima della rivelazione sullo schermo.
E allora? Il fatto è che non ha senso parlare dell’elettrone quando non lo osserviamo. L’elettrone, nel nostro linguaggio, è un oggetto materiale, piccolo, localizzato: una particella. In realtà, l’elettrone è un oggetto quantistico, descritto dalla sua funzione d’onda: in alcuni istanti può essere descritto con le grandezze tipiche della meccanica classica, in altri deve essere descritto dalla sua funzione d’onda e non possiede alcune proprietà classiche ben determinate (è il principio di indeterminazione in versione hard), almeno fin quando non interagisce con un oggetto esterno. Nella fig. 7.14 abbiamo indicato schematicamente i vari passaggi temporali: dall’emissione di ogni elettrone dalla sorgente S fino alla sua rivelazione sullo schermo (nel caso sia passato attraverso una delle fenditure). L’ipotesi è che la descrizione corretta sia quella data dalla meccanica quantistica. L’elettrone, finché è in volo, cioè fin quando non viene rivelato, è descritto da una funzione d’onda non localizzata. L’elettrone è localizzato, con una funzione d’onda diversa da zero solo in un piccolissimo intervallo, all’inizio e alla fine del processo. In questi due istanti (ri)acquista le proprietà di una particella localizzata e può essere descritto con le usuali grandezze della fisica classica. Nella fig. 7.14a sono indicati gli istanti essenziali dell’esperimento:
O O1 e O2
P
ψ1(x1, y1, t), ψ2(x2, y2, t)
ψ = ψ1 + ψ2 dP = |ψ|2dy = |ψ1 + ψ2|2dy Posizione: (x, y, t)
La funzione d’onda incontra la parete con le due fenditure, la parte che urta la parete viene assorbita (o riflessa), parte dell’onda passa da F1, parte passa da F2; passando attraverso le due fenditure, di larghezza confrontabile o minore della lunghezza d’onda associata all’elettrone, si ha il fenomeno della diffrazione, dalle due fenditure escono due funzioni d’onda semisferiche
Nello spazio, in ogni punto dello spazio-tempo a destra delle fenditure, si ha la somma ψ(x, y, t) = ψ1(x, y, t) + ψ2(x, y, t) O1 + O2 delle due funzioni d’onda uscite dalle due fenditure che stanno viaggiando verso destra
O1 + O2
ψ(x, y, t)
La funzione d’onda si estende nello spazio-tempo, si muove verso destra, allargandosi
In ogni punto dello schermo la funzione d’onda è data dalla somma delle due funzioni d’onda, la probabilità di rivelare l’elettrone è, per ogni intervallo dy: dP
La funzione d’onda collassa, l’elettrone viene localizzato in un punto qualunque dello schermo – con probabilità P(y) –, l’elettrone si trova con certezza dove l’abbiamo trovato
B
C
D
E
F
ticella, ha alcune proprietà fisiche ben note, è un oggetto “reale”. La funzione d’onda, invece, è un oggetto matematico, acquista significato solo considerando che ci fornisce la probabilità di misurare una certa proprietà nel caso che l’elettrone (la sua funzione d’onda) interagisca con qualcosa, cioè che venga osservato.
* “O” sta per “onda”, “P” per “particella”. È importante notare che quando scriviamo “O” in questa colonna, non stiamo parlando di un oggetto fisico. L’elettrone, come par-
O
ψ(0; t0)
L’elettrone viene emesso al tempo t0: è descritto da una funzione d’onda localizzata vicino alla sorgente
A
P
Posizione: (x, y, t) = (0, 0; 0)
L’elettrone è localizzato nella sorgente, sta per essere emesso, ha una posizione (quasi) definita al tempo t = 0
O/P?*
Parametri/proprietà
0
Passaggi Cosa succede secondo la meccanica quantistica (interpretazione di Copenaghen)
tabella 7.3 Come viene descritto il fenomeno nei vari punti del tragitto che compie l’elettrone fra la sorgente e lo schermo
300
fisica per filosofi
0: un elettrone si trova nella sorgente S; A: l’elettrone viene emesso dalla sorgente S; B: la funzione d’onda si trova nello spazio fra la sorgente S e le due fenditure, F1 e F2; C: la funzione d’onda attraversa le due fenditure F1 e F2 e si modifica dividendosi in ψ1 e ψ2; D: la funzione d’onda totale ψ = ψ1 + ψ2 si trova nello spazio fra le due fenditure e lo schermo; E: la funzione d’onda arriva sullo schermo, appena prima della rivelazione; F: la funzione d’onda (l’elettrone) viene localizzata (/o) in un punto dello schermo non prevedibile con certezza. Nella tab. 7.3 abbiamo riportato come viene descritto il fenomeno nei vari punti del tragitto che compie l’elettrone fra la sorgente, in cui viene emesso, e lo schermo, su cui viene rivelato. Questo esperimento, che per la luce era stato fatto nel xix secolo da vari ricercatori trovando l’usuale figura di interferenza con massimi e minimi, nel xx secolo verrà ripetuto con fotoni singoli. In questo caso si ripresenta il problema incontrato con l’elettrone, ma al contrario: la luce è un’onda, quindi è ovvio che si produca una figura di interferenza. Ma quando emettiamo un fotone alla volta e sullo schermo riveliamo un fotone alla volta abbiamo a che fare con oggetti singoli, discreti. Eppure vediamo ancora una volta la figura di interferenza. La giustificazione è la stessa che si era avuta nel caso dell’elettrone. Il fotone singolo, non disturbato, può essere sempre descritto da un’equazione simile a quella di Schrödinger17 e, dunque, da una funzione d’onda che può produrre interferenza. 7.3.1. La dualità onda-particella Nell’esperimento delle due fenditure abbiamo visto che il singolo elettrone, fra il corpo che lo emette e lo schermo che lo rivela, può essere descritto, a seconda di quale parte del tragitto stia percorrendo, come una particella localizzata o tramite una funzione d’onda (matematica) estesa nello spazio. Questa ambiguità diventa ancora più palese quando si vuole studiare cosa succede a un’onda elettromagnetica (un’onda a tutti gli effetti) che, in alcuni casi, può essere descritta anche come una particella: il fotone, cioè il quanto del campo elettromagnetico. Nella prima versione della meccanica quantistica l’equazione di Schrödinger viene scritta solo per particelle non relativistiche con massa diversa
meccanica quantistica
301
da zero (e con spin nullo). Dopo qualche anno l’equazione verrà riscritta, modificata ed estesa a particelle relativistiche, con spin diverso da zero e/o con massa nulla, conglobando anche la descrizione dei fotoni. L’argomento è complesso, non ne parleremo: qui vogliamo considerare solo gli aspetti di onda/particella del comportamento di elettroni e di fotoni singoli. Come abbiamo detto (cfr. par. 7.2.1) una particella elementare con massa m e quantità di moto p può essere descritta da una funzione d’onda (la soluzione dell’equazione di Schrödinger) che ha la forma matematica di una combinazione lineare di onde piane (cfr. l’esempio nella fig. 7.5) in cui ognuna delle onde di cui è composta ha una lunghezza d’onda λ = h/p. Se la particella di massa m interagisce con un qualunque oggetto fisico avremo il collasso della funzione d’onda, che da estesa diventa localizzata; la particella m assumerà una certa posizione e una certa velocità, con delle indeterminazioni che hanno come limite inferiore il principio di indeterminazione di Heisenberg. In questa situazione la particella potrà essere descritta come una “standard”, localizzata e classica. Ecco due descrizioni limite per una particella con massa m ≠ 0 che può essere descritta: 1. come una particella libera, non localizzata: è descritta da una funzione d’onda ψ, la quale è un’ampiezza di probabilità che ha la forma matematica e il comportamento di una somma di onde; 2. come una particella localizzata interagente, o che ha appena interagito con un oggetto esterno: può essere descritta dalle variabili fisiche classiche, la massa m, la posizione x, la quantità di moto p, altre caratteristiche. In ogni caso e in ogni momento la particella dovrà rispettare il principio di indeterminazione di Heisenberg; quindi, la particella ben localizzata avrà una velocità molto indeterminata e così via. Analogamente potremo descrivere con entrambe le caratteristiche il comportamento di un fotone, che sarà un campo elettromagnetico, dunque un’onda composta da un campo elettrico e da un campo magnetico, oppure una particella, il fotone appunto, considerato come il quanto dell’interazione elettromagnetica e descrivibile da un’equazione tipo Schrödinger (l’estensione a particelle di massa nulla, ai fotoni). Ecco due descrizioni limite per una particella con massa nulla (il fotone) che può essere descritta: 1. come un’onda elettromagnetica funzione di un campo elettrico e di un campo magnetico che viaggiano nel vuoto con la velocità della luce e che può essere descritta da un’equazione tipo Schrödinger;
302
fisica per filosofi
2. come una particella di massa m = 0, energia E = hf, quantità di moto p = E/c e altre caratteristiche, la quale, localmente, interagisce con un oggetto esterno scambiando energia, quantità di moto ecc.
7.4. Come si utilizza la funzione d’onda; il gatto di Schrödinger e il tunneling quantistico Nei paragrafi precedenti abbiamo mostrato le caratteristiche che stanno alla base della meccanica quantistica ortodossa, dei principi relativi e del significato della funzione d’onda. Ora approfondiremo con un certo dettaglio alcune operazioni/esperimenti utilizzando il formalismo quantistico, specie in relazione a sistemi descritti da un fotone singolo o da una coppia di fotoni. Questo per permetterci di discutere con cognizione di causa l’articolo di Einstein, Podolsky e Rosen (1935) che mise in dubbio la completezza della meccanica quantistica e poi gli sviluppi venuti quaranta-cinquant’anni dopo che, invece, confermarono e completarono la (inaspettata) descrizione del nostro mondo data dalla meccanica quantistica. 7.4.1. Come si lavora con la funzione d’onda: le misure su di un sistema fisico Se abbiamo più possibilità (modalità) relative al verificarsi di un evento – per esempio, se per un certo evento possiamo avere due modalità 1 e 2, indipendenti, ognuna descritta da una funzione d’onda ψ1, ψ2 –, allora il sistema viene descritto da una funzione d’onda totale ψtot tale che: ψtot = ψ1 + ψ2 e Ptot(r, t) = |ψtot|2 Cioè: 1. prima si sommano le ampiezze di probabilità per calcolare ψtot; 2. poi si fa il modulo quadro di ψtot per avere la probabilità. Questo procedimento è formalmente simile a quello che si ha per le onde, quando abbiamo due onde con la stessa frequenza che si sommano. Consideriamo la luce, ossia un’onda elettromagnetica: l’intensità luminosa massima in un punto x è proporzionale al quadrato del campo elettrico E(x) in quel punto: I(x) ∝ E2(x). Se in un punto x arrivano due onde luminose 1 e 2 con la stessa frequenza, E1(x) ed E2(x), l’intensità luminosa risultante si calcola prima sommando le ampiezze del campo elettrico risultante:
meccanica quantistica
303
tabella 7.4 Intensità luminosa Itot risultante per alcuni valori di ∆x a cui corrisponde una differenza di fase δ* ∆x
δ
cos δ
2E1E2 cos δ
0 λ/4 λ/2
0 90° 180°
1 0 –1
2E1E2 0 –2E1E2
Itot se E1 = E2 = E; I0 = E2
4E2 = 4I0 2E2 = 2I0 0
* Si tratta della Itot risultante dalla somma di due onde luminose di intensità massima uguale I1 = I2 = I0, i cui campi elettrici si sommano con fasi δ diverse, dovute, per esempio, a una differenza di cammino ∆x. L’intensità può essere, localmente, quattro volte quella di una delle due onde iniziali, oppure due volte, oppure zero.
Etot(x) = E1(x) + E2(x), e poi calcolando l’intensità dal quadrato del campo elettrico totale: Itot(x) ∝ [Etot(x)]2 = [E1(x) + E2(x)]2 = [E1(x)]2 + [E2(x)]2 + 2 E1(x)E2(x)
↑
↑
↑
Intensità Intensità Termine dell’onda 1 dell’onda 2 di interferenza
È il termine di interferenza che fa la differenza fra una somma di oggetti puntiformi o localizzati (due eventi che avvengono nello stesso luogo e che si sommano semplicemente, tipo due palline che arrivano nel medesimo stesso luogo) e la somma di onde in cui c’è un termine di interferenza che può essere positivo, negativo o nullo. Il termine di interferenza dipende dalla differenza di fase fra le due onde, cioè dalla differenza nel cammino percorso ∆x: 2E1(x)E2(x) = 2E1E2 cos δ, dove la differenza di fase è: δ = 2π(∆x/λ). Si può vedere come la grandezza che conta è il rapporto fra ∆x e la lunghezza d’onda λ. Nella tab. 7.4 abbiamo calcolato l’intensità risultante dalla somma di due onde per alcuni valori di ∆x (0, λ/4, λ/2) a cui corrisponde una differenza di fase δ (0, 90°, 180°). 7.4.2. Principio di sovrapposizione delle onde Se un sistema fisico ha come soluzioni due onde E1(x, t), E2(x, t), allora anche lo stato E(x, t) = a1E1 + a2E2 sarà una soluzione del sistema, dove a1 e a2 sono due costanti arbitrarie.
304
fisica per filosofi
La ragione è legata alla linearità delle equazioni che descrivono il sistema: è una proprietà matematica del sistema. Facciamo un esempio classico: se prendiamo una corda e vediamo che possiamo farla vibrare alla frequenza f1 con ampiezza A1(t) = A10 cos ω1t, oppure con la frequenza f2 con ampiezza A2(t) = A20 cos ω2t, allora posso farla vibrare anche con l’ampiezza: A(t) = c1A1(t) + c2A2(t) = c1A10 cos ω1t + c2A20 cos ω2t dove c1 e c2 sono delle costanti arbitrarie. Quindi: Anche la somma di soluzioni è una soluzione del sistema, e la frequenza sarà una combinazione delle due di partenza.
Questa proprietà funziona anche al contrario: se abbiamo un sistema lineare descritto da una certa funzione (un’oscillazione, per esempio) possiamo scrivere la funzione che descrive il sistema come somma di due o più funzioni scomponendola in più modi di oscillazione. Nota. La scomposizione non è univoca, possiamo scegliere di fare la scomposizione in un numero infinito di funzioni parziali.
Questo principio si può applicare anche alle funzioni d’onda che descrivono lo stato di un sistema quantistico. Quindi, se abbiamo un sistema fisico descritto da due (o più) funzioni d’onda diverse ψ1 e ψ2, corrispondenti a due diversi stati indipendenti del sistema, allora il sistema potrà essere descritto anche da una qualunque funzione d’onda che sia una combinazione lineare degli stati di partenza: ψ = a1 ∙ ψ1 + a2 ∙ ψ2 dove a1 e a2 sono due numeri, in genere complessi. Che il sistema possa essere descritto vuol dire che può esistere lo stato descritto dalla combinazione lineare, che poi noi siamo in grado di crearlo è un altro problema. Non è detto che sappiamo farlo (sperimentalmente). Questa caratteristica è molto importante, per nulla ovvia, che, per esempio, non si incontra nella fisica classica. Supponiamo, infatti, di considerare una persona che si trova in una stanza con due porte, la porta A e la porta B e che vuole uscire. Potremo
meccanica quantistica
305
scrivere le funzioni (classiche) che corrispondono al fatto che la persona esce dalla porta A oppure che esce dalla porta B. Ma, in fisica classica, non potremo mai scrivere lo stato in cui la persona esce sia dalla porta A che dalla porta B: questo stato non esiste! Mentre, per esempio, sempre classicamente, se emettiamo un’onda verso due fenditure, potremo avere che l’onda passa in parte dalla prima e in parte dalla seconda, e che dopo il passaggio le due onde si sommano per formare una sola funzione d’onda che è passata attraverso entrambe le fenditure. Ci accorgiamo che questo sia avvenuto perché, per esempio, su uno schermo vedremo una figura di interferenza. Questa proprietà è una caratteristica di tutti i sistemi descritti da un’onda, sia un’onda fisica classica (le onde nell’acqua, il suono ecc.), sia la funzione d’onda della meccanica quantistica. 7.4.3. Decomposizione spettrale. Luce polarizzata In questo paragrafo e nei successivi discuteremo in dettaglio cosa succede a un sistema quantistico particolare, la luce polarizzata, che interagisce con uno strumento costruito per essere sensibile alla polarizzazione della luce. Un raggio di luce si dice polarizzato quando la direzione di oscillazione del campo elettrico non varia nel tempo (asse di polarizzazione = e; cfr. fig. 7.15). figura 7.15 Andamento del campo elettrico Ē di un fascio di luce polarizzata che viaggia in direzione x, per un certo istante t y ˆv = xˆ ê= ± ŷ Ē z
In questo caso la polarizzazione è verticale: e è diretta secondo l’asse y.
x
306
fisica per filosofi
figura 7.16 Due casi limite per un raggio polarizzato che incide su un polarizzatore
y
(a)
ei = ep la luce passa tutta: Eout = Ein
ei ep z
x
y
(b)
ei ep la luce non passa: Eout = 0 ei
z
ep
x
(a) Se la direzione di polarizzazione ei è parallela al piano di polarizzazione del polarizzatore, la luce passa tutta. (b) Se la direzione di polarizzazione ei è perpendicolare al piano di polarizzazione, la luce non passa.
Un polarizzatore (analizzatore) è un elemento fisico, in genere piano, caratterizzato da una direzione particolare, la direzione del polarizzatore ep, che seleziona la luce che incide su di esso, facendola passare tutta, niente, o in parte. Se il polarizzatore ep viene investito da luce polarizzata ei (e in ingresso) abbiamo due casi limite (cfr. fig. 7.16): 1. ei = ep, la luce passa tutta: Eout = Ein; 2. ei ⊥ ep, la luce non passa: Eout = 0.
meccanica quantistica
307
figura 7.17 Caso in cui il polarizzatore fa un angolo θ con la polarizzazione del campo elettrico [ei; ep] = θ ; Eout = Ein cos θ ; Iout = Iin cos2 θ ei
ei θ
z
ep x
Se il campo elettrico dell’onda incidente forma un angolo θ con la direzione del polarizzatore, il campo elettrico in uscita sarà Eout = Ein cos θ.
Nel caso generale, in cui il polarizzatore faccia un angolo θ con la polarizzazione del campo elettrico, avremo che il campo elettrico in uscita dipende dal coseno dell’angolo fra le due direzioni (cfr. fig. 7.17). È importante sapere che il campo elettrico in uscita, più piccolo di quello in ingresso di un fattore cos θ, ha polarizzazione ep. Questo vuol dire che: Un polarizzatore agisce attivamente su un raggio di luce, non solo variandone l’intensità, ma anche cambiandone la polarizzazione.
Supponiamo di inviare molta luce (tanti fotoni) al polarizzatore ep e consideriamo i tre casi particolari illustrati nella tab. 7.5. Se mandiamo tanti fotoni (N), e se θ = 45°, avremo che Iout = Iin/2, cioè: 1. una frazione N/2 dei fotoni passa; 2. una frazione N/2 dei fotoni non passa. Ma cosa succede se la luce è talmente debole che al polarizzatore arriva un fotone alla volta di una luce con direzione di polarizzazione θ = 45°? Se la luce è “tanta” (se abbiamo molti fotoni) l’intensità in uscita è semplicemente la metà di quella in ingresso, me se abbiamo un solo fotone per volta, non può passare mezzo fotone!
308
fisica per filosofi
tabella 7.5 Intensità della luce in uscita da un polarizzatore con direzione ep per tre direzioni particolari per la polarizzazione ei della luce in entrata Direzione
θ
cos θ
cos2 θ
Intensità Iout
ei = ep
0
1
1
Iout = Iin
ei ⊥ ep
90°
0
0
Iout = 0
1/2
Iout = Iin/2
ei ∠ ep
45°
— 1/√ 2
Quello che succede, e la relativa “spiegazione” è data dall’interpretazione ortodossa della meccanica quantistica. 7.4.4. Un fotone più un polarizzatore: l’interpretazione della meccanica quantistica Ogni dispositivo di misura può dare solo alcuni risultati determinati (autovalori). Nel caso del polarizzatore si hanno due soli risultati possibili: 1. il fotone passa; 2. il fotone non passa. Si noti che non esistono altre possibilità: le due appena elencate esauriscono tutti i casi possibili. A ognuno dei due risultati possibili (passa; non passa) corrisponde un autostato del sistema fisico da esaminare (in questo caso del fotone). L’autostato è quello stato del sistema fisico in ingresso a cui corrisponde un risultato certo dell’interazione con lo strumento che sta analizzando il sistema. Facciamo un esempio. Abbiamo un polarizzatore con polarizzazione ep = y: 1. i due autovalori, per un fotone incidente, sono “passa”; “non passa”; 2. se l’autostato del fotone è ei = ep = y, allora abbiamo l’autovalore “passa”; 3. se l’autostato del fotone è ei ⊥ ep = y, allora abbiamo l’autovalore “non passa”. Dunque: se il sistema in esame è in un autostato, sappiamo con certezza il risultato della misura, altrimenti possiamo sapere solo la probabilità di ottenere un certo risultato.
meccanica quantistica
309
Come si fa a calcolare la probabilità di ottenere un certo risultato? Scomponiamo lo stato del sistema in una combinazione lineare degli autostati del sistema di misura. Vediamo come si applica al caso di un fotone con polarizzazione ei e di una misura fatta con un polarizzatore ep. Scomponiamo la direzione ei del fotone secondo due assi y, z (è quella che si chiama “decomposizione spettrale”; cfr. fig. 7.18): ei = ey cos θ + ez sen θ La probabilità di ottenere un certo risultato (che deve essere uno degli autovalori) è proporzionale al modulo quadro del coefficiente del rispettivo autostato. Sia ep = y ed ei = cos θ ∙ ey + sen θ ∙ ez. Cosa passa? Passa l’autostato ey, il coefficiente è cos θ, la probabilità di ottenere che passi è cos2 θ. Se abbiamo, per esempio, θ = 45°, allora cos2 θ = 1/2, cioè passa un fotone ogni due. Il risultato è che il fotone, che aveva polarizzazione ei, passa o non passa con probabilità del 50%. Cosa succede e cosa è successo (secondo la meccanica quantistica)? Analizziamo la spiegazione per punti. 1. Il fotone che passa (tutti i fotoni che passano) risulta polarizzato secondo la direzione del polarizzatore ep. 2. C’è stato un brusco cambiamento nello stato dei fotoni che sono passati: ei → ep. È il cosiddetto “collasso” della funzione d’onda del sistema. Se avessimo scelto un polarizzatore con un asse di polarizzazione diverso, il fotone in uscita sarebbe stato diverso. 3. Il misuratore (l’interazione del sistema quantistico con il sistema “esterno”) cambia il sistema fisico. 4. Le probabilità (a priori) si realizzano in un risultato certo. 5. La misura modifica il sistema in esame. Non è solo un disturbo casuale. In generale se abbiamo un sistema fisico descritto da una funzione d’onda ψ(r, t) e lo vogliamo “misurare”, oppure se vogliamo sapere cosa succede se interagisce con un sistema esterno (lo “strumento”), dobbiamo scrivere la funzione d’onda del sistema fisico di partenza scomponendola nella somma di tutti gli autostati (le funzioni d’onda) che descrivono i possibili risultati dovuti all’interazione con lo strumento che fa la misura.
310
fisica per filosofi
figura 7.18 Scomposizione del campo in ingresso ei, diretto secondo un angolo θ rispetto a ep in due componenti ortogonali ey ed ez y ei θ
eγ ep
z
ez x
Nota. La geometria reale è leggermente diversa rispetto al disegno che non è in scala: ei, ey ed ez sono direzioni, quindi vettori unitari, la loro lunghezza deve essere sempre 1.
Supponiamo per esempio che la funzione d’onda ψ (x, t) interagisca con uno “strumento” che può dare come risultati solo i valori a, b o c a cui corrispondono le funzioni d’onda ψa, ψb e ψc. Prima della misura avremo: ψ(x, t) = caψa(x, t) + cbψb(x, t) + ccψc(x, t) Questo vuol dire che avremo la probabilità |ca|2 di ottenere ψa(r), la probabilità |cb|2 di ottenere ψb(r) ecc. Dopo la misura, se per esempio abbiamo ottenuto ψa(r), allora avremo 18: ψ’(x, t) = ψa(x, t) cioè la funzione d’onda iniziale è “diventata” (cioè è collassata in) uno dei possibili autostati dello strumento. 7.4.5. Il gatto di Schrödinger Il gatto di Schrödinger è un esperimento ideale citato per la prima volta da Schrödinger in un suo famoso lavoro (cfr. Schrödinger, 1935), in cui si discute fra l’altro dell’applicazione a un sistema macroscopico della sovrapposizione delle funzioni d’onda e del formalismo quantistico. Del gatto di Schrödinger se ne parla in innumerevoli articoli talvolta in modo ingenuo, talvolta con analisi molto approfondite. Ma
meccanica quantistica
311
vale la pena di riportare quanto scritto dallo stesso Schrödinger nel suo articolo. «Si possono costruire anche casi burleschi. Si chiude un gatto in una camera blindata» (ibid.): l’esperimento del gatto dallo stesso Schrödinger viene presentato come un caso “burlesco” (in altre traduzioni “ridicolo”) in cui si fanno delle indebite generalizzazioni del comportamento dei corpi microscopici ai corpi macroscopici. Ecco in breve l’esperimento (mentale!) proposto da Schrödinger. Abbiamo un gatto rinchiuso in una scatola blindata. Dentro la scatola c’è una fiala di gas velenoso, un martello comandato da un meccanismo che rivela particella radioattive e una sorgente radioattiva di fronte al rivelatore. Quando il materiale radioattivo ha un decadimento viene emessa una particella che viene rivelata dal rivelatore, il quale a questo punto scatta, comanda il martello che rompe la fiala di gas velenoso che si spande nell’aria e in pochi secondi uccide il gatto. La sorgente è tale che la probabilità di decadimento del materiale radioattivo è del 50% ogni ora. Pertanto, dopo ogni ora c’è il 50% di probabilità che ci sia stato un decadimento. Dopo un’ora, come sarà l’atomo? Come sarà la fiala? Come sarà il gatto? Secondo la meccanica quantistica dopo un’ora, se non abbiamo interagito con il sistema, quindi se non l’abbiamo guardato, la funzione d’onda che descrive il sistema si scrive come la sovrapposizione delle due funzioni d’onda che descrivono le due possibilità: decaduto → fiala rotta → gatto avvelenato, morto: ψ = ψ(1) {Materiale Materiale non decaduto → fiala sana → gatto sano, vivo: ψ = ψ(2) ψ=
1 2
∙ ψ1 +
1 2
∙ ψ2 =
1 2
∙ ψ (vivo) +
1 2
∙ ψ (morto)
E il sistema collasserebbe in uno dei due stati possibili solo all’apertura della scatola. Come se fossimo noi a determinare se il gatto sia vivo o sia morto. La cosa può apparire banalmente ridicola, ma anche profondamente sottile. Vale la pena di riportare la conclusione di Schrödinger: Ciò che è tipico in questi casi è che un’indeterminazione originariamente limitata a livello atomico si traduce in un’indeterminazione palpabile che può essere risolta con l’osservazione diretta. Questo ci impedisce di far valere ingenua-
312
fisica per filosofi
mente un modello vago come immagine della realtà. In sé, esso non conterrebbe niente di poco chiaro o di contraddittorio. C’è differenza tra una fotografia mossa o sfocata e una che ritrae nuvole e lembi di nebbia (ibid.).
La “soluzione” semplice al problema è questa: ogni oggetto macroscopico – e con questo intendiamo un oggetto che si trova a una certa temperatura –, è in contatto termico con l’ambiente. Quindi, viene continuamente “osservato” da miliardi di miliardi di fotoni al secondo. E anche tutte le sue molecole interagiscono una con l’altra miliardi di volte al secondo. Tutti questi eventi non sono altro che “osservazioni” fatte sui singoli atomi del sistema. Anche supponendo di aver costruito un sistema macroscopico (il gatto) in una condizione tale da essere descritto da una funzione d’onda sovrapposizione di più stati; quello che succede è che la sua funzione d’onda collasserà in tempi dell’ordine di miliardesimi di secondo: è il fenomeno della decoerenza quantistica. Quello che succede, dunque, è che il sistema atomico è genuinamente quantistico ed emetterà in media una particella ogni due ore secondo le regole casuali del decadimento radioattivo. Ma il gatto sarà continuamente in uno stato ben definito, prima vivo, poi, nel caso fosse avvenuto un decadimento (disgraziatamente) morto. 7.4.6. Il tunneling quantistico In meccanica quantistica esiste un effetto inesistente nella meccanica classica: il cosiddetto “tunneling quantistico”. Supponiamo di avere un sistema, la solita particella con massa m in presenza della forza di gravità, che si può muovere in una sola direzione orizzontale, per esempio lungo l’asse x, e che a un certo istante si trova di fronte a una barriera, un ostacolo di altezza h. La meccanica classica dice che la particella potrà superare la barriera se avrà un’energia cinetica maggiore o uguale all’energia potenziale necessaria per superare la barriera. Se l’energia cinetica della particella sarà troppo piccola, vale a dire se la particella non è abbastanza veloce, allora rimbalzerà all’indietro (in realtà quello che succede può dipendere anche dalla forma della barriera, qua supponiamo che essa sia tale da non influire sul passaggio o meno della particella). 1 In formule: E (cinetica) ≥ E (potenziale), quindi: mv2 ≥ mgh cioè: — 2 v ≥ √2gh.
meccanica quantistica
313
In meccanica quantistica questo semplice “esperimento” può avvenire in modo completamente diverso. Quello che succede è che, anche se la particella ha un’energia minore dell’energia potenziale necessaria per superare la barriera, l’equazione di Schrödinger prevede che ci sarà una certa probabilità che la particella superi la barriera e una certa probabilità che la particella rimbalzi all’indietro. Questo “superamento” della barriera avviene con una modalità molto particolare. La particella non passa sopra la barriera, non potrebbe, non ha l’energia sufficiente. Quello che succede è, appunto, l’effetto “tunnel”: a un certo istante la particella si trova, per esempio, a sinistra della barriera, la urta, e istantaneamente può trovarsi a destra della barriera. È un fatto abbastanza incredibile, eppure sta alla base delle reazioni nucleari che si verificano all’interno del Sole (la fusione nucleare avviene tramite un meccanismo di questo tipo) e in molti componenti elettronici che si trovano negli oggetti di uso comune (cellulari, tv, telecomandi ecc.). Non stiamo parlando, quindi, di un fenomeno ideale, in pratica impossibile, ma di un fenomeno reale della natura e che possiamo ricreare artificialmente. Con il che ci si potrebbe chiedere: ma allora questo può succedere sempre? Potremmo andare a sbattere contro un muro e in qualche caso trovarci dall’altra parte per effetto tunnel? Ecco, qua entrano in gioco i numeri, si può fare il calcolo della probabilità che l’effetto tunnel avvenga per un oggetto macroscopico: il risultato è che questa probabilità è praticamente zero. Ciò vuol dire che, anche se provassimo ad andare contro un muro una volta al secondo, non basterebbero miliardi di miliardi di volte l’età dell’universo per avere la probabilità che accada una volta: è il cosiddetto “evento impossibile”. Se andiamo contro un muro ci facciamo male, tutto qui, è inutile sperare di trovarci dall’altra parte19.
7.5. L’articolo di Einstein, Podolsky e Rosen: la meccanica quantistica è incompleta Il 25 marzo 1935 Einstein, Podolsky e Rosen pubblicano un articolo dal titolo La descrizione della realtà della meccanica quantistica può considerarsi completa?: si tratta di uno degli articoli più importanti di tutta la meccanica quantistica, e probabilmente di tutta la fisica moderna (cfr. Einstein, Podolsky, Rosen, 1935).
314
fisica per filosofi
Il punto sottolineato dagli autori, in breve, è questo: 1. la meccanica quantistica dice che la descrizione della realtà avviene tramite la funzione d’onda, che rappresenta tutta l’informazione che si può avere su un sistema; 2. tramite un esperimento mentale su un sistema particolare Einstein, Podolsky e Rosen dimostrano che la funzione d’onda non descrive completamente le proprietà del sistema in esame; 3. nella descrizione del sistema, quindi, manca qualcosa che la meccanica quantistica non può descrivere. Di conseguenza, la meccanica quantistica non è una teoria completa. È abbastanza chiaro che questo è un attacco degli autori alla probabilità intrinseca legata alle previsioni della meccanica quantistica. L’idea di Einstein, da sempre, era che la descrizione probabilistica della realtà non fosse quella “vera”, che in realtà le previsioni probabilistiche date dalla meccanica quantistica fossero epistemiche, cioè legate alla nostra ignoranza di qualche aspetto del reale. E che prima o poi si sarebbe arrivati a una descrizione causale, non probabilistica del mondo che ci circonda. Ecco cosa scriveva Einstein a Bohr nel 1926: La meccanica quantistica esige molta attenzione. Ma una voce interiore mi suggerisce che non è ancora la cosa reale. La teoria offre molto, ma difficilmente ci avvicina al segreto del grande vecchio. In ogni caso, io sono convinto che Lui non giochi a dadi (Einstein, Born, Born, 1973, pp. 129-30).
Ora vediamo di chiarire il significato dell’esperimento di Einstein, Podolsky e Rosen (d’ora in poi richiamato come epr), e di come la soluzione sia stata trovata solo nel 1982, confermando la completezza della meccanica quantistica e stravolgendo ulteriormente la nostra idea di realtà. Ne vedremo una versione elementare, la “versione 0”, e poi descriveremo in dettaglio gli aspetti più delicati del problema. La “versione 0” (fin troppo facile, in realtà non chiarisce le proprietà dei sistemi entangled): 1. Consideriamo un sistema fisico composto da due sistemi [A, B] opportunamente preparati e separiamoli portandoli a grande distanza (d). La preparazione è tale che la misura di alcune proprietà su uno dei due sistemi fornisce lo stesso valore se misurato sul secondo20. 2. Misuriamo una certa proprietà P del sistema A, P(A), al tempo t*. La misura inizia a t* e finisce t* + dt; la distanza d è tale che tc(d) = d/c >> dt, ossia la luce, nel tempo dt, non può arrivare da A a B.
meccanica quantistica
315
3. Sapremo con certezza, dunque, il valore della stessa proprietà P(B) al tempo t* + dt. 4. Dato che non c’è stato il tempo di comunicare a B il risultato di A, se ne deduce che B possedeva quella proprietà prima dell’istante t* + dt. 5. Ma la meccanica quantistica ci fornisce solo la probabilità di avere un certo risultato per P(B) al tempo t* + dt. 6. Quindi c’è un elemento di realtà che la teoria non può prevedere. 7. Di conseguenza, la teoria è incompleta. 7.5.1. La notazione di Dirac Per discutere con qualche dettaglio l’esperimento epr, senza dover utilizzare il formalismo completo della meccanica quantistica con i relativi calcoli, è utile introdurre la notazione di Dirac che, oltre a permettere la visualizzazione e il calcolo di alcuni risultati, può rivelarsi particolarmente semplice. Partiamo dal fatto che, secondo la meccanica quantistica, ad ogni sistema fisico posso associare una funzione d’onda ψ(r, t), d’ora in poi scritta semplicemente ψ, che descrive lo stato del sistema. Consideriamo ora un particolare stato ψ ottenuto dalla combinazione di due stati ψ1 e ψ2, ognuno dei quali rappresenta uno stato diverso (per esempio, ψ1 = “V” può essere lo stato di un fotone con polarizzazione verticale, cioè un fotone che ha il 100% di probabilità di passare un test di polarizzazione verticale, e ψ2 = “O” lo stato di un fotone con polarizzazione orizzontale, ossia un fotone che ha il 100% di probabilità di passare un test di polarizzazione orizzontale): ψ = a1ψ1 + a2ψ2 dove le probabilità di ottenere lo stato ψ1 o ψ2 in una misura sono, rispettivamente: P1 (ψ1) = [a1]2 e P2 (ψ2) = [a2]2 La notazione di Dirac è la seguente: il simbolo |…> rappresenta lo stato di un sistema descritto dalla funzione d’onda ψ. Se supponiamo di sottoporre lo stato a una certa misura che ha solo due possibili risultati, possiamo scrivere lo stato ψ come somma dei due stati (risultati possibili) diversi: |ψ1> e |ψ2>.
316
fisica per filosofi
I fattori a1 (a2) sono i coefficienti che determinano la probabilità di ottenere lo stato ψ1 (ψ2): |ψ> = a1|ψ1> + a2|ψ2> Facciamo un esempio con dei fotoni inviati a un polarizzatore. Se consideriamo il caso di un fotone polarizzato V = verticalmente (O = orizzontalmente), possiamo scrivere lo stato del fotone così: |V>: è lo stato di un fotone che passa al 100% un test con un polarizzatore verticale |O>: è lo stato di un fotone che passa al 100% un test con un polarizzatore orizzontale
Nel caso di un fascio di luce (un fotone) con polarizzazione a 45°, possiamo scomporre lo stato secondo due qualunque direzioni ortogonali, per esempio (V, O) e scrivere (principio di linearità): | ψ >= |45°> =
1
|V>+
1 | O> 2
2 — dove i fattori 1/√ 2 servono ad assicurare che la probabilità totale che il fotone “passi” il test o che “non passi” il test sia 1, cioè sia lo stato “certo” (siamo sicuri che il fotone o passa il test o non lo passa, non ci sono altre possibilità). Infatti abbiamo: P (|45°> passi V) = P (V) =
[ 12 ] = 21 = 50%
P (|45°> passi O) = P (O) =
2
[ 12 ] = 21 = 50% 2
Mentre: P(|45°> passi 45°) = P(45°) = [1]2 = 1 = 100% Si noti che il fotone a 45° ha il 100% di probabilità di passare il test a 45°, quindi il fotone possiede oggettivamente la proprietà di avere una certa polarizzazione (cfr. la definizione di “realismo” nel par. 7.5.5).
meccanica quantistica
317
7.5.2. L’esperimento epr La trattazione segue come schema la discussione dell’esperimento epr fatta da Gian Carlo Ghirardi nel bellissimo libro Un’occhiata alle carte di Dio (cfr. Ghirardi, 2015). Queste poche pagine sono una minima traccia del discorso logico, si consiglia di leggere il testo di Ghirardi per le molte e approfondite discussioni dei punti chiave e delle sottigliezze legate al paradosso epr.
7.5.3. Stati fattorizzati Nel grafico della fig. 7.19 sono indicate le direzioni delle due coppie di assi relativi alla polarizzazione dei fotoni o dei polarizzatori che verranno utilizzati nel seguito. Considereremo due coppie di assi ortogonali: 1. la coppia (V, O): verticale a 90°, orizzontale a 0°; 2. la coppia (V, O) ruotata di 45°: le diagonali a 135° e a 45°. Nota. Gli assi devono essere ortogonali perché così ci riduciamo a due soli casi (strumenti di misura) in cui un risultato esclude l’altro e i due risultati comprendono tutte le possibilità.
Consideriamo una sorgente S che, opportunamente eccitata, emetta due fotoni indipendenti 1 e 2, uno con polarizzazione verticale V e l’altro con polarizzazione orizzontale O. Gli stati dei due fotoni possono essere scritti come: |ψ1> = |1, V> e |ψ2> = |2, O> E lo stato totale dei due fotoni possiamo scriverlo come: |ψ> = |1, V> ∙ |2, O> in cui va notato che il prodotto “∙” vuol dire che i due fotoni sono indipendenti. Ecco cosa succede se facciamo tre test di polarizzazione sui due fotoni, cambiando l’asse di polarizzazione di uno dei polarizzatori. S è la sorgente; |1, x> e |2, y> sono i due fotoni emessi dalla sorgente; P(O), P(V) e P(45°) sono i polarizzatori con l’asse di polarizzazione diretto rispettivamente orizzontalmente, verticalmente o a 45°. I fotoni
318
fisica per filosofi
figura 7.19 Direzioni delle due coppie di assi relativi alla polarizzazione dei fotoni o dei polarizzatori: [O; V] = [0°; 90°] e [45°; 135°] V
135°
45°
O
incidono ognuno su un polarizzatore. Il polarizzatore a sinistra, quello che analizza il fotone 2 ha sempre la stessa polarizzazione (O). Invece, il polarizzatore a destra, quello che analizza il fotone 1, cambia orientazione (V, O, 45°). Il risultato è quello nella tab. 7.6. Intanto va notato che, mentre il risultato del fotone 2 è sempre lo stesso (abbiamo lo stesso tipo di fotone inviato sullo stesso polarizzatore), quello del fotone 1 varia, avendo cambiato il polarizzatore. I due fotoni sono effettivamente indipendenti e così i risultati delle misure fatti su di essi. Si ricorda che il risultato della misura “passa al 50%” sta a significare che la probabilità che passi sarà il 50%; quindi, se, per esempio, ripetiamo la misura cento volte, avremo che “in media” passerà cinquanta volte. Se facciamo una sola misura avremo la probabilità del 50% che il fotone passi o che non passi, per cui sul risultato della singola misura non possiamo fare previsioni certe. Perché nel terzo caso il fotone |1, V> passa o non passa al 50%? Vediamo il calcolo dettagliato. Scomponiamo lo stato |1, V> secondo le due direzioni 45° e 135°: | 1, V> =
1
2
|1, 45°> +
1
2
| 1, 135° >
Inseriamo a questo punto questa espressione per il fotone 1 nell’espressione di tutta la funzione d’onda, che comprende sia il fotone 1 che il fotone 2. Otteniamo: |ψ>=
1
2
|1, 45°> ∙ | 2, O> +
1
2
|1, 135°> ∙ | 2, O>
meccanica quantistica
319
tabella 7.6 Risultati di tre test di polarizzazione su due fotoni indipendenti Risultato sul fotone 2
Polarizzatore
Sorgente dei due fotoni
Polarizzatore
Risultato sul fotone 1
Passa al 100% ←
P(O)
|2, O> ← S → |1, V> P(V)
→ Passa al 100%
Passa al 100% ←
P(O)
|2, O> ← S → |1, V> P(O)
→ Non passa al 100%
Passa al 100% ←
P(O)
|2, O> ← S → |1, V> P(45°) → Passa al 50% Non passa al 50%
Questo è un altro modo di scrivere lo stato di partenza dei due fotoni. Se ora facciamo un test con il polarizzatore a 45° sul fotone 1, avremo — che il fotone 1 passerà il test a 45° con la probabilità di (1/√ 2 )2 = 1/2 = 50%. Prima della misura: | ψ >=
1
2
|1, 45°> ∙ | 2, O> +
1
2
|1, 135°> ∙ | 2, O>
È importante capire cosa succede dopo la misura. Se il fotone supera il test (e questo avviene con la probabilità del 50%), subito dopo la misura, quindi all’uscita del polarizzatore, avremo avuto il collasso della funzione d’onda nello stato di uscita, il fotone avrà acquisito con certezza la polarizzazione a 45° e la funzione d’onda sarà diventata. Dopo la misura: |ψ> = |1, 45°> ∙ |2, O> Cioè, essendo il fotone 1 a 45°, dopo la misura non abbiamo più la parte di |ψ> che descriveva lo stato del fotone 1 a 135°, mentre è rimasta la parte che descriveva il fotone 2, che infatti, essendo orizzontale, passerà al 100% un test con un polarizzatore orizzontale.
7.5.4. Stati entangled Analogamente a quanto fatto nel paragrafo precedente, in cui avevamo uno stato con un fotone O e uno V, possiamo creare i due seguenti stati: uno stato |Φ> con i due fotoni entrambi |V> e un altro |Λ> con i due fotoni entrambi |O>: |Φ> = |1, V> ∙ |2, V> ; |Λ> = |1, O> ∙ |2, O>
320
fisica per filosofi
Ora creiamo lo stato somma (cioè, la sovrapposizione lineare) dei due precedenti21: |ψ=
1
2
|Φ> +
1
2
|Λ> =
1
2
(|1, V> ∙ |2, V>) +
1
2
(|1, O> ∙ |2, O>)
Lo stato |ψ> che abbiamo creato viene chiamato entangled, in italiano “interlacciato”, e ha una serie di proprietà molto particolari, inesistenti nel mondo della fisica classica. Supponiamo di sottoporre lo stato |ψ> a un test di polarizzazione verticale sul fotone 1: il fotone 1 ha il 50% di probabilità di passarlo. Lo stesso risultato (50%) si avrebbe se facessimo un test di polarizzazione orizzontale sul fotone 1, o un test di polarizzazione orizzontale o verticale sul fotone 2. Avremmo sempre una probabilità del 50% di passarli. Supponiamo ora di voler fare un test, sempre sullo stato |ψ>, con un polarizzatore a 45° oppure a 135° (direzioni ortogonali fra loro). Servono un po’ di calcoli; gli stati dei due fotoni entangled vanno scomposti secondo le nuove direzioni: il risultato è che possiamo scrivere lo stato |ψ>, lo stesso di prima, come: |ψ=
1
2
[|1, 45°> ∙ |2, 45°> + |1, 135°> ∙ |2, 135°>]
Si vede che, analogamente al caso del paragrafo precedente, la probabilità di passare un test a 45° oppure a 135° è sempre del 50% sia per il fotone 1 che per il fotone 2: P1(45°) = P2(45°) = 50% P1(135°) = P2(135°) = 50% Questo ragionamento, fatto per le due direzioni (O, V) = (0°, 90°) e poi per le due direzioni (45°, 135°), vale per qualunque altra coppia di direzioni ortogonali: (20°, 110°), (30°, 120°), (110°, 200°); vale, pertanto, per qualunque angolo della polarizzazione iniziale, l’altro essendo a 90° dal primo. In altri termini, ognuno dei due fotoni ha una probabilità P = 1/2 = 50% di passare un test lungo una qualsiasi direzione arbitraria: sempre. Quindi: Non esiste alcuna direzione in cui la polarizzazione possa essere prevista con certezza. Ma in ogni caso il risultato ottenuto per qualunque test è lo stesso per tutti e due i fotoni.
meccanica quantistica
321
Il termine entangled sta appunto a significare questa caratteristica di “interlacciamento” fra due fotoni, ben differente dai due fotoni fattorizzati incontrati nel paragrafo precedente, in cui entrambi si comportavano indipendentemente da quanto avveniva all’altro fotone. Se facciamo un test di polarizzazione sul fotone 1 lungo una qualsiasi direzione n (arbitraria), e se supponiamo che il fotone passi il test, otteniamo in uscita lo stato: |ψ> = |1, n> ∙ |2, n> Dunque, dopo la misura sul fotone 1 (supponendo che abbia passato il test n, e questo avviene nel 50% dei casi) abbiamo che il fotone 2 ha “acquisito” la polarizzazione n, cioè siamo sicuri, (abbiamo una probabilità del 100%) che il fotone 2 passerà un test di polarizzazione secondo n. Il punto essenziale dello stato entangled è questo: 1. prima di ogni misura possiamo solo dire che avremo il 50% di probabilità di passare un qualunque test di polarizzazione secondo una qualunque direzione n. Prima della misura, nello stato entangled, i fotoni non hanno la proprietà “polarizzazione”, vale a dire non esiste nessuna direzione per cui possiamo prevedere con certezza il risultato (cfr. la definizione di “realismo” nel par. 7.5.5); 2. dopo una misura (secondo la direzione n) avremo il 100% di probabilità di passare lo stesso test sia per il fotone misurato che per l’altro. I due fotoni avranno entrambi acquisito la proprietà di essere polarizzati secondo la direzione n. 7.5.5. La dimostrazione di Einstein, Podolsky e Rosen dell’incompletezza della meccanica quantistica Le definizioni/premesse dell’articolo di Einstein, Podolsky e Rosen (1935) sono le seguenti: 1. realismo: se, senza disturbare in alcun modo un sistema, è possibile prevedere con certezza il risultato di una misura di un’osservabile del sistema, allora esiste un elemento di realtà associato all’osservabile in questione, o equivalentemente il sistema possiede oggettivamente la relativa proprietà (per “oggettivamente” si intende indipendentemente da qualunque osservatore e dal fatto che la misura in questione venga effettuata oppure no);
322
fisica per filosofi
2. località einsteiniana: gli elementi di realtà fisica posseduti oggettivamente da un sistema non possono venire influenzati istantaneamente a distanza. Questo vuol dire che qualunque segnale deve trasmettersi a velocità non superiore a quella della luce, la trasmissione “istantanea” di un’informazione è impossibile. Per “segnale” si intende un’informazione che modifica un elemento di realtà fisica. E un’informazione, secondo la relatività speciale, può viaggiare al massimo alla velocità della luce. Nel loro articolo Einstein, Podolsky e Rosen assumono l’ipotesi di località per tutti i processi fisici. L’argomento degli autori è il seguente. 1. Assumiamo uno stato composto da due fotoni entangled come in: ψ(t) =
1
2
[|1, V> ∙ |2, V> + |1, O > ∙ |2, O>]
2. Facciamo viaggiare i due fotoni in direzioni opposte per un tempo t*. Al tempo t* si troveranno il fotone 1 in A, il fotone 2 in B. 3. Eseguiamo, al tempo t* e nel punto A, un test di polarizzazione sul fotone 1 con un polarizzatore verticale V, e supponiamo che la misura duri un tempo dt. Se il fotone passa il test, allora un istante dt dopo lo stato del sistema sarà: ψ(t* + dt) =|1, V> ∙ |2, V> La distanza AB = d sia molto maggiore di c ∙ dt. 4. L’osservatore in A, solidale con il polarizzatore, potrà quindi prevedere con certezza, senza disturbarlo, che il fotone 2 passerà un test di polarizzazione verticale con la probabilità del 100%, cioè con certezza, se un altro osservatore facesse una misura in B al tempo t* + dt. 5. Il fotone 2, pertanto, ha un elemento di realtà fisica, la polarizzazione V (cfr. la citata definizione di “realismo”), che non aveva prima dell’istante t*. 6. Ma, per l’ipotesi di località, la misura in A non può aver influito sul fotone 2 (anche se A avesse inviato un segnale a B alla velocità della luce, il segnale non avrebbe fatto in tempo ad arrivare a B), perciò il fotone 2 possedeva questa proprietà anche prima della misura fatta all’istante t*, indipendentemente dalla misura fatta sul fotone 1. 7. Quindi, c’è un elemento di realtà che la teoria non è in grado di descrivere. 8. Di conseguenza, la teoria è incompleta.
meccanica quantistica
323
7.5.6. L’epr, alcuni commenti dei protagonisti Riportiamo qui alcuni commenti della comunità scientifica all’articolo di Einstein, Podolsky e Rosen (1935) estratti per lo più dal libro di Ghirardi (2015) in cui viene fatta un’analisi più completa e approfondita. Partiamo da un’affermazione di Bohr, riportandone un brano che sembra sinceramente incomprensibile, come sottolineato anche da Bell. Bohr commenta la definizione di “realismo” data nell’epr: L’enunciato del criterio in questione [il realismo] risulta ambiguo per quanto concerne l’espressione “senza disturbare in alcun modo il sistema”. Naturalmente, nel caso in esame non può in alcun modo invocarsi un disturbo meccanico del sistema in esame nell’ultimo stadio cruciale del processo di misura. Ma anche a questo stadio emerge in modo essenziale il problema di un’influenza sulle precise condizioni che definiscono i possibili tipi di predizioni che riguardano il comportamento successivo del sistema […] il loro argomentare non giustifica la loro conclusione che la descrizione quantistica risulti essenzialmente incompleta […]. Questa descrizione può caratterizzarsi come una utilizzazione razionale di tutte le possibilità di una interpretazione non ambigua del processo di misura compatibile con l’interazione finita e incontrollabile tra l’oggetto e lo strumento di misura nel contesto della teoria quantistica (cit. ivi, p. 161).
Vediamo, invece, le parole di Born: La radice delle differenze tra Einstein e me era l’assioma che eventi che si verificano in posti diversi A e B sono indipendenti uno dall’altro, nel senso che una osservazione circa la situazione in B non può dirci nulla circa la situazione in A (cit. ivi, p. 163).
Sembra proprio che Born non abbia colto il punto essenziale dell’esperimento. Si veda l’esempio di due scatole chiuse con una pallina bianca in una e una nera nell’altra, supponendo che non si sappia in quale scatola si trova la pallina bianca, o quella nera. Ipotizziamo ancora, come l’epr, di portare le scatole molto lontano, di aprirne una e di guardare il colore della pallina (bianca, per esempio). Istantaneamente potremo dire che la pallina nell’altra scatola è nera, anche senza doverla aprire. Ma questo è il tipico caso di eventi – classici – ma dipendenti uno dall’altro, anche se si verificano in posti differenti. Nel suo libro La teoria quantistica e lo scisma nella fisica, Karl R. Popper discute così l’interpretazione di Copenaghen della riduzione del pacchetto d’onda (cfr. Popper, 1982, p. xx):
324
fisica per filosofi
Senza dubbio la riduzione del pacchetto può verificarsi molto rapidamente; persino a velocità superluminale [cioè, maggiore di quella della luce], come ho spiegato nella sezione 75 della Logica della scoperta scientifica; perché esso semplicemente non è un evento fisico, è il risultato della libera scelta di nuove condizioni iniziali (cit. in Ghirardi, 2015, p. 166).
Cosa vuol dire l’affermazione sulle condizioni iniziali? Vari anni dopo Popper scrive una prefazione alla riedizione della sua Logica della scoperta scientifica, manifestando ancora una volta di non aver colto alcuni punti essenziali di questo tipo di esperimenti. Infatti, nel libro di cui stiamo parlando Popper propone un esperimento che costituisce una variante dell’epr e asserisce che se l’interpretazione di Copenaghen risulta corretta, allora l’esperimento da lui analizzato permette di inviare segnali superluminali. Popper presenta il suo Gedankenexperiment a una conferenza del 1983 al Centro di fisica teorica di Trieste. L’esperimento, secondo lui, lasciava solo due alternative: o l’interpretazione di Copenaghen era corretta e allora, ricorrendo al suo dispositivo sperimentale, sarebbe risultato possibile inviare segnali superluminali, oppure non ci sarebbe stata azione istantanea a distanza e l’esperimento avrebbe costituito una falsificazione della teoria. In quell’occasione Ghirardi mostrò che Popper non aveva applicato correttamente le regole della teoria e i risultati, quindi, erano errati (cfr. ivi, p. 167). Passiamo ora ad Abraham Pais. Nel suo volume Sottile è il Signore sostiene: Si è a volte parlato del contenuto dell’articolo come del paradosso di Einstein, Podolsky e Rosen. Andrebbe sottolineato che questa memoria non mette in evidenza né paradossi né difetti logici. Semplicemente essa conclude che il concetto di realtà oggettiva è incompatibile con l’ipotesi che la meccanica quantistica sia completa. Tale conclusione non ha inciso sugli sviluppi successivi della fisica ed è dubbio che lo farà mai (Pais, 1986, p. 486).
Quello di Einstein, Podolsky e Rosen (1935) è uno degli articoli del xx secolo che ha avuto maggiori influenze nella discussione e nella comprensione della realtà e della sua descrizione tramite la meccanica quantistica. Il solo fatto che, come vedremo nel par. 7.6, le “soluzioni” teoriche al problema siano arrivate nel 1964 e le relative conferme sperimentali nel 1982, mostra quanto il problema non fosse ovvio né banale. Lo si intuisce dalle parole dello stesso Einstein:
meccanica quantistica
325
Se si suppone che gli sforzi per elaborare una descrizione fisica completa abbiano successo, la teoria quantistica statistica verrebbe ad assumere, nello schema della fisica del futuro, una posizione approssimativamente analoga a quella della meccanica statistica nello schema della fisica classica. Io sono fermamente convinto che lo sviluppo della fisica teorica sarà di questo tipo; ma il cammino sarà lungo e difficile. Io sono, di fatto, fermamente convinto che il carattere essenzialmente statistico della teoria quantistica contemporanea è esclusivamente da ascriversi al fatto che questa (teoria) opera con una descrizione incompleta dei sistemi fisici (cfr. Einstein, Podolsky, Rosen, 1935).
Come anche dalla frase conclusiva dell’articolo da lui scritto con Podolsky e Rosen: Mentre noi abbiamo mostrato che la funzione d’onda non fornisce una descrizione completa della realtà fisica, abbiamo lasciato aperta la questione se una descrizione siffatta esista o no. Tuttavia noi crediamo che una teoria di questo genere sia possibile (cfr. Einstein, Podolsky, Rosen, 1935).
7.6. Le disuguaglianze di Bell Nel 1964 Bell (1928-1990), un fisico irlandese, scrisse un articolo sul paradosso epr (cfr. Bell, 1964). Il lavoro era la proposta di un esperimento mentale su di un sistema molto simile a quello dell’epr, ma più flessibile e concettualmente completo. Con il suo esperimento Bell non voleva direttamente falsificare o provare la meccanica quantistica o altre teorie: gli interessava solo poter eseguire un test sulla località dei fenomeni naturali. Un punto essenziale del suo articolo è che le leggi della meccanica quantistica (o di qualunque altra teoria fisica) non vengono mai utilizzate nel corso dell’esperimento e dell’analisi dei suoi risultati. L’unica formula utilizzata è quella relativa al calcolo della probabilità totale per eventi indipendenti. Bell scrisse delle disuguaglianze sperimentabili tali da dover essere verificate nel caso valga l’ipotesi di località. Queste previsioni, quindi, potevano essere confrontate con quelle di qualunque altra teoria. Questo paragrafo non è semplice. Daremo subito il risultato a cui arrivò Bell con i suoi calcoli e Aspect (1947-) con le relative misure sperimentali (cfr. Aspect, Grangier, Roger, 1982). Il risultato sperimentale è quello previsto dalla meccanica quantistica, che quindi non è locale. L’argomentazione di Einstein, Podolsky e Rosen era giusta, ma non la conclusione, perché l’ipotesi di partenza non era vera: non è la meccanica
326
fisica per filosofi
quantistica a essere incompleta, è l’ipotesi di località a dover essere cambiata. L’entanglement rende possibili correlazioni superluminali che risultano essere unmediated, immediate, unmitigated (“non mediate”, “immediate”, “non mitigate”). Ma non permette l’invio di segnali superluminali. La teoria della relatività non viene violata.
Ecco la discussione, semplificata, dell’esperimento mentale di Bell e delle misure che vennero eseguite da Aspect. Nella parte successiva non vengono presentate le disuguaglianze di Bell proposte nel suo articolo originale del 1964; ne daremo una versione più semplice, anche se rigorosamente corretta. Supponiamo di avere una sorgente che crea coppie fotoni entangled B e G22: 1 | ψ> = [|B, α> ∙ |G, α> + |B, α + 90°> ∙ |G, α + 90°>] 2 dove α e α + 90° rappresentano due assi ortogonali qualunque riferiti alla grandezza misurabile “polarizzazione” (cfr. par. 7.5.4: scomposizione di due fotoni entangled). I due fotoni, che viaggiano in direzioni opposte, vengono inviati a due cristalli di calcite, ognuno con un asse di riferimento in direzione verticale, V. Nota 1. Si tratta di una direzione convenzionale di riferimento nel laboratorio non necessariamente coincidente con la “verticale” riferita alla superficie terrestre. Nota 2. Un cristallo di calcite è lo strumento di analisi dei fotoni polarizzati che sostituisce i polarizzatori usati fino a questo momento. Vediamo come funziona.
Supponiamo di inviare un fotone a un cristallo di calcite, caratterizzato da una direzione di riferimento V; dal cristallo esce sempre un fotone che, a seconda della polarizzazione, viene registrato come Up (U; polarizzazione orizzontale) o come Down (D; polarizzazione verticale) da due contatori di fotoni U e D (cfr. fig. 7.20). Quindi, nel caso del cristallo di calcite non si perdono metà dei fotoni come avveniva per un polarizzatore su cui venivano inviati fotoni entangled: in quel caso passava la metà dei fotoni mentre l’altra metà veniva assorbita, perciò spariva. Quindi non avevamo modo di controllare
meccanica quantistica
327
figura 7.20 Schema di rivelazione utilizzato per ogni fotone per studiare le disuguaglianze di Bell |O>
1 fotone V Cristallo
|V>
UP = U Contatori DOWN = D
Ogni fotone che arriva sul cristallo di calcite ne esce in due direzioni possibili. Verso U per la polarizzazione orizzontale, o verso D per la polarizzazione verticale; all’uscita dei due cammini si trovano poi due contatori che misurano rispettivamente i conteggi U(Up) e i conteggi D(Down).
cosa fosse successo e come fossero i fotoni scomparsi. Questo fatto può creare dei problemi nell’analisi dell’esperimento. Le misure sono fatte inviando N coppie di fotoni entangled [B, G] ai cristalli, che partono e arrivano una coppia per volta, e registrando le sequenze di U e D misurate da ogni contatore. Lo scopo è di analizzare la statistica delle misure fatte su molte coppie di fotoni per ogni singola modalità di misura. Le configurazioni utilizzate in questo esperimento sono tre, con tre differenti configurazioni dei cristalli, cioè dei relativi angoli dell’asse di riferimento del cristallo rispetto alla verticale (cfr. fig. 7.21). Ecco le tre misure che possono essere fatte, e un esempio di un risultato tipico dell’esperimento. 1. Polarizzazione P(θ) per un singolo fotone B oppure G: per qualunque angolo θ abbiamo il 50% di probabilità di avere U o D; una sequenza tipica sarà: B/G:
UUDU DUDU DDUD UDDD UUDU
(~ 50% U; 50% D)
2. “Polarizzazione accoppiata” PA(θ) per la coppia di fotoni (B, G): l’angolo è uguale, è la stessa situazione dell’epr, le sequenze dei risultati U e D sono casuali, abbiamo sempre il 50% di probabilità di avere U o D, ma le due sequenze sono uguali. Ecco un esempio: B: G:
UUDU DUDU DDUD UDDD UUDU UUDU DUDU DDUD UDDD UUDU
(~ 50% U; 50% D) (~ 50% U; 50% D)
3. “Polarizzazione correlata” PC(θ), è la correlazione della polarizzazione dei due fotoni: gli angoli sono diversi, θ = θB – θG. Le sequenze saran-
328
fisica per filosofi
figura 7.21 Configurazioni utilizzate nell’esperimento (mentale) di Bell (a) z
(b) PB, G
z
PB θB
θ B, G S
P(θ)
(c) z θB
B S
PB
z G θG
PA (θ): θB = θG = θ
B PG
z S G
θG
PG
PC (θ): θB ≠ θG; θ = θB – θG
S è la sorgente dei fotoni; B e G sono i due fotoni entangled; z è un asse di riferimento (il laboratorio); PB, G è la direzione dell’asse dei cristalli che misurano rispettivamente il fotone B e il fotone G; θ è l’angolo fatto da ogni cristallo con la direzione di riferimento z. Vengono fatte tre diverse serie di misure secondo le configurazioni in (a) P(θ), in (b) PA(θ) e in (c) PC(θ). (a) P(θ) è la misura di polarizzazione fatta su uno dei due fotoni, il B o il G, con il cristallo a un certo angolo θ. (b) PA(θ) è la “polarizzazione accoppiata” in cui gli angoli dei due polarizzatori sono uguali, θB = θG = θ. (c) PC(θ) è la “polarizzazione correlata”, cioè la correlazione della polarizzazione misurata sui due fotoni quando gli angoli dei due cristalli sono diversi fra di loro e dalla direzione di riferimento z: θB ≠ θG; θ = (θB – θG).
no diverse, per ogni conteggio abbiamo un match (M) se il risultato è lo stesso, un errore (E) se il risultato è diverso. Per esempio: B: UUDU DUDU DDUD UDDD UUDU G: UUDD DUDD DUUD UDDU UDDU Match: MMM MMM M MM MMM M MM Errori: E E E E E
N fotoni misurati N fotoni misurati NM = numero di M NE = numero di E
dove N = 20; M = 15; E = 5. Si conta, quindi, la frequenza dei matches = PC(θ) e quella degli errori E(θ), come il numero di eventi relativi (NM o NE) diviso il numero di eventi (conteggi) totali N: PC (θ) =
N N Numero di matches (θ) Numero di errori (θ) = M ; E (θ) = = E Numero totale di conteggi N Numero totale di conteggi N
meccanica quantistica
329
tabella 7.7 Sequenza delle quattro misure della correlazione fra i due fotoni che porteranno alla misura di Bell Direzione dei cristalli
↑↑ ↑↑ ↑↑ ↑ ↑
θB
θG
θ = θG – θB
0
0
0
→
0
30°
30°
→
0
0
0
→
0
–30°
–30°
→
2 ∙ 30° = 60°
→
PC
E
1
0
B G G e B allineati con z
B G G non allineato
3/4 1/4
B G
G e B allineati con z
1
0
B G G non allineato
La misura di Bell: B e G non allineati
↑ ↑
3/4 1/4
B G
30° –30°
?
?
Ecco i possibili risultati per alcuni angoli particolari: 1. θ = 0, PC(0) = 100% = 1 E = 0% = 0: tutti i valori sono uguali, non ci sono errori; 2. θ = 90°, PC(90°) = 0% = 0 E = 100% = 1: tutti i valori sono diversi, c’è il 100% di errori; 3. θ = fra 0° e 90°, E assumerà dei valori intermedi fra 0 e 1; scegliamo sperimentalmente l’angolo θ per cui E = 1/4 (un errore ogni quattro fotoni): si trova che θ = 30°. Notiamo che la scelta è puramente sperimentale, non abbiamo ipotizzato nessuna teoria per prevedere l’angolo per cui E = 1/4. Nella tab. 7.7 abbiamo la sequenza delle quattro misure della correlazione fra i due fotoni che porteranno poi alla misura di Bell. La misura di Bell, concettualmente: se vale la località, allora ruotare uno dei due cristalli non può influire sul risultato dell’altro perché le misure sono praticamente istantanee e non ci può essere un’influenza istantanea
330
fisica per filosofi
a distanza (località). I risultati della misura dei due contatori, quindi, sono eventi casuali indipendenti, la cui probabilità di accadimento congiunto è semplicemente la somma delle due probabilità singole. Pertanto gli errori (come i matches) totali, rispetto alla sequenza “giusta”, cioè quella che si avrebbe per θ = 0, devono essere la somma degli errori misurati da ogni singolo [cristallo + contatore]. Dunque, E(θ = 60°) = 2 ∙ E(θ = 30°) = 2 ∙ 1/4 = 2/4 = 1/2 = 50%: dovremmo avere, in media, il 50% di errori. Tuttavia, nella sequenza, potrebbero esserci due errori nella stessa posizione, che darebbero un risultato giusto, per esempio: Sequenza “giusta”: B: G: Errori fra B e G:
UUDU DUDU DDUD U D D U D U D D D D D D (3 errori nella sequenza B) U U D D D U D D D U U D (3 errori nella sequenza G) E E EE (4 errori totali < 3 + 3)
Quindi, il numero degli errori totali sarà minore o uguale a quello del massimo teorico (1/2). La disuguaglianza di Bell afferma che, se vale la località, il numero di errori (per θ = 60°) deve essere, appunto, E ≤ 1/2. È importante sottolineare ancora una volta che il risultato della disuguaglianza di Bell (E ⋜ 50%) è stato calcolato utilizzando solo la definizione di probabilità, non è stata ipotizzata alcuna legge fisica, a parte la località degli eventi naturali. Pertanto, è solo ed esclusivamente un test di località. La previsione della meccanica quantistica viene fatta, ovviamente, utilizzando le leggi della meccanica quantistica. Le due previsioni sono molto diverse: qualunque teoria locale dovrà dare un valore di E ⋜ 50%. La meccanica quantistica prevede che E = 75%. Previsione della disuguaglianza di Bell:
E (località |60°) ≤ 1/2 = 0,5 = 50%.
Previsione della meccanica quantistica23: E (meccanica quantistica, teoria|60°) = sin2 θ = 3/4 = 0,75 = 75%.
Se ne deduce che la meccanica quantistica non è una teoria locale; resta da vedere quale risultato darà l’esperimento reale (cfr. fig. 7.22). Le misure su un apparato che riproduceva l’esperimento mentale proposto da Bell, sono state fatte negli anni 1981 e seguenti da Aspect e collaboratori (cfr. Aspect, Grangier, Roger, 1981).
meccanica quantistica
331
figura 7.22 Test di Aspect sulle disuguaglianze di Bell con efficienza e < 1
Risultato sperimentale Previsione per qualunque teoria locale: PC (60°)≤0,5
0,3
0,4
Previsione della meccanica quantistica
0,5
PC (60)
0,6
0,7
0,8
Nella figura vediamo i risultati sperimentali e le previsioni teoriche dell’esperimento di Aspect sulla località della realtà: la località della realtà è falsificata; la previsione della meccanica quantistica conferma, entro le incertezze, il risultato sperimentale.
Le differenze con la proposta di Bell erano essenzialmente due: la prima riguarda il numero vero e proprio delle previsioni teoriche. Le misure, infatti, furono eseguite con contatori che avevano un’efficienza e < 1, cioè non tutti i fotoni che arrivavano ai contatori venivano contati. In questo caso si possono fare i calcoli delle disuguaglianze di Bell inserendo l’efficienza dei contatori. La seconda differenza, concettualmente molto importante, era questa: gli angoli dei cristalli venivano ruotati mentre i fotoni erano in volo, giusto prima della misura. E il comando di quanto ruotare l’angolo di ogni polarizzatore veniva generato al momento utilizzando una sequenza di numeri casuali creata al momento e sconosciuta anche agli sperimentali. Questo per evitare una possibile obiezione sul fatto che tutto l’universo sia in uno stato interlacciato24, in cui, quindi, il porre gli angoli dei polarizzatori secondo determinate direzioni prima dell’inizio dell’e-
332
fisica per filosofi
sperimento avrebbe potuto influenzare tutto l’universo, anche i fotoni che partivano, imponendo una scelta dei risultati sperimentali. Questa visione non corrisponde a nessuna teoria esistente. Da tali esperimenti vanno escluse tutte le possibilità, anche in riferimento a situazioni non conosciute o improbabili. Ecco il risultato sperimentale (cfr. Aspect, Grangier, Roger, 1982): E = 0,601 ± 0,020 E di seguito, la previsione della meccanica quantistica (calcolata per un’efficienza e < 1): E = 0,612 Un’ulteriore misura è stata fatta da Gregor Weihs e collaboratori (cfr. Weihs et al., 1998), utilizzando un set intero di disuguaglianze di Bell (due coppie di valori degli angoli dei due polarizzatori α, α’, β, β’): Ipotesi di località (disuguaglianza di Bell): S (località) ≤ 2. Previsione della meccanica quantistica: S (MQ+efficienza)teoria = 2,72. Misura: S (esperimento) = 2,73 ± 0,02.
L’efficienza era ancora molto bassa (5%), i puristi non la ritenevano una prova definitiva, le misure sono state ripetute nel corso degli anni con efficienze molto più alte confermando i risultati precedenti che ormai vengono universalmente accettati come validi. Conclusione 1 L’ipotesi di località è falsificata: la realtà, in determinate condizioni, può essere non locale. Possono esistere interazioni non locali, cioè con una correlazione immediata anche a grandi distanze, ma solo per sistemi quantistici entangled (interlacciati). Conclusione 2 Il risultato sperimentale è quello previsto dalla meccanica quantistica che, quindi, non è locale. L’argomentazione di Einstein, Podolsky e Rosen era giusta, ma non la conclusione, perché l’ipotesi di partenza non era vera: non è la meccanica quantistica a essere incompleta, è l’ipotesi di località a dover essere cambiata. L’entanglement rende possibili correlazioni superluminali che risultano essere unmediated, immediate, unmitigated (“non mediate”, “immediate”, “non mitigate”). Ma
meccanica quantistica
333
non permette l’invio di segnali superluminali. La teoria della relatività non viene violata: l’osservatore che misura il fotone B non ha modo di accorgersi delle azioni compiute sul fotone G; i conteggi di G, all’uscita del polarizzatore, sono determinati dal caso, saranno sempre sequenze casuali su cui non si può avere nessun controllo. Analogamente, la statistica dei conteggi di B sarà sempre un 50% Up e un 50% Down e B non potrà estrarre da questa sequenza nessuna informazione.
7.7. La vita di un sistema quantistico interlacciato A questo punto qualcuno potrebbe chiedersi: ma allora è vero che esistono sistemi collegati fra loro, magari in altri paesi, o pianeti o galassie? E forse tutti gli esseri umani sono collegati da questi invisibili legami dati dall’entanglement… Molti ciarlatani fanno affermazioni di questo genere, affermazioni che spesso si trovano in rete, su pubblicazioni varie, come argomenti di conferenze, ovviamente a pagamento (per un’ottima trattazione non specialistica di questi punti, cfr. Gazzola, 2017). Va chiarito che la possibilità che esistano oggetti macroscopici o addirittura esseri viventi in uno stato entangled, quindi interlacciati tra loro, è praticamente impossibile. Vediamo perché. Uno stato interlacciato rimane nello stato interlacciato fin quando non viene effettuata una misura su di esso, in particolare una misura che potrebbe rivelare la grandezza interlacciata. Negli esempi che abbiamo fatto finora i due fotoni smettevano di essere due fotoni entangled qualche istante dopo la misura di uno dei due. Nell’istante immediatamente successivo si poteva misurare il secondo fotone e verificare le eventuali correlazioni, ma l’evoluzione temporale dei due da quel punto in poi diventava un’evoluzione libera, quella di due particelle indipendenti, senza nessun legame fra loro. Ora, il fatto è che due fotoni sono un oggetto molto particolare. Possiamo creare dei fotoni con certe caratteristiche e inviarli su una fibra ottica per centinaia di chilometri senza che cambino sensibilmente il loro stato. È il caso di ricordarsi che un fotone per fare il giro della Terra in una fibra ottica ci mette qualche centinaio di millisecondi, quindi un fotone che mantenesse le sue proprietà di interlacciamento anche solo per un secondo avrebbe modo di fare in questo tempo varie volte il giro della Terra. Il problema è di mantenere quella che si chiama la coerenza di un sistema interlacciato. Cioè, quanto tempo vive un sistema interlacciato
334
fisica per filosofi
messo in contatto con l’ambiente. E questo è il grosso problema per un oggetto macroscopico. Un oggetto macroscopico, infatti, è sempre in contatto con l’ambiente, sulla Terra intorno ai 20 °C (circa 293 K). Questo contatto termico, che avviene con un continuo scambio di energia fra il corpo e il mondo esterno, consiste in uno scambio di pacchetti di energia su tempo molto brevi, tipicamente miliardesimi o milionesimi di secondo (sono giusto ordini di grandezza). Ma ogni scambio di energia è un’interazione con l’ambiente esterno; dunque, è una misura dello stato del sistema. In pratica, ogni oggetto macroscopico interagisce: è come se venisse osservato, su tempi brevissimi e in continuità dall’ambiente esterno. Ed è sufficiente la prima di questi miliardi di interazioni a distruggere lo stato di interlacciamento del sistema. Ricordiamoci che quello interlacciato è uno stato quantistico molto “delicato”. Serve molto poco a distruggerlo. Per cui è impensabile avere sistemi interlacciati macroscopici, tanto meno a temperatura ambiente. Il problema di mantenere in vita uno stato interlacciato è analogo a quello di mantenere uno stato quantistico prima che questo possa diventare classico. Con ciò si intende quando un sistema di moltissime particelle, tutte descritte da funzioni d’onda che hanno relazioni di fase ben precise e fisse tra di loro, diventano, in seguito a molteplici interazioni, un insieme di particelle descritte da funzioni d’onda senza alcuna relazione reciproca. Il sistema è quindi diventato classico e ha perso alcune delle caratteristiche peculiari di uno quantistico: non potrà più essere uno stato interlacciato, non potrà avere fenomeni di tunneling, non potrà manifestare fenomeni di interferenza con altri sistemi quantistici ecc. Per dare un’idea di quanto sia difficile mantenere in uno stato coerente un sistema macroscopico vorremmo mostrare una misura da noi fatta su un sistema particolare (cfr. Castellano et al., 2009). Nella fig. 7.23 si può vedere la misura del tempo di decoerenza di un sistema quantistico macroscopico in contatto con l’ambiente. Si tratta di un sistema molto piccolo (le dimensioni sono inferiori al millimetro) e molto freddo (il sistema è raffreddato a circa –273 °C). Il sistema quantistico misurato è un qu-bit, cioè un bit quantistico, che oscilla fra gli stati 0 e 1. Nella figura si vede un’oscillazione che rappresenta il continuo passaggio del qu-bit da uno stato quantistico (1) a un altro stato quantistico (0). Quando l’oscillazione finisce vuol dire che l’oggetto non si comporta più come un oggetto quantistico, ma è diventato un bit classico che si può trovare solo negli stati 0 oppure 1.
meccanica quantistica
335
figura 7.23 Misura del tempo di decoerenza in un sistema quantistico macroscopico in contatto con l’ambiente 1,0
Probabilità
0,8 0,6
0,4 0,2 0,0
1
2
3 4 Durata dell’oscillazione ∆t (ns)
5
6
L’oggetto in esame è un dispositivo superconduttore delle dimensioni di circa pochi micron (10–6 m) raffreddato alla temperatura di circa 0,05 K ≅ –273 °C. L’ampiezza dell’oscillazione mostra quanto il sistema sia quantistico. Quando l’oscillazione è fra 0 e 1 (al tempo Δt = 0) il sistema è completamente quantistico. Man mano che passa il tempo, l’oscillazione si attenua, quando il valore medio sarà arrivato a 0,5 il sistema sarà completamente classico. Si può vedere come questo sistema, molto piccolo e molto freddo, ha uno stato quantistico che dura pochi nanosecondi, quindi pochi miliardesimi di secondo. Fonte: adattata da Castellano (2009, fig. 6).
Si può vedere come lo stato quantistico coerente duri pochi miliardesimi di secondo. Dunque, per concludere questo breve paragrafo, verremmo sottolineare ancora una volta che un sistema quantistico che presenti comportamenti quantistici è un oggetto tipicamente piccolo, molto piccolo. Sistemi macroscopici con comportamenti quantistici si possono avere se raffreddati a temperature alle quali l’agitazione termica diventa trascurabile, vicina allo zero assoluto. Sistemi quantistici macroscopici, veramente macroscopici, a temperatura ambiente e che restino “quantistici” per tempi lunghi al momento non sono stati visti e sembra difficile che possano esistere. Potrebbero esistere, tuttavia, fenomeni brevissimi, su scale microscopiche che presentano fenomeni di coerenza quantistica o addirittura di interlacciamento. In particolare, ci sono seri studi e alcune evidenze su fenomeni quantistici di questo tipo in sistemi biologici, quindi a temperatura ambiente (per una recente rassegna, cfr. l’ottimo Al-Khalili, McFadden, 2015).
336
fisica per filosofi
7.8. La non località oggi. Crittografia quantistica La non località, cioè la correlazione di particelle interlacciate, può essere utilizzata per trasmettere messaggi cifrati sicuri tramite l’invio di fotoni opportunamente preparati. Il problema nella trasmissione di messaggi cifrati è di trovare una chiave che codifica il messaggio da trasmettere che non possa essere intercettata e, quindi, decifrata. Il fatto è che, dato un messaggio cifrato, sarà quasi sempre possibile decifrarlo con opportuni algoritmi che operano su di esso; sarà solo una questione di tempo e di potenza di calcolo. L’unica soluzione è di impedire fisicamente a un osservatore esterno di accedere al messaggio da decifrare e/o alla chiave. Questo si può fare se la chiave è una sequenza di U e D misurata su due fotoni entangled. L’operazione non è così semplice, è necessaria in ogni caso una comunicazione successiva fra chi invia il messaggio e chi lo riceve. Questa comunicazione, essendo una trasmissione di informazione, verrà fatta con segnali standard che vanno, quindi, alla velocità della luce, ma il cuore di questa tecnica di cifratura sta nell’utilizzo delle correlazioni fra coppie di fotoni entangled: questa sequenza è intrinsecamente sicura. Il protocollo prevede che in un luogo vengano create delle coppie di fotoni entangled, uno dei quali viene inviato a chi deve ricevere il messaggio, mentre l’altro rimane a chi deve inviarlo. Lo stato di interlacciamento fra i due fotoni sparisce appena uno dei due viene “osservato” o intercettato, a causa del collasso della funzione d’onda. Un eventuale “osservatore” esterno che intercettasse la sequenza trasmessa – anche ritrasmettendola – provocherebbe il collasso dello stato quantistico, le correlazioni andrebbero perse e chi doveva ricevere il messaggio se ne accorgerebbe. La tecnica, dunque, semplificando, è di inviare molte coppie di fotoni, effettuare una misura di polarizzazione con alcune modalità particolari riguardo alla direzione dei polarizzatori – sia chi invia che chi riceve – e scrivere la sequenza ottenuta. Scambiarsi alcune informazioni sulla sequenza misurata, verificare che il messaggio interlacciato non sia stato intercettato e utilizzare la sequenza per cifrare il messaggio. Questa tecnica viene impiegata senza problemi per transazioni sicure (finanziarie, fra enti governativi, per dati sensibili). I fotoni possono viaggiare con la fibra ottica dei segnali telefonici ad alta velocità senza perdere le loro proprietà e il messaggio può essere trasmesso per centi-
meccanica quantistica
337
naia di chilometri (per ora). Gli apparati per la cifratura tramite fotoni interlacciati sono venduti liberamente e possono essere acquistati, anche se non sono proprio economici.
7.9. Il teorema di Noether Vorremmo concludere questo capitolo con un teorema. Può sembrare strano che dopo qualche centinaio di pagine in cui si è parlato solo di principi o di leggi sperimentali si arrivi ora a parlare di un teorema. Eppure quello di Emmy (Amalie) Noether (1882-1935) è uno dei più affascinanti teoremi che coinvolgono le nostre conoscenze e vale la pena di discuterne. Noether, donna ed ebrea tedesca, non ebbe una vita facile. Prima le fu impedito di iscriversi a una scuola per prepararsi all’esame di maturità. Nel 1900 in Germania e in Austria l’educazione formale delle donne finiva all’età di 14 anni e la loro iscrizione regolare all’università era del tutto fuori questione (cfr. Bonolis, 2010). Per anni insegnò all’università, prima di nascosto e poi gratuitamente: come donna, secondo alcuni accademici, non poteva avere la qualifica di professore. Poi il nazismo le vietò l’insegnamento, essendo ebrea; emigrò allora negli Stati Uniti dove morì a 53 anni in seguito a un’operazione chirurgica. Il teorema che porta il suo nome, scritto in forma matematica, è incomprensibile per chi non sia padrone del linguaggio fisico-matematico. Proviamo a leggerne l’enunciato: teorema di noether A ogni simmetria della Lagrangiana, ovvero a ogni trasformazione continua delle coordinate generalizzate qi e q.i ed eventualmente del tempo t, che lascia inalterata la Lagrangiana ℒ(qi , q.i , t), corrisponde una quantità conservata.
Ecco la “traduzione” di questo teorema in un linguaggio semplificato, più comprensibile:
teorema di noether bis A ogni grandezza fisica non osservabile corrisponde una simmetria nella descrizione dell’universo. Questa simmetria implica la conservazione di un’altra grandezza fisica.
338
fisica per filosofi
tabella 7.8 Alcune relazioni fra grandezze non osservabili, la simmetria risultante e la legge di conservazione che ne consegue secondo il teorema di Noether Grandezza non osservabile
Simmetria
Legge di conservazione
Posizione spaziale assoluta
Traslazione nello spazio
Quantità di moto
Tempo assoluto
Traslazione nel tempo
Energia
Direzione spaziale assoluta
Rotazione nello spazio
Momento angolare
Il concetto di simmetria è, intuitivamente, abbastanza semplice. Una simmetria è legata a un’operazione che, applicata a un oggetto, ne lascia invariato l’aspetto. In geometria il significato è immediato: una sfera è simmetrica per qualunque angolo di rotazione intorno al suo centro. Un quadrato è simmetrico per una rotazione di 90° e multipli di 90°, sempre intorno al suo centro e così via. Analogamente si hanno delle simmetrie per determinate grandezze fisiche. Per esempio, la distanza fra due punti: la distanza tra Firenze e Bologna lungo l’autostrada A1 è indipendente da dove abbia posto l’origine e cominciato a contare i chilometri; questa distanza vale sempre circa 106 km. Oppure un intervallo di tempo: il tempo necessario per cuocere un uovo sodo è di circa 9’, ed è indipendente da quando faccio “partire” il cronometro. Quello che conta è solo l’intervallo di tempo fra l’istante iniziale e quello finale. Il significato del teorema di Noether è questo: consideriamo una grandezza fisica, la prima della tab. 7.8 per esempio: la posizione assoluta nello spazio. Essa non è una grandezza osservabile. Possiamo definire e misurare solo una posizione relativa all’origine di un certo sistema di riferimento. Ma non esiste un sistema di riferimento assoluto, per cui possiamo dare un’origine definita per le coordinate. Questa impossibilità di individuare l’origine assoluta dello spazio corrisponde a una simmetria fondamentale: quella delle traslazioni nello spazio (se non esistesse questa simmetria potremmo individuare un sistema di riferimento privilegiato). A questa simmetria corrisponde, dato il formalismo utilizzato per descrivere le leggi della fisica classica, la conservazione della grandezza fisica “quantità di moto”, cioè il prodotto della massa m per la velocità v–. È importante sottolineare che la grandezza finale che si conserva non è quella iniziale non osservabile: per esempio, alla non osservabilità del
meccanica quantistica
339
tempo assoluto corrisponde la conservazione dell’energia. Le tre grandezze della tab. 7.8 sono solo le prime, all’elenco se ne sono poi aggiunte altre della meccanica classica, relativistica o quantistica. Il teorema di Noether, insieme al principio di indeterminazione di Heisenberg, hanno qualcosa in comune: entrambi riguardano coppie di grandezze fisiche. Il principio di indeterminazione si scrive per coppie di grandezze che hanno un limite nella precisione con cui ne possiamo parlare: quindi, rappresenta un limite alla definizione (conoscenza) intrinseca e contemporanea di coppie di grandezze fisiche. Il teorema di Noether, partendo sempre dalla mancanza di definizione (conoscenza) di una certa grandezza, stabilisce, invece, una legge di conservazione per una grandezza (misurabile) completamente differente. Sono, in parte, opposte e complementari.
Percorso storico-filosofico 8. Determinismo, caso, libero arbitrio: la discussione sulla fisica quantistica Fin dalla sua prima formulazione la meccanica quantistica suscita vivaci discussioni filosofiche per le modifiche che introduce nella rappresentazione fisica della natura. Tra le questioni più discusse vi è l’indeterminismo della teoria. Per introdurre la questione bisogna prima di tutto chiarire il significato del determinismo in fisica: il termine “determinismo”, quando è applicato a una teoria fisica, significa che la dinamica è perfettamente e univocamente determinata, per cui, date le condizioni iniziali di un sistema, tutti gli stati successivi possono essere determinati con certezza e precisione. La meccanica classica di Newton, da questo punto di vista, è una teoria deterministica, tanto che il matematico Laplace, nel Saggio filosofico sulle probabilità (1814), inventa la celebre immagine di un’intelligenza onnipotente che, data la conoscenza della posizione di tutti gli oggetti di cui è composto l’universo e delle forze che li mettono in movimento, sarebbe stata in grado di prevedere tutti gli stati successivi applicando le leggi matematiche: «Niente sarebbe incerto per essa e l’avvenire come il passato sarebbe presente ai suoi occhi» (Laplace, 1820, p. 3). La nuova meccanica quantistica formulata negli anni Venti del Novecento comporta matematicamente l’impossibilità di prevedere con esattezza assoluta gli esiti degli esperimenti di misura. Heisenberg,
340
fisica per filosofi
uno degli scopritori della nuova teoria, formula questo risultato nel suo principio di indeterminazione, ricavandone un’importante implicazione filosofica: l’impossibilità di conoscere esattamente lo stato presente di un sistema renderebbe impossibile applicare il classico principio di causalità allo studio dell’evoluzione del sistema stesso (cfr. Heisenberg, 1927). Heisenberg sostiene poi che la riduzione della conoscenza fisica alla conoscenza dei risultati sperimentali si accorda con l’epistemologia del positivismo, che rifiuta l’esistenza di stati fisici empiricamente inosservabili. Nella formulazione canonica della teoria questo aspetto indeterministico si esprime matematicamente nel parametro probabilistico che regola la predizione degli esiti degli esperimenti di misura, espresso nella cosiddetta “regola (o legge) di Born”. Assume così risalto un fattore di casualità nella nuova dinamica, che molti fisici trovano inaccettabile. Tra questi c’è Einstein, che riconosce l’efficacia predittiva della nuova meccanica, ma la ritiene una teoria incompleta e provvisoria in base a una concezione che non ammette il caso come fattore naturale: gli aspetti probabilistici della teoria ne fanno uno strumento per predire risultati sperimentali, ma non una descrizione oggettiva e completa della realtà. Questo tipo di dissenso è poi ripreso dal fisico David Bohm, che elabora una teoria equivalente sul piano predittivo e in linea di principio deterministica (nota come “meccanica bohmiana”), in cui resta comunque una limitazione di fatto nella determinazione degli stati futuri di un sistema. Un altro aspetto di dissenso riguarda il ruolo dell’osservatore nella teoria. La determinazione sperimentale dei valori delle variabili quantistiche, infatti, coinvolge intrinsecamente l’osservatore che decide quale variabile misurare. La teoria, a differenza della meccanica classica, impedisce di affermare sempre quali siano i valori delle variabili prima dell’atto di misurazione. Su questo punto si sofferma approfonditamente Bohr, che insieme a Heisenberg elabora le basi concettuali della teoria in quella che è rimasta nota come “interpretazione di Copenaghen”, o “ortodossa” della meccanica quantistica. Per Bohr, il ruolo dell’osservatore si esprime nel “principio di complementarità”, secondo cui non esiste una descrizione univoca di un sistema, ma ci sono solo diverse descrizioni complementari. Secondo lo stesso principio, non sarebbe mai possibile includere l’osservatore in una descrizione univoca del sistema fisico e, pertanto, la nuova fisica costituirebbe una prova a favore della capacità di determinare liberamente le proprie azioni indipendentemente dal si-
meccanica quantistica
341
stema fisico in cui queste si iscrivono. Così Bohr collega l’indeterminismo fisico con il problema filosofico del libero arbitrio. A commento dei dibattiti sorti intorno alla nuova fisica, negli anni Cinquanta il filosofo Karl Popper (1982, p. 174) afferma che esiste uno “scisma nella fisica”, che divide sostenitori di determinismo, realismo e oggettivismo, come Einstein, Schrödinger e Bohm, e sostenitori di indeterminismo, strumentalismo e soggettivismo, come Bohr, Heisenberg e Pauli, ovvero i fautori dell’interpretazione di Copenaghen25. I primi concepiscono la natura come sottoposta a un ordine deterministico di fatti indipendenti dall’osservatore, i secondi, invece, la considerano conoscibile soltanto secondo leggi indeterministiche relative ai risultati sperimentali e dipendente, pertanto, dal ruolo del soggetto osservatore. Popper propone di superare le divisioni con una soluzione che combini realismo e indeterminismo: per Popper l’indeterminazione stabilita dalla fisica quantistica non è una caratteristica della conoscenza fisica, ma un fatto oggettivo, che non dipende dall’osservatore. Le particelle sarebbero sottoposte nel loro moto a dei fattori dinamici intrinsecamente casuali. Anche questa idea popperiana, poi ripresa dal suo allievo Paul Feyerabend, sarebbe stata realizzata in una formulazione alternativa della meccanica quantistica, il cosiddetto “modello di riduzione dinamica” di Ghirardi, Alberto Rimini e Tullio Weber (si parla di modelli grw). Il fatto che le alternative teoriche come meccanica bohmiana e modelli grw non sorgano da nuovi dati sperimentali bensì da pure esigenze epistemologiche fa capire quanto la nuova meccanica suscitasse e susciti discussioni filosofiche. Per orientarsi in queste discussioni è opportuno distinguere i due temi che abbiamo introdotto: quello della causalità e quello del libero arbitrio. Riguardo al primo, Heisenberg afferma che la teoria comporta una modifica rispetto alla concezione classica della causalità. Molti filosofi, come Grete Hermann ed Ernst Cassirer, hanno sottolineato a questo proposito che la nuova meccanica, in quanto probabilistica, non contraddice la nozione di causalità fisica. La causalità fisica andrebbe intesa, infatti, come la connessione dei fenomeni secondo una regola rigorosa, e non richiederebbe che questa regola sia deterministica. Ora, nella meccanica quantistica esiste una legge rigorosa di causalità, anche se probabilistica e pertanto diversa da quella deterministica della meccanica classica26. Un tema diverso è quello del rapporto tra la nuova teoria e il libero arbitrio. Dopo Bohr, anche Popper collega le due questioni, affermando
342
fisica per filosofi
che un mondo rigidamente deterministico impedirebbe la possibilità che gli esseri umani, in quanto esseri naturali, possano determinare liberamente le proprie azioni. Questa incompatibilità, osserva Popper, era stata già rilevata da Kant che, infatti, aveva ritenuto necessario limitare l’ambito della fisica ai fenomeni per salvaguardare la possibilità della volontà libera. L’indeterminismo, quindi, è per Popper una condizione necessaria del libero arbitrio. Lo stesso Popper, però, riconosce che l’indeterminismo non è una condizione sufficiente del libero arbitrio: un sistema puramente causale non sarebbe solo per questo anche libero. Tale constatazione dipende da un chiarimento concettuale fatto già dal filosofo Moritz Schlick, il quale, in un articolo sulla Causalità nella fisica contemporanea (1931), aveva sottolineato la distinzione tra due concetti completamente eterogenei: quello fisico della causalità (in questo caso espressa in termini probabilistici) e quello etico della libertà (cfr. Schlick, 1974, p. 77). Alcuni anni dopo Cassirer, in Determinismo e indeterminismo nella fisica moderna (1937), aveva collegato con grande chiarezza la distinzione concettuale di Schlick sulle forme di causalità alle considerazioni sull’indeterminismo: La meccanica quantistica non ha abbandonato in alcun modo il concetto della legalità della natura, ma piuttosto ne ha dato una nuova versione. Se dunque un tale concetto costituisse una minaccia per l’idea di libertà morale, a quest’ultima non potrebbe venire alcun soccorso neppure da parte della meccanica quantistica […] Al concetto supremo di determinazione non possiamo rinunciare in nessuno dei due casi, né nella costruzione del mondo fisico, né in quella del mondo etico. Ma nel regno dell’essere la determinazione ha luogo secondo altre categorie che non in quello del dovere. Tali categorie non entrano in contrasto perché appartengono a “dimensioni” della considerazione affatto diverse (Cassirer, 1970, pp. 300, 302-3).
In altre parole, il modo in cui si determina uno stato fisico (con calcoli matematici ed esperimenti) è molto diverso da quello in cui si prende una decisione e si determina un’azione. L’indeterminazione (o la causalità) in fisica, dunque, risponde a condizioni diverse rispetto a quelle della libertà etica: quest’ultima, infatti, risiede nella capacità di deliberare sulle proprie azioni e, quindi, comporta il richiamo a delle ragioni di agire, mentre la probabilità e il caso implicano una selezione del tutto immotivata tra diverse possibilità, che non ha nulla a che fare con la razionalità dell’agire.
meccanica quantistica
343
La questione è rimasta aperta ed è ancora dibattuta. Il punto di vista di Cassirer si può collegare alle discussioni sul riduzionismo tra le teorie scientifiche. Se – come vuole il riduzionismo – ogni descrizione scientifica della realtà – per esempio, quella psicologica o quella biologica – è riducibile ai termini della teoria fisica, allora sembra che il determinismo o indeterminismo fisico possano fare la differenza rispetto al libero arbitrio, cioè il determinismo lo escluderebbe e l’indeterminismo lo renderebbe possibile, come sostenuto da Popper. Alcuni scienziati hanno avanzato anche l’ipotesi – che, però, non ha finora trovato riscontri sperimentali – che la fisica quantistica possa giocare un ruolo per comprendere l’emergenza della coscienza in quanto condizione della decisione libera. Di parere opposto sono i filosofi e gli scienziati che, pur difendendo il realismo scientifico, sottolineano che la riduzione di proprietà (o leggi) psicologiche ed etiche a proprietà (o leggi) microfisiche non è imposta dal sapere scientifico. Alcuni hanno sottolineato che l’indeterminismo fisico implica che un evento non è determinato da nessun fattore, quindi non potrebbe essere determinato neanche dal soggetto umano: in tale prospettiva l’indeterminismo non soltanto non sarebbe una condizione della libertà, ma la renderebbe impossibile27.
Percorso storico-filosofico 9. Atomi, particelle e onde: com’è fatta la materia Tra le idee trainanti della rivoluzione scientifica del xvii secolo c’è la riscoperta dell’atomismo antico, dovuta all’attività degli umanisti. Molti scienziati, da Galilei a Newton, ne ricavano l’ipotesi che i fenomeni naturali possano essere spiegati mediante movimenti di particelle impercettibili. Newton, per esempio, sostiene che la materia sia composta di «particelle solide, compatte, dure, impenetrabili e mobili, dotate di date dimensioni e figure» create da Dio (Newton, 1978, p. 600). La concezione particellare resta alla base delle teorie chimiche e termodinamiche sviluppate nei due secoli successivi. Tuttavia, fin dal Settecento cominciano a diffondersi teorie che mettono in dubbio che la particella, o l’atomo siano le forme fondamentali della materia. Alcuni fisici newtoniani, come Ruđer Bošković (nella Teoria della filosofia naturale, 1758), cominciano a supporre che la stessa estensione della materia non sia una proprietà fondamentale, ma il prodotto dell’azione di forze repulsive.
344
fisica per filosofi
Grandi filosofi come Kant e Hegel accolgono e sviluppano questo tipo di filosofia dinamica della materia, che si oppone all’idea che le proprietà essenziali delle particelle non possano essere spiegate e debbano essere assunte come faceva Newton. Questa concezione, tuttavia, non porta immediatamente a nuove conoscenze e non si afferma nella comunità scientifica. La filosofia dinamica della materia è ripresa in seguito, alla luce di nuove teorie scientifiche come l’elettromagnetismo e la fisica dell’energia che iniziano a porre l’esigenza di ampliare l’immagine meccanicistica della natura. Alla fine dell’Ottocento, l’idea che la massa possa essere derivabile dal campo elettromagnetico è molto popolare tra gli scienziati, tanto che il grande matematico Poincaré può scrivere, nella Scienza e l’ipotesi (1906): «Una delle scoperte più stupefacenti che i fisici abbiano annunciato in questi ultimi anni è che la materia non esiste», intendendo per “materia” l’estensione impenetrabile della meccanica classica; ma Poincaré precisa che la scoperta «non è definitiva» (Poincaré, 2003, p. 355). In effetti, molti scienziati all’inizio del xx secolo, tra cui lo stesso Einstein, continuano a lavorare a teorie che porterebbero a superare l’ontologia del meccanicismo sostituendo il campo alla particella come entità fisica fondamentale, ma queste teorie non trovano una formulazione soddisfacente e sperimentalmente fondata. Questo sfondo permette di comprendere come mai la formulazione della meccanica quantistica, negli anni Venti del secolo scorso, comporta subito un acceso dibattito tra fisici e filosofi sul significato della nuova teoria per la concezione della materia. Gli stessi creatori della teoria si dividono su questo tema28. Schrödinger sostiene una concezione “ondulatoria” della materia, secondo cui la funzione d’onda descrive la diffusione di un’onda di materia nello spazio, di cui le “particelle” non sono che parti molto dense. Ma questa concezione risulta incompatibile con la teoria da lui stesso formulata. I principali sostenitori della cosiddetta “interpretazione di Copenaghen”, pur rifiutando compattamente le tesi ondulatorie di Schrödinger, sostengono posizioni filosofiche diverse. Born predilige una rappresentazione particellare della materia, interpretando la funzione d’onda come densità di probabilità di trovare la particella in una determinata regione dello spazio. Nella Filosofia naturale della causalità e del caso (1949), Born torna sulla questione, scrivendo: «Io sostengo che le particelle sono reali, in quanto rappresentano delle invarianti nell’osservazione», cioè degli elementi costanti che accomunano tutte le osservazioni sperimentali; ma Born afferma anche: «pre-
meccanica quantistica
345
ferisco considerare un’onda di probabilità, anche in uno spazio a 3N dimensioni, come una cosa reale, certamente come qualcosa di più che uno strumento per calcoli matematici» (Born, 1962, pp. 132, 134). Funzione d’onda e particella, dunque, descriverebbero entrambe qualcosa di reale, ma nessuna delle due basterebbe a dare una descrizione esaustiva della realtà. Heisenberg e Bohr affermano con decisione che la nuova teoria pone un limite alla visualizzabilità della materia. Heisenberg sottolinea che la matematica della teoria va presa come una descrizione della realtà, e che questa descrizione comporta un superamento della concezione ottocentesca della particella. La teoria parla di “pacchetti d’onda” o “pacchetti di probabilità” capaci di prevedere i fenomeni, ma non permette di risalire a una visualizzazione di particelle di materia che si muovono nello spazio-tempo lungo traiettorie continue. Per interpretare questi assunti, in seguito, Heisenberg elaborerà concezioni epistemologiche che oscillano tra una specie di positivismo (secondo cui conosciamo solo fenomeni) e una peculiare ontologia delle potenzialità: Negli esperimenti sugli eventi noi abbiamo a che fare con cose e fatti, con fenomeni che sono esattamente altrettanto reali quanto i fenomeni della vita quotidiana. Ma gli atomi e le stesse particelle elementari non sono altrettanto reali; formano un mondo di possibilità e di potenzialità piuttosto che un mondo di cose o di fatti (Heisenberg, 2003, p. 217).
A queste prospettive costruite a partire dalla meccanica quantistica si oppone Einstein, il quale elabora diversi esperimenti mentali per mostrare l’incompletezza della teoria, che sono vivamente discussi da Bohr. Inoltre, Einstein attacca sul piano filosofico le tesi di Bohr, Heisenberg e altri, assimilandole all’esse est percipi del filosofo moderno George Berkeley, vale a dire alla concezione immaterialistica secondo cui esiste solo ciò che percepiamo (cfr. Einstein, 1949, p. 669). Einstein adotta un’epistemologia realista, secondo cui la materia deve esistere in determinate parti dello spazio-tempo indipendentemente dall’osservatore. In questa prospettiva, una teoria fisica completa deve poter descrivere gli stati della materia senza lasciare indeterminata nessuna variabile (come la posizione) e secondo leggi necessarie e prive di aspetti probabilistici; in altre parole, ogni teoria fisica deve conservare la continuità e il determinismo tipici della meccanica classica. In particolare, Einstein lavora fino agli ultimi anni a una teoria che realizzi l’obiet-
346
fisica per filosofi
tivo di dedurre la massa dal campo. Ma non mancano teorie realistiche di tipo particellare. Per primo Popper, come abbiamo visto (cfr. Percorso storico-filosofico 8), condivide il realismo epistemologico di Einstein e parla della necessità di sviluppare “teorie quantistiche senza osservatore”, ma sostiene una teoria particellare e indeterministica, in cui le particelle sono soggette a fattori oggettivamente casuali nel loro moto. Per quanto molti filosofi e scienziati abbiano abbandonato le posizioni di Bohr e Heisenberg, grazie al successo sperimentale della teoria è prevalsa gradualmente l’idea che – come scrive Cassirer già negli anni Trenta – la meccanica quantistica comporta l’esigenza di un «nuovo concetto di realtà» e l’abbandono del concetto «cosale» di atomo, quello, cioè, modellato sul corpo percepito dai sensi (Cassirer, 1970, pp. 188-9, 276-7). Ancora oggi la difficoltà di scegliere tra rappresentazione ondulatoria e particellare è illustrata con l’esperimento delle due fenditure, da cui risultano sia aspetti ondulatori della materia (le figure di interferenza, che sembrano risultare dalla sovrapposizione di onde), sia aspetti particellari (la localizzazione della materia in punti ben definiti). Di fronte a questa situazione vengono assunti diversi atteggiamenti. Alcuni danno per assodato che la fisica abbia abbandonato la visualizzazione classica della particella, paragonando questa rivoluzione (e a farlo per la prima volta è stato Heisenberg) a quella della relatività di Einstein rispetto a spazio e tempo assoluti29. Altri lavorano a modelli alternativi della fisica quantistica in cui la visualizzazione è ripristinata mantenendo la stessa capacità predittiva30. Tra gli esempi più popolari nella comunità scientifica c’è l’“interpretazione a molti mondi”, secondo la quale l’atto di osservazione introduce una separazione tra universi paralleli in cui le varie possibilità previste dalla funzione d’onda si realizzano. Con più parsimonia metafisica, due teorie alternative adottano rispettivamente la rappresentazione particellare e quella ondulatoria. La prima si trova nella meccanica bohmiana, a cui abbiamo già accennato (Percorso storico-filosofico 8). Si tratta di una teoria sviluppata per la prima volta negli anni Cinquanta del secolo scorso dal fisico David Bohm a partire dalle obiezioni di Einstein, a cui lavorano ancora oggi da altri fisici. La teoria di Bohm riproduce le previsioni della meccanica quantistica standard, ma mantiene una rappresentazione corpuscolare della materia e introduce una nuova “onda pilota” che permette di ottenere le predizioni sperimentali quantistiche. La teoria di tipo ondulatorio, invece, è quella dei modelli di riduzione dinamica introdotti da Ghirardi, Rimini e Weber nel 1985, anch’essi
meccanica quantistica
347
oggetto di ricerche in corso. Questa teoria, di nuovo, riproduce le predizioni quantistiche considerando, però, quello casuale come un fattore oggettivo della “riduzione del pacchetto d’onde”, che produce la localizzazione dell’onda in determinati punti dello spazio. Entrambe queste teorie, pur conservando alcuni aspetti della meccanica classica, se ne discostano radicalmente per il fatto di introdurre aspetti fondamentali della fisica quantistica come la non località, cioè l’assunzione che gli stati di parti di materia separate nello spazio possono essere dipendenti l’uno dall’altro senza che vi sia un’interazione fisica. Sia la meccanica bohmiana, sia i modelli grw sono stati apprezzati da importanti fisici teorici che si sono dedicati ai fondamenti della meccanica quantistica, come John Bell, e oggi sono oggetto di indagini che mirano a confrontarle sperimentalmente con la meccanica quantistica standard sulla base di predizioni lievemente diverse. La ricerca su queste teorie quantistiche “non ortodosse” è un campo d’indagine aperto e non consolidato, il cui esito è incerto. Lo stesso vale per teorie fondamentali sviluppate negli ultimi decenni per collegare meccanica quantistica e teoria della relatività, come la gravità quantistica e la teoria delle stringhe. A loro volta, queste teorie modificano profondamente l’immagine classica della materia introducendo nozioni difficilmente visualizzabili come uno spazio-tempo discontinuo e delle dimensioni ulteriori rispetto alle quattro dello spaziotempo classico e relativistico. Per quanto ambiziose e promettenti, sono teorie ancora speculative e ipotetiche e non hanno sufficiente supporto sperimentale per poter essere accolte come descrizioni valide della real tà. Nonostante questa incertezza, tipica della ricerca scientifica, nella fisica contemporanea è senz’altro superata l’idea che la realtà fisica fondamentale sia una particella di massa come quella dell’atomismo newtoniano concepita sul modello dei corpi macroscopici e non bisognosa di ulteriori spiegazioni. Ma la questione della natura ultima della materia resta affidata allo sviluppo presente e futuro delle teorie fisiche.
8 Oggi
8.1. Compendio Arrivati alla fine di questo libro è lecito chiedersi: ma dove ci hanno portato tutti i principi e le leggi di cui abbiamo parlato? La descrizione di tutto va ovviamente ben oltre gli scopi di questo libro e ci si potrebbe anche chiedere se sia un’impresa fattibile, ma vorremmo dare un’idea di quale sia al momento la visione del mondo condivisa dalla comunità scientifica. Lo faremo tramite qualche grafico e qualche tabella per mostrare cosa sia il cosiddetto “modello standard”, il modello utilizzato per descrivere gli oggetti elementari del nostro universo. E per dare una visione di come supponiamo si sia evoluto il nostro universo dalla nascita avvenuta circa 13,5 miliardi di anni fa, e di come si evolverà fino alla sua possibile fine, che avverrebbe in un futuro molto lontano. Concluderemo scrivendo alcune delle domande che ancora ci facciamo, dato che, com’è ovvio, molte cose sono state spiegate, ma moltissime altre sono ancora da capire e da chiarire. Questi paragrafi possono essere ben più complicati del resto del libro. Racchiudono in un paio di schemi molto di quello che sappiamo e molto di quello che non sappiamo, utilizzando talvolta termini nuovi di cui viene dato solo un abbozzo di spiegazione. Abbiamo deciso di inserirlo ugualmente lasciando al lettore il compito, eventuale, di approfondire i vari temi.
8.2. I mattoni: il modello standard e la relatività generale Il modello standard è il miglior modello che abbiamo al momento per descrivere le interazioni fondamentali e le particelle con massa che compongono il nostro universo. Questo modello deriva dal completamento della meccanica quantistica standard, con tutto ciò che è stato aggiunto
350
fisica per filosofi
tabella 8.1 Descrizione del nostro universo Cosa utilizziamo per descrivere il nostro universo
Modello standard
Materia Tre interazioni (forte; elettrodebole; Higgs)
Relatività generale Interazione gravitazionale
dal punto di vista teorico e sperimentale nell’ultimo secolo e comprende anche la relatività speciale. La teoria che rappresenta l’evoluzione della meccanica quantistica degli inizi del xx secolo è la cosiddetta “teoria quantistica dei campi” (Quantum Field Theory) la cui discussione va oltre gli scopi di questo libro; ultimo “mattone”, il bosone di Higgs, previsto nel 1964 e rivelato ufficialmente nel 2012. Tramite questa teoria, e le relative evidenze sperimentali, si costruisce il cosiddetto “modello standard”: l’insieme di tutti i campi e di tutte le particelle che dovrebbero poter descrivere il nostro universo. Tuttavia il modello standard non è completo. Nella sua versione attuale, infatti, non è in grado descrivere quantisticamente l’interazione gravitazionale. La relatività generale, la maggior costruzione mentale di Einstein, sembra inesorabilmente continua. Tecnicamente si dice che l’interazione gravitazionale non si riesce a quantizzare. Quindi, in questo momento la descrizione dell’universo deve essere fatta utilizzando sia il modello standard che la teoria della relatività generale (cfr. tab. 8.1). Fortunatamente le scale delle dimensioni su cui operano i due modelli sono molto diverse: il modello standard opera su scala microscopica, dove le interazioni gravitazionali sono praticamente trascurabili (si ricordi il fattore 1036 fra l’intensità dell’interazione elettromagnetica e quella dell’interazione gravitazionale esistente fra due protoni; cfr. par. 2.2.2). Mentre su scala astronomica essendo la materia essenzialmente neutra (elettricamente), l’interazione gravitazionale dovuta alle masse domina su tutte le altre interazioni. Questo panorama, tuttavia, comincia a cadere in situazioni estreme in cui alcune interazioni sono confrontabili – una per tutti, gli istanti iniziali dell’universo; in questi casi ancora non abbiamo modelli affidabili. Il modello standard è composto da diciassette elementi: dodici particelle (fermioni) che costituiscono le sorgenti di interazione e cinque che trasportano un’interazione (bosoni; cfr. fig. 8.1).
oggi
351
figura 8.1 Modello standard delle particelle elementari e delle interazioni materia quark
Fermioni s = 1/2
u c t d s b
interazioni
z γ w g
up
charm
top
bosone z
fotone
down
strange
bottom
bosone w
gluone
leptoni
e μ τ υe υμ υτ
elettrone
muone
tau
Bosoni s = 0; 1
H
Bosone di Higgs
neutrino e neutrino µ neutrino τ
Le particelle si dicono “elementari” perché non hanno struttura interna. Il modello standard comprende i sei quark e i sei leptoni che costituiscono la materia, e le cinque particelle che trasportano le interazioni. La grandezza s (intera per i bosoni e semintera per i fermioni) è il cosiddetto “spin”, il momento angolare intrinseco. È uno dei numeri che caratterizzano ogni elemento del modello standard.
Le due classi fermioni e bosoni si riferiscono al valore dello spin. Esso è uno dei numeri quantici, che in modo sommario possiamo descrivere come una serie di numeri e di valori di grandezze fisiche che caratterizzano lo stato di ogni singola particella, che ci permettono di classificarne le caratteristiche e di stabilire il tipo di interazioni che si possono esercitare fra di loro. In particolare (non ci addentreremo nella descrizione di tutti i numeri quantici) lo spin è legato al valore del cosiddetto “momento angolare intrinseco” che, in unità della grandezza ħ, può essere intero (0, 1, 2 ecc.) o semintero (1/2, 3/2 ecc.). Lo spin ha un ruolo fondamentale, poiché ci permette di distinguere il comportamento di uno stato quantistico di una particella quando si applica una rotazione allo spazio-tempo in cui sta vivendo la particella stessa. I fermioni sono particelle che hanno spin semintero (1/2, 3/2 ecc.), mentre i bosoni sono particelle che hanno spin intero (0, 1, 2 ecc.). Le particelle che costituiscono la materia, i fermioni, sono a loro volta divise in due gruppi: quark e leptoni. I quark, in numero di sei, possono esi-
352
fisica per filosofi
figura 8.2 Principali particelle che compongono la materia stabile: protoni, neutroni ed elettroni che formano atomi e molecole Particelle che non hanno struttura interna
Materia
Barioni: p, n (protoni, neutroni)
Adroni Quark (non esistono isolati)(composti di due-tre quark) Leptoni
Mesoni: π, k
e, μ, τ (e, mu, tau) Elettroni Neutrini: νe, νμ, ντ
Nuclei atomici
Atomi e molecole
Le particelle si dicono “elementari” perché non hanno struttura interna. Il modello standard comprende i sei quark e i sei leptoni che costituiscono la materia, e le cinque particelle che trasportano le interazioni.
stere solo in gruppi di due o di tre1: danno luogo a neutroni (composti dai tre quark “udd”), protoni (composti dai tre quark “uud”) e decine di altre particelle. Il secondo gruppo è formato dai leptoni (particelle leggere): comprende tre particelle (elettrone, muone, tau) ognuna con il relativo neutrino. La materia ordinaria è composta di molecole, a loro volta composte di atomi, i cui componenti sono un nucleo (neutroni e protoni) e gli elettroni che formano una nuvola intorno a esso. Quindi, tramite le dodici particelle di materia del modello standard possiamo costruire qualunque altro oggetto materiale esistente nel nostro universo. Le interazioni fondamentali nel modello standard sono tre, ognuna trasportata da una o più particelle (indicate sotto il nome): Interazioni elettrodebole (e.m.; debole) // di Higgs // forte γ ; (Z+, Z -, W) // H // g
L’interazione elettromagnetica è trasportata dal fotone (con massa nulla): la sua descrizione è unificata con quella dell’interazione debole. Quest’ultima è l’interazione responsabile del decadimento β, un tipo di decadimento radioattivo per cui, per esempio, un elemento cambia numero atomico. Questa interazione è trasportata dai bosoni Z (che esistono in due stati) e W (con massa di circa novanta volte quella del protone).
oggi
353
Per poter dare una veste coerente all’unificazione2 delle due precedenti forze fu postulata l’esistenza di un nuovo bosone: il bosone di Higgs. Questo è il responsabile diretto del meccanismo (il campo di Higgs) che dà massa ai bosoni W e Z e allo stesso bosone di Higgs (mentre il fotone rimane senza massa). Il meccanismo di Higgs sarebbe anche responsabile della massa dei leptoni e dei quark. L’interazione forte, quella responsabile, per esempio, dell’attrazione a corto raggio fra le particelle che compongono il neutrone e il protone (i quark), è trasportata dal gluone (che esiste in otto stati). Non è il caso di entrare ulteriormente nel dettaglio. 8.2.1. Campi o particelle? La teoria quantistica dei campi Fino a questo punto del libro abbiamo parlato spesso di campi e/o di particelle mostrando come le caratteristiche degli uni o degli altri si manifestassero a seconda dell’oggetto studiato e del tipo di interazione con il mondo esterno. È rimasta, tuttavia, una distinzione che appare nello schema del modello standard della fig. 8.1, dove da una parte si trovano le particelle e dall’altra i campi o le interazioni. Quindi, usualmente si parla di particelle (che possono essere anche descritte come onde) – l’elettrone, per esempio –, oppure di campi (che possono anche essere descritti come particelle) – il campo elettromagnetico, per esempio, descritto anche come fotone. Questa descrizione, che è adatta per una prima comprensione dei fenomeni, ha però alcuni problemi nella descrizione teorica più profonda di alcuni fatti sperimentali. Senza andare troppo in dettaglio possiamo dire che la soluzione fu il lavoro fatto da molti fisici a partire dagli anni Venti fino agli anni Settanta del xx secolo che hanno portato a formulare la Quantum Field Theory, la quale combina la teoria classica dei campi (il campo elettromagnetico), la relatività speciale (particelle a velocità vicina a quella della luce e la luce stessa) e la meccanica quantistica (fenomeni microscopici che presuppongono la quantizzazione di alcune grandezze fisiche)3. La teoria quantistica dei campi è la struttura matematica da cui si può derivare il modello standard e le relazioni fra tutte le sue componenti. Questa teoria permette di rispondere alla domanda: sono più fondamentali i campi, le particelle, oppure sono entrambi aspetti fondamentali della stessa realtà?
354
fisica per filosofi
La descrizione che abbiamo della teoria quantistica dei campi è che l’universo è riempito di campi – continui – che lo pervadono in ogni sua parte. Le particelle sono stati eccitati dei campi, quindi sono meno fondamentali di questi ultimi. La quantizzazione – delle energie, per esempio – è una conseguenza del tipo di interazioni che si vengono a generare fra i campi e le eccitazioni dei campi, dunque fra questi e le particelle. Va sottolineato che al momento tutte le previsioni della Quantum Field Theory sono state verificate come corrette, trovando la controparte sperimentale dove era prevista dalla teoria.
8.3. Che cosa è la massa? Che questa domanda venga fatta alla fine del volume può sembrare senza senso, eppure la definizione di cosa sia la massa – oggi – è qualcosa di complesso che solo ora possiamo discutere con un minimo di cognizione di causa. In relatività si era definita la massa come una proprietà dei corpi che poteva essere descritta come la misura del loro contenuto in energia (cfr. par. 5.7). Questa proprietà è quella legata alla reazione a una accelerazione (la massa inerziale) o, equivalentemente, quella legata alla reazione a un campo gravitazionale (la massa gravitazionale). In meccanica quantistica la definizione di massa è rimasta essenzialmente quella precedentemente data dalla meccanica classica e dalla relatività speciale. Eppure non è tutto così semplice e lineare. Partiamo dalla massa di una particella semplice, che non ha, cioè, una struttura interna: l’elettrone. Per l’elettrone, come per ogni particella, possiamo calcolare un certo fattore – il fattore g – rapporto del momento magnetico intrinseco della particella con il suo momento angolare4. Senza entrare nei dettagli possiamo dire che il calcolo di g per un elettrone forniva (stiamo parlando degli anni Cinquanta del secolo scorso) il valore 2 (esatto). Ma alcune misure molto precise davano, senza ambiguità, un valore differente, non di molto (2,0024), ma sufficiente a invalidare il calcolo. Va sottolineato che nella formula di g appare la massa dell’elettrone. La soluzione, arrivata da una serie di fisici teorici che lavorarono negli anni Cinquanta-Sessanta sull’argomento, fu questa: l’elettrone è una particella dotata di carica elettrica. Questa carica genera un campo elettromagnetico nello spazio e questo campo elettromagnetico interagisce con l’elettrone stesso scambiando fotoni (virtuali, questo è
oggi
355
un po’ complicato). Il punto chiave è che a questo scambio di fotoni corrisponde un’energia, e a questa energia possiamo far corrispondere un’inerzia (ricordiamoci che m = E/c2), quindi una piccola massa aggiuntiva. Il risultato è che la massa dell’elettrone è in realtà la somma di due termini: la massa nuda dell’elettrone considerato senza il suo campo elettromagnetico (è la vera e propria massa inerziale dovuta esclusivamente alla particella), e la massa elettromagnetica, dovuta all’energia di interazione dell’elettrone con sé stesso. Questa massa elettromagnetica era esattamente quella che serviva per giustificare la piccola differenza del fattore g (solo lo 0,12 %) che si trovava sperimentalmente. Raffinatezze, dirà qualcuno, la massa è essenzialmente quella dell’elettrone, poi che ci siano delle piccolissime correzioni è bello, elegante, ma non cambia la sostanza delle cose. Eppure c’è molto di peggio. Consideriamo, per esempio, il protone (p) e il neutrone (n), entrambi composti da una combinazione a tre a tre dei due quark up (u) e down (d), e andiamo a vedere le masse dei quark nudi e quelle del protone e del neutrone in unità di5 MeV/c2 . Le masse dei quark u e d sono: m(u) ≅ 2,3; m(d) ≅ 4,8 (il simbolo ≅ è dovuto al fatto che i quark da soli non esistono, si trovano solo accoppiati ad altri quark, quindi la misura è molto indiretta e ha una certa imprecisione, ma è ampiamente sufficiente per tutte le considerazioni successive). Le masse del protone, dell’elettrone e dei quark di cui sono costituiti sono, in unità di MeV/c2 : 1. il protone p uu d : mp(uud) = 938,3. 2. il neutrone n
Ma: m(2u + d) = 2,3 + 2,3 + 4,8 = 9,4! : mn(udd) = 939,6.
d d u
Ma: m(2u + d) = 4,8 + 4,8 + 2,3 = 11,9! Le masse dei quark che compongono il protone e il neutrone sono circa l’1% della loro massa totale. Da dove viene il restante 99%? Ma da un’energia, è ovvio (!?). Il fatto è che i quark possiedono una carica di colore, e – come l’elettrone che possedendo una carica elettrica generava un campo che poteva interagire con sé stesso e con altri elettroni – così un quark e il relativo campo di colore può interagire con sé stesso e con gli altri quark tramite i gluoni, i mediatori dell’interazione forte, anche loro con una carica di colore. Quindi, tutti interagiscono con tutti e a questa interazione corrisponde un’energia, una grande energia.
356
fisica per filosofi
Il fatto è che questa energia costituisce il 99% della massa del protone o del neutrone! Ripetiamolo, è importante: La maggior parte della massa del protone e del neutrone è dovuta all’energia delle interazioni tra i quark e i gluoni che li costituiscono.
Se ipotizzassimo dei protoni e dei neutroni con le masse nude portate a zero avremmo dei protoni e dei neutroni con una massa appena un po’ più piccola di quella reale, ma tutta proveniente dall’energia del sistema. Una massa senza massa, come la chiamò per primo Wheeler, espressione che poi fu adottata da Frank Wilczek (2002). Vale la pena a questo punto di rileggere quanto scrisse Einstein nel suo famoso articolo del 1905, una sorta di preveggenza: «La massa di qualunque corpo è la misura del suo contenuto di energia» (Einstein, 1905a, p. 641 ): m = E/c2.
La massa, intesa come materia tangibile, non esiste quasi più, o, se vogliamo, è una qualità secondaria. La massa che noi misuriamo, che noi sentiamo, quella di circa mezzo chilo del libro che avete in mano è dovuta essenzialmente all’energia dei campi quantistici, non alla massa della quantità di materia degli oggetti materiali. Potrà non piacere, togliere poesia, mettere in crisi fisici e filosofi, ma questa è la realtà.
8.4. Cosmologia. Il principio cosmologico La descrizione del nostro universo è una costruzione molto complessa che comprende e utilizza dati e modelli di fisica delle particelle (il modello standard), osservazioni e teorie cosmologiche (tutti i risultati ottenuti osservando il cielo e misurando, quindi, qualità e caratteristiche della radiazione e delle particelle che arrivano sulla Terra). Alla base di tutte le descrizioni fatte per l’universo c’è il cosiddetto “principio cosmologico” che possiamo enunciare così: L’universo è omogeneo e isotropo se osservato su una scala abbastanza grande.
Per “scala abbastanza grande” si intende per distanze e/o volumi che contengano, per esempio, un numero sufficiente di galassie. È abbastan-
10–12 s
10–9 s
10–6 s
10–4 s
1’
200 s
380 000 anni 100 milioni di anni luce
Inizio elettrodebole
Fine elettrodebole
Adroni
Leptoni
Nucleosintesi primordiale
Opacità
Materia
3 000
108
109 � 1010
1012
1013
~1015
~1015
~1027 � 1028
* Per la definizione del temine “unificazione” in riferimento a due interazioni, cfr. par. 4.5.
300 (?) miliardi di km 1 000 miliardi di km 0,1 anni luce 10-10 000 anni luce
100 miliardi di km
1 miliardo di km
10 m
10–26 m 0,1 m
~10–35 s ~10–30
Inflazione
C’è tutto quello che serve, nasce la materia stabile: fotoni, elettroni, neutrini, neutroni, protoni
Si formano atomi leggeri: H, He, Li
n → p + e; si formano nuclei di elio/deuterio
Si formano i leptoni
I quark e l’interazione forte formano gli adroni (protoni, neutroni, π, k ecc.)
Le interazioni elettromagnetica e debole si separano
Le interazioni forte ed elettrodebole si separano; si formano gluoni e coppie quark/antiquark
Espansione rapida dello spazio
Le tre interazioni del modello standard sono unificate: esistono molti approcci differenti; poi c’è la gravità
10–35 m
~10–43 s
Grande unificazione
1030
Non ci sono teorie accettate, solo proposte; le interazioni del modello standard e l’interazione gravitazionale probabilmente sono unificate*
t < 10–43 s
Cosa succede, cosa c’è
Era di Planck
Temperatura media T (K)
Diametro dell’universo
Tempo t dal Big Bang
Nove ere
tabella 8.2 Storia antica del nostro universo: dall’inizio fino a 300 000 anni
358
fisica per filosofi
za ovvio che su piccola scala ogni oggetto non è né omogeneo né isotropo. Un atomo ha una zona di altissima densità nelle vicinanze del nucleo, qualche elettrone che ruota molto lontano e per la maggior parte è vuoto. E così il sistema solare, con una stella e qualche pianeta immersi nel vuoto cosmico. Ma allargando la scala si può vedere l’omogeneità e l’isotropia in qualunque parte dell’universo. Oggi abbiamo una serie di osservazioni che confermano questo principio su tutte le scale in cui è si è osservata qualche caratteristica dell’universo. Ultimi risultati quelli della Planck Collaboration (2019) che confermano l’omogeneità dell’universo su tutte le scale – sia di distanze che di sorgenti – in cui è stato osservato. 8.4.1. Cronologia dell’universo: modello Λ-cdm Qui mostreremo, senza discuterle, due cronologie del nostro universo: la prima che va dalla cosiddetta “nascita dell’universo”, il Big Bang, fino ai primi 300 000 anni (cfr. tab. 8.2); la seconda che parte da circa un milione di anni, arriva fino a oggi (13,7 miliardi di anni) e si evolve fino all’ipotetica fine dell’universo (cfr. tab. 8.3). Il nome dato al modello tabella 8.3 Storia moderna del nostro universo: da circa un milione di anni fino… alla fine. Le date sono indicative Tempo dal Big Bang (anni)
Cosa succede
380 000 1 milione
Si forma l’atomo di idrogeno (un protone e un elettrone)
200 milioni
Si formano le prime grandi stelle (mega stelle); si formano i primi atomi di ossigeno, carbonio, neon, ferro, azoto ecc.
1 miliardo
Si formano le galassie
5 miliardi
Si formano le prime stelle
10 miliardi
Si forma il sistema solare
12 miliardi
Nascono le prime forme di vita microscopiche
13,7 miliardi
Voi state leggendo questo libro
14 miliardi di anni
Il Sole diventa una gigante rossa e ingloba la Terra
100 miliardi di anni
Tutte le stelle si raffreddano e muoiono (forse)
oggi
359
è Λ-cdm ed è composto dalle due grandezze che lo caratterizzano: Λ, la costante cosmologica, è legata alla cosiddetta “energia oscura”, mente l’acronimo cdm sta per Cold Dark Matter (“materia oscura fredda”), la seconda grandezza necessaria per giustificare osservazioni e modelli.
8.5. Alcune delle domande a cui vorremmo rispondere Ed ecco, per concludere, una serie di dubbi ancora presenti su alcuni aspetti della descrizione che abbiamo fatto del nostro universo. Non è il caso, in questa sede, di inoltrarsi nella discussione di questi punti. Vogliamo solo dare un’idea del fatto che la costruzione del modello che abbiamo dell’edificio universo è ancora lontana da una conclusione. 1. La natura profonda della meccanica quantistica. Il comportamento intrinsecamente casuale del mondo microscopico continua a far sorgere qualche dubbio. 2. L’unificazione (se possibile) nel paradigma attuale del mondo microscopico tra l’interazione gravitazionale e le altre interazioni del modello standard. Tutto può essere quantizzato, ma non la gravità? Perché? 3. Che cosa è la materia oscura? Le osservazioni dell’universo mostrano alcuni effetti spiegabili solo tramite un’attrazione gravitazionale di cui sarebbe responsabile una massa, chiamata “materia oscura”, che rappresenterebbe circa l’85% della massa dell’universo. Questa massa non emetterebbe radiazione elettromagnetica – per questo viene detta “oscura” – e sarebbe attualmente rilevabile solo in modo indiretto attraverso i suoi effetti gravitazionali. Non se ne conosce la natura, nessuna delle particelle conosciute sembra poter spiegare le osservazioni cosmiche di materia oscura. 4. Il problema del cosiddetto fine-tuning dell’universo (l’universo “finemente regolato”). Il nostro modello di universo è descritto dalle leggi fisiche (sperimentali) e da alcune costanti fondamentali: la costante di gravitazione universale G, la costante di Planck h, la velocità della luce nel vuoto c e la costante di struttura fine α. Esistono poi altre costanti che entrano in modo essenziale nella descrizione dell’evoluzione del nostro universo, per esempio la cosiddetta “costante cosmologica” Λ. I valori delle costanti fondamentali G, h, c e α sembra che siano esattamente quelli che devono essere per permettere l’esistenza di un universo come il nostro: basta variare una delle costanti di pochissimo (poche parti percentuali) per non avere, per esempio, un universo con massa.
360
fisica per filosofi
5. Le masse dei neutrini. Nel modello standard i neutrini sono particelle prive di massa. Ma i risultati sperimentali attribuiscono loro una piccolissima massa. È sconosciuta, inoltre, la gerarchia delle loro masse, cioè si conoscono i rapporti, ma non l’ordine con cui si passa dal più leggero al più pesante. 6. L’asimmetria fra materia e antimateria. Come mai nell’universo noto vediamo quasi solo materia, quando in principio dovrebbero essere simmetriche? Ci sono alcuni tentativi di risposta, ma al momento sono solo ipotesi. 7. Alcune grandezze (per esempio la densità di energia del vuoto). Per poter descrivere correttamente l’espansione recente dell’universo e anche l’età di esso (che deve essere maggiore di quella dei più antichi ammassi globulari) è necessario che la maggior parte della massa-energia dell’universo sia in una forma simile all’energia del vuoto. La costante cosmologica Λ, legata alla densità di energia del vuoto non è calcolabile con esattezza, i calcoli approssimati danno una stima di 120 ordini di grandezza maggiore di quanto serve per la cosmologia, quindi si ipotizza un’“energia oscura” (che non sappiamo cosa possa essere), oppure una modifica della legge di gravitazione universale a grandi distanze o a basse accelerazioni. 8. Perché c’è l’inflazione? Per spiegare la piattezza della geometria dell’universo, l’assenza di monopoli magnetici e altri effetti misurati, si deve pensare a una fase iniziale di espansione velocissima dell’universo (inflazione cosmica). Il motivo di questa espansione è ignoto (transizione di fase, grande unificazione ecc.?).
Note
Introduzione 1. Per maggiori approfondimenti sui temi trattati nei Percorsi rimandiamo a Pecere (2015). 2. Hebrew University of Jerusalem, Einstein Archives, n. 61-574, I Fully Agree with You about the Significance and Educational Value (cfr. http://alberteinstein.info/vufind1/ Record/EAR000025246, trad. mia). Per un approfondimento su filosofia, storia della scienza e stato della ricerca contemporanea, cfr. Pecere (2015).
1 Fisica: linguaggio, termini e definizioni 1. Le prime quattro interazioni dal 1983 sono diventate tre, in seguito all’unificazione di quella debole e di quella elettromagnetica. Mentre dal 2012 si è aggiunta l’interazione di Higgs. q q – – – – 2. Legge di Coulomb: F = k 1 2 2 Rˆ ; forza di Lorentz: F = q · (E + v– × B ). Vedremo R i dettagli nel cap. 4. 3. All’epoca di Newton e fino ai primi del Novecento si pensava che tutti i corpi avessero massa maggiore di zero. 4. Alcune teorie di gravità quantistica, ancora non convalidate sperimentalmente, prevedono che lo spazio-tempo venga creato dalla presenza di massa-energia. Ma non ne parleremo in questo libro. 5. Questa frase è una versione compatta dell’espressione “il quadrato del valore del numero che esprime la lunghezza dell’ipotenusa che chiamiamo a”. 6. Questa è una trattazione semplificata di come si scrive il valore di una grandezza con la sua incertezza; al posto dell’incertezza ∆L è più utile scrivere il valore σL, la cosiddetta “deviazione standard”, calcolata con metodi statistici, che fornisce previsioni probabilistiche precise e dettagliate sul valore “vero” che potrebbe avere la grandezza L, oppure su quello che ci si aspetterebbe se si ripetesse la misura in condizioni analoghe. 7. Come già detto nel par. 1.1.2, le interazioni sono quelle gravitazionale, elettromagnetica, debole, forte, di Higgs; dopo il 1983 si sono unificate le interazioni elettromagnetica e debole, e si parla di interazione elettrodebole, quindi le interazioni fondamentali al momento sono quattro.
362
fisica per filosofi
8. Per “invarianza” si intende che la forma della legge fisica rimane la stessa passando da un sistema di riferimento a un altro. 9. Questo è un punto delicato. La dipendenza esplicita vuol dire che si hanno delle proprietà la cui descrizione fisica contiene esplicitamente il tempo: per esempio, la scadenza di un cibo. 10. Spazio e tempo, che in meccanica classica sono due grandezze indipendenti, in meccanica relativistica non lo sono più e si parla di spazio-tempo (cfr. cap. 5). Tuttavia, per corpi che si muovono a velocità molto minori della velocità della luce nel vuoto (circa 300 000 km/s), questi effetti sono trascurabili e possiamo considerare lo spazio e il tempo come grandezze indipendenti. 11. “In linea di principio” significa che si può immaginare una procedura non ambigua che permetta di inferire il valore da assegnare alla grandezza seguendo una serie di operazioni. Non è necessario riferirsi con precisione alle tecniche da utilizzare: spesso le tecniche saranno ideali, per esempio fatte con una precisione non necessariamente disponibile al momento, l’importante è che la misura sia possibile, appunto, in linea di principio, cioè che non comporti alcuna violazione di leggi note. È una definizione che può cambiare nel corso del tempo: alcune operazioni impossibili in linea di principio secoli fa, oggi sono fattibili e reali. 12. Hebrew University of Jerusalem, Einstein Archives, n. 61-574, I Fully Agree with You about the Significance and Educational Value (cfr. http://alberteinstein.info/vufind1/Record/EAR000025246).
2 Meccanica classica 1. Quest’affermazione può essere un “loop logico”, una tautologia; lo vedremo meglio nel par. 2.2.3. 2. La formulazione più corretta è parlare di “punto materiale”, ossia di qualcosa che non ha estensione, pur possedendo una massa. 3. Il termine “interazione” è più corretto. Per esempio, per un fenomeno come il decadimento radioattivo avrebbe poco senso usare la parola “forza”: si utilizza l’espressione “interazione debole”. 4. Il raggio d’azione di un’interazione è una lunghezza convenzionale che esprime la distanza oltre la quale questa interazione diventa praticamente zero. 5. Attenzione: la massa non è il peso (che è la forza con cui la massa viene attratta dalla Terra e che nello spazio può essere nulla o molto piccola). Massa e peso sono grandezze con dimensioni fisiche diverse. La massa è proporzionale al peso tramite la relazione – P = m · g ˉ, g essendo l’accelerazione di gravità. Usualmente si scrive il modulo P = m g, dando per scontato che la direzione della forza di attrazione sia quella verticale. 6. Avendo fatto l’ipotesi che la massa inerziale sia uguale a quella gravitazionale (cfr. paragrafo successivo). 7. Il termine “energia” in realtà esisteva anche nella lingua greca, ed è stato utilizzato pure successivamente, tuttavia con significati diversi, spesso ambigui o molto diversi da quello che oggi gli diamo.
note
363
8. Con questo si intende che non abbiamo un modello che esprima “tutti” i possibili termini dell’energia. Ne conosciamo molti e quelli usiamo, ma potrebbero benissimo essercene altri che non ci sono noti. 9. Questo era vero fino al 2000 circa. Recentemente (con Saul Perlmutter, Brian P. Schmidt e Adam G. Riess, Nobel per la Fisica nel 2011) è nata l’ipotesi che l’accelerazione misurata di una parte dell’universo possa essere causata da un’energia di cui al momento non si conosce l’origine, la cosiddetta “energia oscura”. 10. Cioè, se vogliamo alzare un peso da (una massa) 1 kg, dobbiamo applicare al corpo una forza pari almeno a quella della forza di gravità dovuta al peso stesso. 11. Si sta parlando di lavoro dell’uomo, nel senso convenzionale. 12. Con questo intendiamo che un oggetto semplice è una piccola sfera dotata di massa, ma in generale dovremo considerare ruote, leve, ruote collegate fra loro, molle ecc. 13. Quanto è buona quest’approssimazione? Il calcolo esatto, per esempio per h = 1 1 km, mi dà: = 1,000156226, mentre il calcolo approssimato: 1 – h/rt = 1 1 + 6.400 1,000156250. La differenza relativa è molto piccola, è di circa 20 ∙ 10–9, cioè di 20 parti per miliardo… È un’ottima approssimazione.
3 Termodinamica 1. Limiti classici dovuti ai moti caotici e al fatto che tutti i corpi macroscopici formati da atomi e da molecole, solo per il fatto di trovarsi a una temperatura assoluta maggiore di zero, avranno un moto intrinseco casuale e non prevedibile con precisione, che renderà impossibile la determinazione esatta del loro moto; e interverranno anche limiti quantistici dovuti al principio di Indeterminazione, come vedremo nel cap. 7. 2. Il termine “emergente” viene spesso utilizzato per indicare quelle proprietà macroscopiche che appaiono quando un sistema complesso, composto da un gran numero di particelle interagenti, ha delle interazioni non lineari fra le componenti stesse. Il punto è che queste proprietà non sono deducibili dalle caratteristiche di ogni singola componente. 3. L’attribuzione di alcuni dei principi della termodinamica non è facile, trattandosi del lavoro di molte persone; qui daremo per ciascuno un’indicazione dei principali artefici e la data approssimativa in cui è stato enunciato. 4. È il nome acquisito da Lord William Thomson, barone di Kelvin (1824-1907). 5. Un gas perfetto è definito come un insieme di particelle di volume trascurabile rispetto al volume totale occupato dal gas e in cui siano trascurabili le forze di interazione fra le molecole del gas stesso. È vero che si tratta di un’idealizzazione, ma va detto che molti gas con densità abbastanza basse si comportano essenzialmente come gas perfetti. 6. Si noti che possiamo avere dei moti ordinati in cui però le molecole hanno velocità diverse. Per esempio, un moto rotatorio: se ci troviamo su una giostra, o anche sulla Terra, la nostra temperatura non dipenderà dal moto di rotazione. Quello che conta è che anche in questo caso possiamo dare una formula che definisce esattamente la velocità di un punto del corpo in relazione a tutti gli altri: il moto è ordinato, anche se le velocità sono diverse.
364
fisica per filosofi
7. Vale a dire, che dipendono dal sistema nel suo insieme (il volume), oppure da medie fatte sul sistema (la temperatura o la pressione). 8. n ≝ N/NA, in cui N è il numero totale di particelle (atomi o molecole), NA ≅ 6,02 · 1023 è il numero di Avogadro e R è legata alla costante di Boltzmann dalla relazione R = kB · NA. 9. Per “messi in contatto” si intende il caso più generale possibile, quindi “messi in grado di scambiarsi energia”. In elettromagnetismo, infatti, vedremo che due corpi possono scambiarsi energia tramite il campo elettromagnetico, dunque senza venire in contatto. 10. Per completezza va detto che possiamo avere uno scambio di calore anche fra due sistemi che si trovano alla stessa temperatura nel caso in cui uno dei due abbia una transizione di fase (passaggio solido-liquido, liquido-vapore). 11. Per “contatto” si intende usualmente la situazione in cui i due corpi arrivano talmente vicini che le repulsioni di origine elettrica fra gli atomi o le molecole di essi diventano tali da impedirne l’ulteriore avvicinamento. Vedremo in meccanica quantistica come in questo fenomeno intervengano anche altre leggi (il principio di Pauli). 12. Non per niente quando fu scritto il primo principio della termodinamica ancora non era chiaro ai fisici dell’epoca che il calore fosse una forma di energia e non un ente particolare – il calorico – che era posseduto dalle sostanze e che poteva essere scambiato, come si supponeva. 13. Il moto perpetuo di prima specie è quello per cui da un sistema possiamo ottenere in uscita più energia di quella in ingresso; è il processo che “crea” energia dal nulla. 14. Per “naturali” qui si intende processi la cui evoluzione è spontanea, quindi non indotti/causati da un agente esterno. 15. Pseudonimo di Karl Ernst Ludwig Marx Planck (1858-1947). Q1 16. Qui e nel seguito utilizzeremo una notazione della forma , in cui una grandezza Q2 r (in questo caso, Q1/Q2) ha accanto una riga verticale con un suffisso (in questo caso, |r). Il suffisso ha il significato di specificare la modalità o l’ambiente in cui viene calcolata la grandezza considerata. In questo caso si vuole specificare se la trasformazione sia reversibile r, irreversibile i o per un ciclo di Carnot c. 17. Questo valore, che rappresenta la differenza in gradi fra lo zero assoluto (0 K) e la temperatura di congelamento dell’acqua (0 °C) alla pressione di un’atmosfera, è puramente casuale. L’origine è dovuta al fatto che, per comodità, è stata scelta una scala in cui l’intervallo di un grado fosse lo stesso sia per i gradi Kelvin che per quelli centigradi; si ha, cioè, che ∆T = 1K = 1 °C. 18. W(A) è il numero di stati dinamici che corrispondono allo stato A, questo numero è proporzionale alla probabilità P(A) associata allo stato A (cfr. par. 3.8.2). 19. Spesso si utilizzano indifferentemente due termini che non sono equivalenti: “probabilità” e “statistica”. Quella della probabilità è una teoria matematica che ci permette di valutare a priori i risultati di un evento casuale. La statistica è la scienza che, utilizzando i risultati di eventi casuali, quindi dei risultati a posteriori, ne inferisce alcune proprietà collettive per risalire al modello probabilistico sotteso e alla stima dei suoi parametri; è essenziale per poter fare previsioni future e/o analizzare matematicamente i risultati ottenuti. 20. Il numero dei microstati è il numero di combinazioni: W(E) = W(N/nT) = N!/nT!(N – nT)!, dove nT è il numero di teste.
note
365
— 21. Qui e in seguito si parlerà sempre del modulo della velocità v = + √v2 dato che il valore medio della velocità sarà sempre nullo se il gas si trova a riposo nel sistema di riferimento considerato. 22. S(T = 0 K) = 0 è il terzo principio della termodinamica. 23. Una volta chi scrive, facendo questo esempio a lezione, ha visto sbiancare il volto dello studente indicato a caso: risultò che aveva veramente ricevuto poco prima una telefonata dalla sorella, che non gli telefonava quasi mai. 24. Per Helmholtz, tuttavia, le leggi psicologiche non sono riducibili a leggi fisiche o fisiologiche. In altre parole: i processi psicologici non violano la conservazione dell’energia, ma rispondono anche a altre leggi. Per questa seconda tesi in epistemologia si parla di “anti-riduzionismo”.
4 Elettromagnetismo 1. In realtà nell’articolo originale Maxwell scrisse un sistema di venti equazioni, utilizzando degli oggetti matematici complessi, i quaternioni. Le quattro equazioni di Maxwell nella notazione moderna furono scritte più tardi da Oliver Heaviside (18501925). 2. Si noti che anche la termodinamica può essere descritta solo con grandezze meccaniche: la temperatura è una media delle velocità delle particelle, la pressione è una forza, il volume è legato alle dimensioni ecc. 3. In realtà nel xx secolo si è scoperto il fotone, particella di massa nulla e carica elettrica nulla. 4. k0 (vuoto) = 1/4πε0 dove ε0 ≅ 8,85 · 10–12 F/m (la costante dielettrica del vuoto); k (mezzo) = k0 (vuoto)/εr, dove εr ⋝ 1 è la costante dielettrica relativa che può variare da poche unità, nel caso delle plastiche, a circa 80 nel caso dell’acqua. 5. Eccolo: supponiamo che un essere umano di 70 kg sia composto solo di acqua con peso molecolare 18 (non è esattamente così, ma il risultato finale non cambierebbe molto se considerassimo la carne, le ossa ecc.), quindi abbiamo circa 3 900 moli (70 · 103/18), che corrispondono a 3 900 · NA = 2,3 · 1027 molecole. Ogni molecola ha 10 protoni (o elettroni), perciò il numero dei protoni è 2,3 · 1028. Avere uno sbilanciamento di una parte su dieci miliardi vuol dire avere 2,3 · 1028 · 10–10 = 2,3 · 1018 particelle che si respingono. Questo valore, inserito nella legge di Coulomb per una distanza di 10 m porta ad una forza F = 12 · 106 N corrispondenti a un “peso” di 1,2 · 106 kg = 1 200 ton. 6. Questo è un punto chiave: possiamo definire la grandezza “campo” perché stabiliamo una procedura con cui misurarla, o perché in ogni caso ne prevediamo degli effetti misurabili. 7. Rigorosamente dovremmo utilizzare una carica q tale da non disturbare il campo elettrico già presente, quindi la carica q con cui misurare il campo deve essere una carica piccola, idealmente tendente a zero. 8. Questa ipotesi serve solo a semplificare i calcoli. Una trattazione completa si trova in Feynman (1969).
366
fisica per filosofi
9. Le correnti macroscopiche sono quelle create da cariche elettriche che si muovono dentro i conduttori, quelle che misuriamo usualmente. Le correnti microscopiche sono quelle legate al movimento degli elettroni intorno agli atomi; non possiamo misurarle direttamente, ma possiamo vederne gli effetti. 10. Queste due costanti usualmente si scrivono: ε = ε0 · εr; μ = μ0 · μr, in funzione, quindi, delle due costanti universali ε0 ≅ 8,85 · 10–12; μ0 = 4π · 10–7 H/m e di due costanti legate alle caratteristiche dei materiali, εr (la costante dielettrica relativa) e μr (la permittività magnetica relativa) che nel vuoto valgono esattamente 1. 11. Questa non è una tautologia, l’equazione delle onde è semplicemente l’equazione di d’Alembert, che lega la grandezza legata alla deformazione/perturbazione dell’onda in funzione dello spazio e del tempo con la velocità v di propagazione dell’onda. 12. Questi termini vanno imparati, capiti e ricordati, altrimenti non si può sperare di comprendere qualunque fenomeno che riguardi le onde, e in particolar modo la meccanica quantistica. 13. Il sole al tramonto, l’arcobaleno, la scomposizione della luce solare nei vari colori, sono tutti fenomeni in cui appare evidente la composizione della luce in varie lunghezze d’onda. 14. È il cosiddetto “principio di Huygens” (dal nome del fisico olandese Christiaan Huygens, 1629-1695).
5 Teoria della relatività speciale 1. Un corpo nero è un oggetto ideale, in equilibrio a una certa temperatura, che assorbe tutta la radiazione elettromagnetica incidente senza rifletterla. Si può approssimare con un forno caldo con un piccolo foro da cui esce la radiazione. 2. La Terra si muove intorno al Sole con una velocità media di circa 30 km/s e ha anche un movimento di rotazione intorno a sé stessa, ma la velocità del suo moto di rotazione è, alle latitudini medie dell’Italia, circa cento volte minore di quella di rivoluzione intorno al Sole e, quindi, può essere trascurata. 3. L’esperimento è stato ripetuto varie volte con sensibilità sempre maggiore. Uno degli ultimi è quello di Muller et al. (2003) in cui il limite misurato della variazione relativa massima della velocità della luce è stato: ∆c/c ≤ 3 · 10–15. 4. La velocità della luce nel vuoto, assunta come esatta dal 1983, è 299 792 458 m/s (cfr. par. 4.4.1). 5. Nell’articolo originale Einstein (1905c, p. 893) inserisce questa nota: «Non si considererà qui l’imprecisione che si introduce nel concetto di simultaneità di due eventi (approssimativamente) nello stesso posto e che viene superata con l’astrazione». 6. Il decadimento di una particella non è un evento deterministico. Per ogni particella possiamo dare solo il tempo medio di decadimento; questo vuol dire che ci saranno particelle che decadono dopo un tempo più lungo e altre che decadono dopo un tempo più breve. Data una singola particella non è possibile prevedere esattamente quando avverrà il decadimento anche se possiamo ipotizzare che è molto probabile che decadrà entro un certo intervallo intorno al valore medio del tempo di decadimento.
note
367
7. Per rendere il testo più leggibile, sono stati cambiati i simboli delle grandezze utilizzati da Einstein nell’articolo originale. 8. In questo esempio sono stati utilizzati, per le conversioni energetiche, alcuni valori che corrispondono indicativamente a quelli delle efficienze dei processi industriali. 9. Per una rassegna di queste posizioni, cfr. Dorato (2013, pp. 31-65).
6 Teoria della relatività generale 1. Per “covarianza generale” si intende l’invarianza della forma di leggi fisiche sotto ogni trasformazione di coordinate. 2. Le misure delle orbite dei corpi celesti erano molto precise fin dall’antichità. Keplero per esempio, disponeva dei dati orbitali di Marte, misurati da Tycho Brahe, con un’incertezza di circa 1’, quindi una frazione 2/10 000 dell’angolo retto. È come se misurassimo una lunghezza di 10 km con l’approssimazione di 2 m. 3. «Proposizione vii. Teorema vii. La gravità appartiene a tutti i corpi, ed è proporzionale alla quantità di materia assoluta» (Newton, 1965, p. 269). 4. Per una rassegna di esperimenti mentali in ambito filosofico, cfr. Angelucci (2018). 5. Una geodetica è una particolare curva che descrive localmente la traiettoria più breve fra punti di un particolare spazio. Nel piano le geodetiche sono le linee rette, su una superficie sferica sono gli archi di cerchio massimo. Può essere intesa come il percorso che compirebbe una particella libera non accelerata. 6. Oggi la costante cosmologica è stata reintrodotta per giustificare alcune variazioni nella velocità di espansione dell’universo non previste dalla teoria di base. Questa costante è, quindi, concettualmente differente da quella proposta da Einstein. 7. L’esperimento è una collaborazione fra ligo (usa) e Virgo (Italia) che coinvolge ricercatori di tutto il mondo. La prima rivelazione fu fatta nei due laboratori statunitensi di ligo, pochi mesi dopo ne seguirono altre fatte dai rivelatori di ligo in contemporanea con quelli di Virgo. 8. Nel caso di un’onda elettromagnetica è semplice: è sufficiente che una carica abbia un’accelerazione diversa da zero. Il caso gravitazionale è un po’ più complicato: l’accelerazione da sola non è sufficiente, dobbiamo avere anche una certa asimmetria nell’oggetto massivo che accelera e/o nel suo movimento. Ma si tratta di dettagli.
7 Meccanica quantistica 1. Ricordiamo ancora che un corpo nero è un oggetto ideale, in equilibrio a una certa temperatura, che assorbe tutta la radiazione elettromagnetica incidente senza rifletterla. Si può approssimare con un forno caldo con un piccolo foro. 2. Come abbiamo visto nei capitoli precedenti le teorie della relatività scritte da Einstein sono due: quella “speciale” del 1905 e quella “generale” del 1916. Qui e nel seguito
368
fisica per filosofi
si utilizzerà il termine “relatività” per indicare entrambe le teorie, se non specificato differentemente. 3. L’unità utilizzata usualmente, il magnetone di Bohr, vale: mB ≝ eħ/2me = 9,27400948(80) ∙ 10–24 J/T, dove 80 è l’incertezza sulle ultime due cifre (48). 4. Con “riga di emissione” si intende la frequenza corrispondente alla luce emessa, che nel laboratorio si può vedere come una riga colorata in una certa posizione che ne identifica la frequenza. 5. Un moto stazionario è quello in cui i valori medi delle grandezze fisiche si mantengono costanti nel tempo, quindi restano uguali se non vi sono dissipazioni. Una corda ideale (senza attrito) che vibra in modo stazionario è una corda che, posta in vibrazione, continua a vibrare sempre esattamente allo stesso modo, per esempio con la stessa frequenza. 6. Per una discussione introduttiva delle interpretazioni e delle teorie quantistiche viste da un punto di vista fisico/filosofico, cfr. Argentieri, Bassi, Pecere (2012). 7. Trascuriamo il fatto che se la particella fosse microscopica risentirebbe delle forze coulombiane dovute agli atomi che si trovano nel tavolo. Come avevamo trascurato l’attrito nel caso precedente, così ora trascuriamo queste interazioni e consideriamo la particella come libera da forze nella direzione x del moto. 8. Questo è un esempio di funzione d’onda semplificata, quella reale sarebbe composta di infiniti termini; ne sono stati scritti solo cinque, ma sono sufficienti per descrivere con buona approssimazione quello che succede alla particella. Inoltre ci dovrebbe essere la parte immaginaria. 9. In rete si può trovare un’ottima simulazione: http://demonstrations.wolfram.com/ WavepacketForAFreeParticle. 10. La coppia di variabili per cui viene scritta una relazione di indeterminazione viene usualmente scritta fra due parentesi quadre [x, p]. Questo perché si sta parlando di un operatore matematico che opera sulle due grandezze: il cosiddetto “commutatore”. 11. Il principio di indeterminazione si può trovare scritto in vari modi a seconda dei libri di testo e di quando è stato scritto. La versione oggi universalmente accettata è: σG1 ∙ σG1 ≥ ħ/2 in cui le σ rappresentano le deviazioni standard delle due grandezze coniugate G1 e G2. 12. Ricordiamoci che questo evento deve essere trattato con la meccanica quantistica: dovremo risolvere, quindi, l’equazione di Schrödinger, o una simile, e il risultato sarà genuinamente casuale. 13. La distinzione fra sistemi macroscopici e microscopici non è semplice da formalizzare. Vedremo un criterio nel par. 7.7. 14. È il caso della probabilità totale per eventi incompatibili (il proiettile passa dalla fenditura F1 oppure dalla fenditura F2) che è data dalla somma delle probabilità per ognuno degli eventi singoli. 15. Un filmato dell’esperimento, fatto da altri ricercatori, si può vedere su http://www. physique.ens-cachan.fr/old/franges_photon/interference.htm. 16. Qui abbiamo semplificato la formula scrivendo direttamente la probabilità calcolata per un intervallo dx opportuno. 17. Simile, ma non identica, l’equazione di Schrödinger non può essere scritta per particelle con massa pari a zero come il fotone, va quindi modificata (cfr. par. 7.2.4).
note
369
18. Per una simulazione, cfr. http://phet.colorado.edu (sezione Simulations → Physics → Wave Interference → Quantum Tunnelling and Wave Packet). 19. Per una simulazione di una funzione d’onda e dell’effetto tunnel, cfr. http://phet. colorado.edu (sezione Simulations → Physics → Quantum Tunnelling and Wave Packet). 20. Stiamo parlando dei sistemi entangled, che vedremo in dettaglio nel par. 7.5.4. 21. Per ora non ci preoccupiamo di sapere come fare a creare questo stato. Sappiamo che per il principio di sovrapposizione questo stato può esistere e per il momento ci basta. Poi si vedranno i problemi nel realizzare sperimentalmente quanto scritto. 22. Questo si può fare facilmente con un cristallo non lineare, è un’operazione standard in un qualunque laboratorio di ottica quantistica. I nomi B e G per i due fotoni derivano dal fatto che i due fotoni entangled hanno frequenze diverse, tipicamente uno è blu (Blue), l’altro è verde (Green). 23. La probabilità che un fotone passi attraverso un polarizzatore che fa un angolo θ con la polarizzazione del fotone è P(θ) = cos2 θ (legge di Malus), quindi la probabilità di un errore è 1 − cos2 θ = sen2 θ. 24. Sono le visioni di un mondo olistico in alcune discipline spirituali. 25. Per maggiori dettagli sulla vicenda, cfr. Pecere (2012). Sulle nozioni di realismo e oggettività fisica, cfr. Percorso storico-filosofico 9. 26. Per Cassirer la nuova teoria comporta piuttosto una nuova rappresentazione della realtà fisica, ma questo è un problema diverso che non riguarda il determinismo (cfr. Percorso storico-filosofico 9). 27. Per un’eccellente ricostruzione delle discussioni più recenti, cfr. De Caro (2004, pp. 17-24, 27-55). 28. Per una ricostruzione dettagliata, cfr. Pecere (2012). 29. Un esempio di questa prospettiva sulla fisica contemporanea si trova nel volume divulgativo di Leon Ledermann e Christopher T. Hill (2013). 30. Per una ricostruzione delle ragioni di queste ricerche e dei modelli più diffusi, cfr. Bassi (2012).
8 Oggi 1. Nel momento in cui scriviamo (2021) sono stati proposti, sia teoricamente che per interpretare alcuni risultati sperimentali, sistemi a quattro o cinque quark (tetraquark e pentaquark). 2. Per la definizione del temine “unificazione” in riferimento a due interazioni, cfr. par. 4.5. 3. Per una trattazione della Quantum Field Theory nella Stanford Encyclopedia of Philosophy, cfr. Kuhlmar (2018). 4. Il fattore “g” è un numero adimensionale. Il momento magnetico viene espresso relativamente al magnetone di Bohr mb = eħ/2me, mentre il momento angolare relativamente al momento angolare di riferimento ħ. 5. Utilizzeremo per le masse l’unità di misura MeV/c2 = (106 ∙ 1,6 ∙ 10–19)/(3 ∙ 108)2 ≅ 1,78 ∙ 10–30 kg.
Bibliografia*
abbott b. p. et al. (2016), Observation of Gravitational Waves from a Binary Black Hole Merger, in “Physical Review Letters”, 116, February 11. al-khalili j., mcfadden j. (2015), La fisica della vita. La nuova scienza della biologia quantistica, Bollati Boringhieri, Torino. angelucci a. (2018), Che cos’è un esperimento mentale, Carocci, Roma. aoyama t. et al. (2015), Tenth-Order Electron Anomalous Magnetic Moment: Contribution of Diagram without Closed Lepton Loops, in “Physical Review D”, 91, 3, https://doi.org/10.1103/PhysRevD.91.033006. argentieri n., bassi a., pecere p. (2012), Meccanica quantistica, rappresentazione, realtà. Un dialogo tra fisica e filosofia, Bibliopolis, Napoli. aspect a., grangier p., roger g. (1981), Experimental Tests of Realistic Theories Via Bell’s Theorem, in “Physical Review Letters”, 47, 7, pp. 460-3. id. (1982), Experimental Realization of Einstein-Podolsky-Rosen-Bohm “Gedankenexperiment”: A New Violation of Bell’s Inequalities, in “Physical Review Letters”, 49, 2, pp. 91-4. bassi a. (2012), Meccanica quantistica e rappresentazione della materia, in Argentieri, Bassi, Pecere (2012), pp. 15-66. bell j. s. (1964), On the Einstein Podolsky Rosen Paradox, in “Physics”, 1, 3, pp. 195-200. bergson h. (2001), Saggio sui dati immediati della coscienza, Raffaello Cortina, Milano. bertozzi w. (1964), Speed and Kinetic Energy of Relativistic Electrons, in “American Journal of Physics ”, 32, 7, pp. 551-5. bondi h. (1952), Cosmology, Cambridge University Press, Cambridge. bonolis l. (2010), Emmy Noether, genio matematico, https://www.galileonet. it/emmy-noether-genio-matematico. born m. (1927), Zur Quantenmechanik der Stoßvorgänge, in “Zeitschrift für Physik”, 37, pp. 863-7. id. (1962), Filosofia naturale della causalità e del caso, Boringhieri, Torino. * Le edizioni riportate sono quelle effettivamente consultate. L’ultimo accesso ai link indicati nel volume risale a gennaio 2021.
372
fisica per filosofi
bridgman p. w. (1961), Significance of the Mach Principle, in “American Journal of Physics”, 29, 1, pp. 32-6. carnot l. (1803), Principes fondamentaux de l’équilibre et du mouvement, Crapelet-Deterville, Paris. cartesio r. (2009a), Opere, 1637-1649, a cura di G. Belgioioso, Bompiani, Milano. id. (2009b), Opere postume, 1650-2009, a cura di G. Belgioioso, Bompiani, Milano. casadio c., levrini o. (2006), Lo spazio e il tempo assoluti di Newton, master idifo 2006, https://www.roma1.infn.it/exp/webmqc/lo-spazio-assoluto-di-newton%20-%20Casadio%20Levrini%20-%20IDIFO2006.pdf. cassidy d. c. (1996), Un’estrema solitudine. La vita e l’opera di Werner Heisenberg, Bollati Boringhieri, Torino. cassirer e. (1970), Determinismo e indeterminismo nella fisica moderna, La Nuova Italia, Firenze. castellano m. g. et al. (2009), Deep Well Ultrafast Manipulation of a squid Flux Qu-Bit, in “New Journal of Physics”, 11, https://doi.org/10.1088/13672630/12/4/043047. cohen-tannoudji c., diu b., laloe f. (1977), Quantum Mechanics, vol. ii, Wiley-Hermann, New York-Paris. de caro m. (2004), Il libero arbitrio. Una introduzione, Laterza, Roma-Bari. de risi v. (2015), L’arte dello spazio. La nascita delle geometrie non euclidee e la teoria della prospettiva, in Pecere (2015), vol. i, pp. 219-72. dorato m. (2013), Che cos’è il tempo? Einstein, Gödel e l’esperienza comune, il Mulino, Bologna. einstein a. (1905a), Ist die Trägheit eines Körpers von seinem Energieinhalt abhängig?, in “Annalen der Physik”, 17, pp. 639-41. id. (1905b), Über einen die Erzeugung und Verwandlung des Lichtes betreffenden heuristischen Gesichtspunkt, in “Annalen der Physik”, 17, pp. 132-48. id. (1905c), Zur Elektrodynamik bewegter Körper, in “Annalen der Physik”, 17, pp. 891-921 (trad. it. Elettrodinamica dei corpi in movimento, in Id., Le due relatività. Gli articoli originali del 1905 e 1916, prefazione di V. Barone, Bollati Boringhieri, Torino 2015, pp. 3-32). id. (1916), Die Grundlage der allgemeinen Relativitätstheorie, in “Annalen der Physik”, 49, pp. 769-822 (trad. it. Teoria della relatività generale, in Id., Le due relatività. Gli articoli originali del 1905 e 1916, prefazione di V. Barone, Bollati Boringhieri, Torino 2015, pp. 33-94). id. (1918), Prinzipielles zur allgemeinen Relativitätstheorie, in “Annalen der Physik”, 4, 55, pp. 241-4 (trad. it. di S. Antoci, Principi della relatività generale, fisica.unipv.it/antoci/re/Einstein18b.pdf ). id. (1921), Geometrie und Erfahrung, in “Sitzungsberichte der Königlich Preußischen Akademie der Wissenschaften zu Berlin”, 5, pp. 1-8.
bibliografia
373
id. (1949), Reply to Criticism, in P. A. Schilpp (ed.), Albert Einstein Philosopher-Scientist, Open Court, La Salle, pp. 665-88. id. (1995), Corrispondenza con Michele Besso. 1903-1955, a cura di G. Gembillo, Guida, Napoli. id. (2012), Lettera all’Accademia svedese delle scienze per proporre la candidatura al premio Nobel di W. Heisenberg e E. Schrödinger, in A. Pais, Sottile è il Signore... La scienza e la vita di Albert Einstein, Bollati Boringhieri, Torino, p. 542. einstein a., born h., born m. (1973), Scienza e vita. Lettere, 1916-1955, Einaudi, Torino. einstein a., podolsky b., rosen n. (1935), Can Quantum-Mechanical Description of Physical Reality be Considered Complete?, in “Physical Review”, 47, 10, pp. 777-80 (trad. it. La descrizione quantica della realtà può essere completa?, in A. Einstein, Opere scelte, a cura di E. Bellone, Bollati Boringhieri, Torino, pp. 374-82). faraday m. (1846), Experimental Researches in Electricity: Nineteenth Series, in “Philosophical Transactions of the Royal Society of London”, 136, pp. 1-20. feynman r. p. (1969), La fisica di Feynman, vol. ii, Principalmente elettromagnetismo e struttura della materia, t. 1, Addison-Wesley, Londra. id. (2002), Sei pezzi facili, Adelphi, Milano. fixsen d. j. et al. (1996), The Cosmic Microwave Background Spectrum from the full cobe firas Data Set, in “The Astrophysical Journal”, 473, pp. 576-87. galilei g. (1929-39), Le opere, a cura di A. Favaro, 20 voll., Barbèra, Firenze (rist. dell’ed. nazionale 1890-1909). id. (1932), Lettera a Madama Cristina di Lorena granduchessa di Toscana, in Galilei (1929-39), vol. v, pp. 307-49. id. (1933a), Dialogo sopra i due massimi sistemi del mondo, in Galilei (1929-39), vol. vii, pp. 21-520. id. (1933b), Discorsi e dimostrazioni matematiche intorno a due nuove scienze attinenti alla meccanica e i movimenti locali, in Galilei (1929-39), vol. viii, pp. 39-318. id. (1933c), Il Saggiatore, in Galilei (1929-39), vol. vi, pp. 197-372. id. (1934), Lettera a Belisario Vinta in Firenze. Padova, 7 maggio 1610, in Galilei (1929-39), vol. x, pp. 348-53. gazzola e. (2017), Il mondo quantistico. Errate interpretazioni, teorie improbabili e bufale quantiche, Gruppo c1v, Roma. ghirardi g. c. (2015), Un’occhiata alle carte di Dio. Gli interrogativi che la scienza moderna pone all’uomo, il Saggiatore, Milano. greene b. (2004), La trama del cosmo. Spazio, tempo, realtà, a cura di C. Bartocci, Einaudi, Torino. hanneke d., fogwell hoogerheide s., gabrielse g. (2011), Cavity Control of a Single-Electron Quantum Cyclotron: Measuring the Electron Magnetic Moment, in “Physical Review A”, 83, 5, https://doi.org/10.1103/ PhysRevA.83.052122.
374
fisica per filosofi
heisenberg w. (1927), Über den anschaulichen Inhalt der quantentheoretischen Kinematik und Mechanik, in “Zeitschrift für Physik”, 43, pp. 172-98. id. (1930), The Physical Principles of the Quantum Theory, Dover, New York (trad. it. I principi fisici della teoria dei quanti, a cura di M. Ageno, Boringhieri, Torino 1963). id. (1984), Fisica e oltre. Incontri con i protagonisti: 1920-1965, Boringhieri, Torino. id. (2003), Fisica e filosofia, il Saggiatore, Milano. helmholtz h. (1996a), Opere, a cura di V. Cappelletti, utet, Torino. id. (1996b), I fatti della percezione, in Helmholtz (1996a), pp. 591-646. id. (1996c), Sulla conservazione della forza, in Helmholtz (1996a), pp. 49-116. horgan j. (1996), The End of Science, Addison-Wesley, Reading (ma). kant i. (2003), Principi metafisici della scienza della natura, a cura di P. Pecere, Bompiani, Milano. kittel c., knight w. d., ruderman m. a. (1970), La fisica di Berkeley, vol. i, Meccanica, Zanichelli, Bologna. kuhlmar m. (2018), Quantum-Field-Theory, https://plato.stanford.edu/archives/win2018/entries/quantum-field-theory. kuhn t. s. (1970), The Structure of Scientific Revolutions, The University of Chicago Press, Chicago. kumar m. (2012), “Quantum”. Da Einstein a Bohr, la teoria dei quanti, una nuova idea della realtà, Mondadori, Milano. landau l. d. (1971), Meccanica, Boringhieri, Torino. laplace p.-s. de (1814), Essai philosophique sur les probabilités, Courcier, Paris. id. (1820), Saggio filosofico sulle probabilità, Marotta, Napoli. ledermann l. m., hill c. t. (2013), Fisica quantistica per poeti, Bollati Boringhieri, Torino. leibniz g. w. von (2000), Scritti filosofici, a cura di M. Mugnai, E. Pasini, 3 voll., utet, Torino. mach e. (1977), La meccanica nel suo sviluppo storico-critico, Boringhieri, Torino. masanes l., oppenheim j. (2017), A General Derivation and Quantification of the Third Law of Thermodynamics, in “Nature Communications”, 8, March 14. maxwell j. c. (1864), A Dynamical Theory of the Electromagnetic Field, in “Philosophical Transactions of the Royal Society of London”, 155, pp. 459-512. mehra j., rechenberg h. (1982), The Historical Development of Quantum Theory, Springer, Berlin. michelson a. a., morley e. (1887), On the Relative Motion of the Earth and the Luminiferous Ether, in “American Journal of Science”, 34, pp. 333-45. misner c. w., thorne k. s., wheeler j. a. (1973), Gravitation, W. H. Freeman and Co., San Francisco.
bibliografia
375
muller h. et al. (2003), Modern Michelson-Morley Experiment Using Cryogenic Optical Resonators, in “Physical Review Letters”, 91, 2, pp. 1-4. newton i. (1965), Principi matematici della filosofia naturale, in Id., Opere, a cura di A. Pala, vol. i, utet, Torino. id. (1978), Scritti di ottica, a cura di A. Pala, utet, Torino. pais a. (1986), Sottile è il Signore. La scienza e la vita di Albert Einstein, Boringhieri, Torino. id. (1995), Einstein è vissuto qui, Bollati Boringhieri, Torino. pecere p. (2012), Fisica quantistica e realtà. Considerazioni storico-filosofiche, in Argentieri, Bassi, Pecere (2012), pp. 69-177. id. (2015), Il libro della natura, 2 voll., Carocci, Roma. planck collaboration (2019), Planck Finds No New Evidence for Cosmic Anomalies, https://www.esa.int/Science_Exploration/Space_Science/Planck/ Planck_finds_no_new_evidence_for_cosmic_anomalies. planck m. (1900), Über irreversible Strahlungsvorgänge, in “Annalen der Physik”, 1, pp. 69-122. poincaré h. (2003), La scienza e l’ipotesi, a cura di C. Sinigaglia, Bompiani, Milano. popper k. r. (1982), Quantum Theory and the Schism in Physics, Unwin Heyman, London-Boston (repr. Routledge, New York 1995). pound r. v., rebka g. a. (1960), Apparent Weight of Photons, in “Physical Review Letters”, 4, 7, pp. 337-41. rovelli c. (2014), La realtà non è come ci appare. La struttura elementare delle cose, Raffaello Cortina, Milano. schlick m. (1974), Tra realismo e neopositivismo, il Mulino, Bologna. schrödinger e. (1935), Die gegenwärtige Situation in der Quantenmechanik, in “Naturwissenschaften”, 23, 48, pp. 807-12 (trad. it. La situazione attuale nella meccanica quantistica, a cura di D. Donato, Sicania, Messina 2012). shannon c. e. (1948), A Mathematical Theory of Communication, in “Bell System Technical Journal”, 27, 3, pp. 379-423, 623-56. tanamura a. et al. (1989), Demonstration of Single-Electron Buildup of an Interference Pattern, in “American Journal of Physics”, 57, 2, pp. 117-20 (https://it.wikipedia.org/wiki/Esperimento_della_doppia_fenditura). thomson w. (1904), Baltimore Lectures on Molecular Dynamics and the Wave-Theory of Light, Clay and sons, London. warman m. (2001), Stephen Hawking Tells Google “Philosophy Is Dead”, in “The Daily Telegraph”, May 17, https://www.telegraph.co.uk/technology/ google/8520033/Stephen-Hawking-tells-Google-philosophy-is-dead.html. weihs g. et al. (1998), Violation of Bell’s Inequalities under Strict Einstein Locality Conditions, in “Physical Review Letters”, 81, 23, pp. 5039-43.
Indice analitico*
accelerazione, 62 di gravità, 80 Adelberger E., 83 Agostino, 235 Anassimene, 147 Angelucci A., 367 Aoyama T., 263 Argentieri N., 368 Aristotele, 20 Aspect A., 280, 325-6, 330-2 atomo, 28, 59, 191, 267, 269, 283, 346, 358 Bacone F., 50, 98 Barish B., 253 Bassi A., 368-9 Bateson G., 144 Bell J. S., 280, 323, 325-32, 347 disuguaglianze di –, 325 Bergson H., 25, 234 Bernoulli D., 129 Bohr N., 24, 261-3, 267-9, 271, 278-9, 284, 314, 323, 340-1, 345-6, 368-9 Boltzmann L. E., 102, 105-6, 118, 123, 127-8, 130, 133, 135, 140, 364 costante di –, kB, 106 Bolyai J., 255-6 Born M., 259, 262, 274, 314, 323, 340, 344-5 Braginsky V. B., 83
calore, Q, 97, 102, 109, 111, 113, 115-6, 119, 124, 147, 364 campo concetto di –, 161-3 di Higgs, 273 elettrico, E, 153-63 elettromagnetico, 173 gravitazionale, 246 magnetico, H (induzione magnetica, B), 164, 168, 171 carica elettrica, Q, q, 154 Carnap R., 257 Carnot L. N. M., 86, 99, 118-22, 125, 229, 364 Carnot N. L. S., 102 Cartesio R., 48, 54, 63, 65-6, 93-4, 148, 184, 256 caso, 339, 344 casualità, 340 Castellano M. G., 334-5 causa, 28, 56, 92-5, 101, 144, 148, 220, 222 Celsius A., 106 Clausius R., 102, 117-8, 121, 229 Cold Dark Matter (cdm), cfr. materia oscura fredda conservazione dell’energia, 84-5, 89, 113-4, 147, 149-50, 229, 338
* I numeri di pagina in corsivo indicano la pagina/le pagine dove la voce viene definita o discussa approfonditamente.
378 Coordinated Universal Time (utc) (tempo universale), 254 corrente elettrica, i, 153, 164 cosmologico, principio, 356 costante cosmologica, Λ, 359 dielettrica del vuoto, ε0, 171, 365 dielettrica relativa, εr, 365 di gravitazione universale, G, 53, 78, 88, 359 universale dei gas, R, 108 Coulomb C. A de, 29, 155-6, 162, 268, 361, 365 legge di –, 153-5 de Broglie L., 263, 268, 270-2, 292 De Caro M., 369 de Finetti B., 129 densità di carica elettrica, 170 di corrente elettrica, J, 170 di massa, 43, 251, 271 di probabilità, 273, 344 Descartes, cfr. Cartesio determinismo (indeterminismo), 11, 24, 339, 341-3, 369 Dicke R. H., 83 diffrazione, 180, 181, 271, 291, 299 dilatazione dei tempi, 209, 210 Dirac, notazione di, 315 distanza spazio-temporale, ds, 217, 220 Dorato M., 367 due fenditure (esperimento), 288-300 Ehrenfest P., 261 Einstein A., 20, 24-6, 31-2, 37, 47, 78, 90, 96, 166, 187, 189, 191, 194, 196201, 210-1, 223, 226-7, 229, 232, 234-5, 237-40, 242-6, 249-50, 253-5, 257-60, 262-3, 266, 280, 302, 313-4, 321-5, 332, 340-1, 344-6, 350, 356, 366-7
fisica per filosofi Einstein, Podolsky, Rosen (esperimento mentale), 313 elementi, 48-9, 64, 191, 255, 260 elettromagnetismo, principi, 153 energia, 31, 83, 85, 87, 89, 109, 110, 116, 147, 190, 226, 232, 264, 285, 338, 354, 362-3 meccanica classica, 83 termodinamica, 106, 116 relatività speciale, 226 energia interna, U, 110 entangled, stati, 314, 319, 320-8, 322-3, 336 entropia, S, 97, 102, 109, 117, 122, 124, 125, 127, 134, 139-40, 142, 146 Eötvös L., 82-3 etere, 64, 150, 183-7, 192, 197-8 Eulero L., 185-6 Faraday M., 148, 161, 229 fase (di un’onda), 177, 178-9, 183, 269, 292, 303 fattore relativistico, 202, 203-4 Fermi E., 273 Feynman R., 83-4, 262, 288, 365 filosofia naturale, 23-4, 39, 48, 51, 63, 88, 94-5, 148-50, 162, 184-5, 233, 343-4 fisica aristotelica, 23, 36, 49, 64, 92, 256 Floridi L., 145 flusso del campo B, 195, 229 forza, 28, 56-9, 60, 68, 72, 91, 93, 149, 153, 156, 243, 247-9 poteri attivi, 94 forza elettromotrice, fem, 195 Fowler R. H., 102 frequenza di un’onda, di un fenomeno periodico, 176, 178-9, 182-3, 2648, 274-6, 286, 295, 302, 304, 368 funzione d’onda, 259, 272-3, 274-5, 277-80, 287-8, 293-5, 297-9, 300-1, 302, 304-5, 309-12, 314-5, 318, 325, 336, 344-6
indice analitico
379
Galilei G., 25, 28, 31-3, 48-51, 54, 63-5, 77, 81-3, 93, 98, 183, 192, 200, 206, 238, 242-3 Gassendi P., 65-6 Gauss F., 256 Gazzola E., 333 Gell Mann M., 273 gemelli (paradosso), 223, 224 gluone, 353 gps, 32, 203, 252 Grangier P., 325, 330, 332 gravità (forza di; gravitazione), 22, 28, 32, 36, 39, 53, 54, 60, 78, 79-80, 82, 86, 88, 90-1, 92, 94, 96, 148, 154-5, 158, 161, 162, 185, 190, 239-41, 246-8, 254, 347, 359-60, 362
interferenza, 181, 182, 183, 193, 254, 269, 271, 291-7, 300, 303, 334, 346 interlacciati, stati, cfr. entangled, stati irreversibilità, 99, 117, 127
Hamilton W. R., 54 Hawking S., 25 Heaviside O., 365 Heidegger M., 25 Heisenberg W., 24, 259, 262, 272-3, 278-9, 281-2, 284-7, 301, 339-41, 345-6 Helmoltz G. H. von, 85, 102, 149, 257, 365 Higgs P., 29, 57-8, 273, 350, 352-3, 361 Hilbert D., 257 Hill C. T., 369 Hooke R., 79, 89, 94 Horgan J., 190 Husserl E., 235-6 Huygens C., 366
Lagrange J. L., 54 Laplace P. S. de, 101, 129, 280, 339 lavoro, L, 85-7, 93, 97, 99, 109-10, 112, 113-6, 118-21, 138-9, 142, 147-8, 363 Ledermann L. M., 369 Leibniz G. W., 85, 95, 148-9, 185-6, 256 libero arbitrio, 150, 339, 341-3 Lobačevskij N. I., 255-6 Lorentz H., 164, 210, 227, 231, 361 forza di –, 29, 164-5, 167, 361 trasformazioni di –, 200, 201-2, 204, 206-8, 211, 213, 218, 227, 231 Lorenz E. N., 22 luce polarizzata, 305, 306 lunghezza a riposo, L0, 208, 239 lunghezze, contrazione delle, 208, 209
incertezza (di una misura), 35, 82-3, 140-1, 144, 241-2, 259, 273-6, 361 indice di rifrazione di un mezzo, n, 173, 177 inerzia (legge di; principio di; concetto di), 55, 62-7, 85, 91, 94, 98 informazione, I, 22, 117, 124, 138, 139-40, 141-5, 259, 273-4, 280, 314, 322, 336 intensità della luce, I, 193, 291-2, 295, 302-3, 307-8, 273-6, 282-4, 286, 297
Jeans J. H., 264-5 Jonas H., 11 Kant I., 24-5, 148, 186, 256, 342, 344 Kelvin (Lord), 106, 117-8, 121-2, 150, 363-4 Keplero G., 25, 36, 48, 50, 77, 79, 93-4, 191, 260, 367 Kolmogorov A. N., 129
Mach E., 151, 186, 245-6 principio di –, 245 Malus E. L., 369 massa, 31, 57, 67, 81, 147, 156, 189, 2267, 231, 275, 349, 354-6, 361-2, 367 gravitazionale, 53, 81, 237, 242, 245 inerziale, 53, 81, 237 matematizzazione, 33, 49, 51, 92, 236
380 materia (anche: quantità di materia), 27, 31, 37, 39, 66, 89, 91-5, 109, 117, 147-9, 186, 226, 238, 248-50, 255, 256, 264, 287, 343-7, 350-2, 356-7, 359-60 materia oscura fredda, 359 Maxwell J. C., 127, 135, 138-9, 150, 154, 167-73, 187, 190, 192, 196, 197, 253, 264, 365 diavoletto di –, 138, 139 equazioni di –, 167-9, 170, 171, 172-3 meccanica quantistica, principi, 259, 272-3 meccanicismo, 24, 49, 92-5, 150-1, 344 metodo sperimentale (filosofia sperimentale), 47-8, 50-1, 94-5, 162 Michelson A. A., 187 Michelson e Morley (esperimento), 191-4, 207, 254 Minkowski H., 213, 216-7, 219 modello Λ-cdm, 358 standard, 349 molteplicità della configurazione A, 130 momento angolare, L, 268, 271, 287, 338, 351-2, 354, 376 momento magnetico, 263, 354, 369 Morley E., 187, 191-4, 207, 254 moto assoluto, 39, 66, 183-5 naturale, 64, 93 perpetuo, 114, 115, 121, 364 relativo, 66, 76, 184-6, 194, 196-7, 238 Muller H., 366 muoni atmosferici, 203-4, 211, 213-3 Nernst W. H., 102, 145 teorema di –, 145 Newton I., 20, 22-5, 28, 31-2, 36-41, 48-9, 51, 53, 63, 65-6, 78, 80, 83, 8895, 100, 148, 154, 156, 161-2, 184-6, 189-90, 233, 238, 240-2, 247, 256, 275-6, 339, 343-4, 361, 367 leggi di –, 53
fisica per filosofi Noether E., 337-9 non località, 280, 336, 347 onde, 174-5, 177-83, 252, 266-9, 271-7, 286, 293, 295, 297, 301-3, 305, 343-6, 353, 366 onde gravitazionali, 253 Ørsted H. C., 148 Panov V. I., 83 Pauli W. E., 260-2, 273, 287-8, 341, 364 Pecere P., 361, 368-9 Peirce J. R., 144 periodo di un’onda, T, 175, 176 Perlmutter S., 363 permeabilità magnetica del vuoto, μ0, 164, 168 permeabilità magnetica relativa, μr, 366 Pitagora, 34 Planck M., 118, 121, 232, 263-5, 268, 286, 357-9, 364 costante di –, h, 264, 268, 286, 359 Podolsky B., 280, 302, 313-4, 321-5, 332 Poisson S. D., 54 potenza, 93, 148-9 pressione, p, 56, 89, 101, 107, 108-9, 112-3, 124, 174, 364-5 primo principio della dinamica, 55, 56, 60, 62-3, 98 principi, 66, 77, 78-80, 100 della meccanica classica (anche della dinamica), 53, 90, 189 della meccanica quantistica, 259, 272-3, 274 della relatività generale, 237, 245-6 della relatività speciale, 189, 198 della termodinamica, 97, 102 dell’elettromagnetismo, 153 principio cosmologico, 356 di equivalenza, 81, 83, 242, 244-5
indice analitico di esclusione di Pauli, 260, 273, 287, 288 di indeterminazione di Heisenberg, 259, 273, 281-2, 283, 284, 297-8, 301, 339-40 di Mach, 246 di relatività galileiana, 77, 166 di sovrapposizione, 303 probabilità associata a un evento, 127, 128-34, 136-7, 140-4, 280 pulsazione di un’onda, 176, 182 quantità di calore scambiata, Q, 10910, 111, 113-4, 120, 124 quantità di informazione, I, 140-2, 144-5 quantità di moto, p, 69, 70, 74, 174, 227, 231-2, 281-3, 297, 301-2, 338 Quantum Field Theory, cfr. teoria quantistica dei campi Rayleigh J. W. S., 264-5 realismo, 321, 323, 341, 343, 346, 369 Reitze D., 253 relatività galileiana, 21-2, 53, 74, 77, 167, 189, 194-5, 230 generale, principi, 237, 245 speciale, principi, 189, 198 rendimento (di un ciclo termodinamico), 97, 99, 114, 119-22 Renner J., 83 resistenza elettrica, R, 170, 195 resistività elettrica, 168, 170 reversibilità, 99, 117, 127 riduzionismo, 343 anti-riduzionismo, 365 Riemann B., 255 Riess A. G., 363 Roger P., 325, 330, 332 Rosen N., 280, 302, 313-4, 321-5, 332 Rovelli C., 26
381 Schmidt B. P., 365 Schrödinger E., 20, 24, 259, 262, 2727, 279-81, 287, 300-2, 310-1, 313, 341, 344, 368 Schwarzschild K., 251 raggio di –, 251 secondo principio della dinamica, 67, 69-71, 77, 154 Shannon C., 140-2, 145 Shu Kun Lin, 144 sistema di riferimento, 40, 41, 53, 55, 60-2, 65, 67, 74, 76-7, 90-1, 103, 1535, 161, 164-6, 172, 183-7, 189-91, 193, 196, 200-2, 206-9, 211, 215, 217-8, 221-3, 225-7, 230-1, 237-9, 243-6, 338, 362 spazio, 27, 37, 204-13, 239 assoluto, 38-9, 66, 183-6, 189, 192-3, 197, 246, 256 fisico, 256-7 formale, 257 intuitivo, 257 relativo, 38, 184 spazio-tempo, 32, 210, 213, 215, 216, 234, 240, 246, 247, 248, 249-52, 254, 345, 347, 361-2 stato di un sistema, 42, 101, 108, 259, 273-4, 280, 287, 319, 333, 335 strumentalismo, 341 superficie, S, 107 Talete, 147, 154 temperatura, T, 31, 85, 98, 101, 104, 106, 109-11, 114, 116, 124, 135, 146, 190, 260, 265, 357, 363-7 tempi, dilatazione, contrazione, 209, 210 tempo assoluto, 38-9, 75, 186, 189, 201, 233, 246, 338 fenomenologico, 27, 54 meccanica classica, 27, 37 proprio (di un evento), 209
382 relatività generale, 246 relatività speciale, 201, 209 relativo, 39, 233 teoria quantistica dei campi, 353 termodinamica, 21, 97 primo principio, 97, 113 principi, 97, 102 principio zero, 97, 145 secondo principio, 97, 117 terzo principio, 97, 145 terzo principio della dinamica, 72, 73-4, 97 Thomson W., cfr. Kelvin (Lord) Thorne K., 248, 253 tunnel, effetto (tunneling), 302, 312, 313, 334, 369
fisica per filosofi unificazione delle interazioni, 173, 174, 190, 257, 353, 359, 361, 369 unità di misura, u, 42 variazione di una grandezza, 44 velocità, V, 42, 55-6, 159 istantanea, 46 media, 45 relatività speciale, 170, 198, 204-5 velocità relativistiche, somma, 205 volume, V, 107 Weiss R., 253 Zangger H., 262