File loading please wait...
Citation preview
ROGER PENROSE
LA STRADA CHE PORTA ALLA REALTÀ LE LEGGI FONDAMENTALI DELL'UNIVERSO Traduzione di Emilio Diana
f\lzzoli
Proprietà letteraria riservata © 2004 Roger Penrose © 2005 RCS Libri S.p.A., Milano ISBN 88-17-00785-4 Titolo originale del!' opera: THE ROAD TO REALITY Prima edizione: novembre 2005 Seconda edizione: dicembre 2005
1
LA STRADA CHE PORTA ALLA REALTÀ
:~_.~.--1v\f.,,...,_,.,_
Dedico questo libro alla memoria di Dennis Sciama che mi ha trasmesso la passione per la fisica
IL
Prefazione Lo scopo di questo libro è trasmettere al lettore la capacità di apprezzare uno dei più importanti ed eccitanti viaggi di scoperta che l'umanità abbia mai intrapreso: la ricerca dei principi fondamentali che reggono il comportamento del nostro universo. È un viaggio che dura da circa tre millenni e mezzo, e quindi non dobbiamo stupirci se alla fine sono stati raggiunti alcuni sostanziali progressi. Ma questo viaggio si è dimostrato estremamente difficile e, nella maggior parte dei casi, si è arrivati a una reale comprensione della Natura soltanto lentamente. Questa difficoltà intrinseca ci ha condotto verso molte direzioni sbagliate: dobbiamo quindi imparare a essere cauti. Il ventesimo secolo ci ha tuttavia offerto nuove e straordinarie intuizioni - alcune così imponenti da spingere molti scienziati a pensare che potremmo essere vicini a una comprensione fondamentale di tutti i principi di base della fisica. Nella mia esposizione delle attuali teorie fondamentali, cercherò di presentare un punto di vista più moderato. Non tutte le mie opinioni possono essere accettate dagli «ottimisti»; ciò nonostante sarei molto sorpreso se in futuro non ci fossero ulteriori cambiamenti di direzione che riuscissero a superare in grandezza quelli che ci ha offerto il secolo appena concluso. Il lettore scoprirà che in questo libro non sono rifuggito dal presentare formule matematiche, nonostante i numerosi ammonimenti riguardo alla notevole riduzione del numero di lettori che ciò avrebbe implicato. Ho riflettuto seriamente su tale questione e sono arrivato alla conclusione che ciò che devo dire non può essere ragionevolmente comunicato senza un certo impiego di notazioni matematiche e senza esplorare autentici concetti matematici. La nostra comprensione dei principi che sono alla base del comportamento del mondo fisico dipende veramente da un certo apprezzamento della matematica. Alcuni potrebbero considerare ciò motivo di disperazione, poiché si sono convinti di non possedere alcuna capacità matematica, neppure la più elementare. Come potrebbero c_omprendere la ricerca in corso alla frontiera VII
LA STRADA CHE PORTA ALLA REALTÀ
avanzata della fisica, se non possono neppure padroneggiare la manipolazione delle Fazioni? Mi rendo conto di questa difficoltà. Sono comunque ottimista riguardo alla trasmissione di comprensione. Forse sono un inguaribile ottimista, ma mi chiedo se questi potenziali lettori che non sono in grado di manipolare frazioni - o quelli che affermano di non sapere manipolare frazioni - non ingannino se stessi, almeno in parte, e se molti di loro non possiedano effettivamente una capacità potenziale che ignorano di avere. Vi sono senza dubbio alcuni che, messi di fronte a unariga di simboli matematici, per quanto possano essere semplici, riescono a vedere soltanto il volto severo di un genitore o di un insegnante che cercava d'instillare in loro un'apparente competenza pappagallesca - un dovere, soltanto un dovere -, senza che alcuna traccia della magia o della bellezza del soggetto potesse sopravvivere. Per alcuni, forse, è troppo tardi; ma, come ho già detto, sono un ottimista e credo che vi siano ancora molti, persino tra quelli che non potrebbero mai padroneggiare le frazioni, che hanno la capacità di afferrare qualche vaga percezione di un mondo meraviglioso che io reputo debba essere per loro veramente accessibile. Quando era ancora una ragazza, una delle migliori amiche di mia madre non riusciva a comprendere le frazioni. Me lo disse lei stessa una volta, in tarda età, dopo essersi ritirata da una brillante carriera di ballerina classica. Ero giovane, non ancora completamente lanciato nell'attività di matematico, ma si sapeva che ero entusiasta di quell'argomento. Lei mi disse: «È stata tutta colpa delle semplificazioni. Non sono mai arrivata a comprendere il significato di semplificazione». Era una donna raffinata e molto intelligente, e non ho alcun dubbio che le qualità mentali necessarie per comprendere la sofisticata coreografia di un balletto non siano per niente inferiori a quelle impiegate per risolvere un problema matematico. Perciò, sopravvalutando grossolanamente le mie capacità d'esposizione, tentai, come avevano già fatto altre persone, di spiegarle la semplicità e la logica del procedimento di «semplificazione». Anche i miei sforzi non portarono ad alcun risultato. (A proposito, suo padre era stato un eminente geologo e un membro della Royal Society, quindi lei probabilmente doveva possedere un bagaglio culturale necessario per la comprensione di questioni scientifiche. Forse in questo caso la «faccia severa» era stata determinante, non so.) Ma, dopo aver riflettuto, mi chiedo adesso se lei, e molti altri come lei, non avessero un'inibizione più razionale. Un'inibizione che io con tutta la mia facondia matematica non avevo neppure visto. Vi è davvero un serio problema in cui ci s'imbatte ripetutamente in matematica e in fisica matematica, e che s'incontra per la prima volta nell'apparentemente innocente operazione di semplificazione, in cui un fattore comune viene cancellato dal numeratore e dal denominatore di una comune frazione numerica. Quelli per cui la semplificazione è diventata una seconda natura, per la familiarità con tale operazione, possono rivelarsi insensibili nei confronti di una VIII
Prefazione
difficoltà che effettivamente sorge dietro questo procedimento apparentemente semplice. Forse molti di quelli che trovano misteriosa la semplificazione vedono un serio problema più in profondità di chi prosegue in modo sprezzante, quasi ignorandolo. Qual è questo problema? Riguarda il modo stesso con cui i matematici sono in grado di fornire un'esistenza alle loro entità matematiche e il modo con cui tali entità possono essere collegate alla realtà fisica. Mi ricordo che a scuola, quando avevo più o meno undici anni, fui preso alla sprovvista quando l'insegnante chiese alla classe che cosa fosse effettivamente una frazione (come, per esempio, 3/8)! La classe propose vari suggerimenti che riguardavano la divisione di torte in pezzi e cose simili, ma furono tutti respinti dall'insegnante per un giusto motivo: si riferivano soltanto a sih1azioni fisiche poco precise, cui doveva essere applicata la nozione matematica precisa di frazione. Non ci dicevano cosa fosse effettivamente quella chiara nozione matematica. Seguirono altri suggerimenti, tipo che 3/8 è «qualcosa con un tre in alto e un otto in basso e una linea in mezzo» e fui decisamente sorpreso scoprendo che l'insegnante sembrava prendere sul serio queste proposte! Non ricordo precisamente come fu risolta alla fine la questione, ma con il senno di poi, acquistato molto più tardi grazie ai miei studi tmiversitari di matematica, posso supporre che l'insegnante stesse facendo un coraggioso tentativo di presentarci la definizione di frazione in termini dell'onnipresente nozione matematica di classe d'equivalenza. Cos'è questa nozione? Come può essere applicata a una frazione e dirci che cosa è effettivamente una frazione? Partiamo dal suggerimento «qualcosa con un tre in alto e un otto in basso». Ciò ci propone fondamentalmente che una frazione è specificata da una coppia ordinata di numeri interi, in questo caso i numeri 3 e 8. Ma evidentemente non possiamo considerare che una frazione sia una simile coppia ordinata, perché la frazione 6/16, per esempio, è lo stesso numero della frazione 3/8, mentre la coppia (6, 16) non è certamente uguale alla coppia (3, 8). Questo è proprio il problema della semplificazione. Possiamo scrivere infatti 6/16 come 3 x 2/8 x 2 e poi cancellare il 2 da sopra e da sotto ottenendo 3/8. Perché possiamo fare ciò e in tal modo «eguagliare» in un certo senso la coppia (6, 16) alla coppia (3, 8)? La risposta del matematico - che può sembrare decisamente una «scappatoia» - è che la cancellazione è inclusa proprio nella definizione di frazione: una coppia di numeri interi (a x n, b x n) è destinata a rappresentare la stessa frazione della coppia (a, b) ogni volta che n è un numero intero diverso da zero (si tenga presente che anche b non può essere zero). Ma persino questo non ci dice cos'è una frazione; ci dice soltanto qualcosa sul modo con cui rappresentiamo le frazioni. Che cosa è allora una frazione? In base alla nozione matematica di «classe d'equivalenza», la frazione 3/8, per esempio, è semplicemente la collezione infinita di tutte le coppie (3, 8), (- 3,
8), (6, 16), (- 6, - 16), (9, 24), (-9, - 24), (12, 32), ... , IX
LA STRADA CHE PORTA ALLA REALTÀ
dove ciascuna coppia può essere ottenuta da ciascuna delle altre coppie nella lista mediante una ripetuta applicazione della regola di cancellazione.* Abbiamo bisogno anche di definizioni che ci dicano come addizionare, sottrarre e moltiplicare tali collezioni infinite di coppie di numeri interi, in modo tale che valgano le ordinarie regole dell'algebra, e inoltre ci permettano d'identificare gli stessi numeri interi con casi particolari di frazioni. Questa definizione realizza tutto ciò di cui abbiamo matematicamente bisogno per le frazioni (come il fatto che ¾è un numero che aggiunto a se stesso dà il numero 1, eccetera) e la stessa operazione di cancellazione è, come abbiamo visto, inclusa nella definizione. Tuttavia, tutto ciò sembra molto formale e possiamo davvero chiederci se descriva efficacemente la nozione intuitiva di ciò che è una frazione. Anche se questo onnipresente procedimento di classe d'equivalenza, di cui l'applicazione di prima è soltanto un esempio particolare, è uno strumento molto potente nel campo della matematica pura per stabilire coerenza ed esistenza matematica, può fornirci entità dall'aspetto molto pesante. Per esempio, ci trasmette con difficoltà la nozione intuitiva di che cos'è 3/8! Non mi meraviglia che l'amica di mia madre fosse confusa. Nelle mie descrizioni di nozioni matematiche cercherò di evitare, per quanto posso, il genere di pedanteria matematica che ci porta a definire una frazione come una «classe infinita di coppie», sebbene tali concetti siano importanti nel campo del rigore e della precisione matematica. In queste mie descrizioni cercherò soprattutto di trasmettere l'idea - e la bellezza e la magia - inerente a molte e importanti nozioni matematiche. I;idea di una frazione come 3/8 si basa semplicemente sul fatto che essa è una specie d' entità che ha la proprietà di dare 3, quando è sommata a se stessa 8 volte. La magia risiede nel fatto che l'idea di frazione funziona effettivamente, nonostante non abbiamo realmente esperienza diretta di cose che nel mondo fisico sono esattamente quantificate da frazioni - le fette di torta portano solo ad approssimazioni. (Ciò è molto diverso dal caso dei numeri naturali, come I, 2, 3, che quantificano con precisione numerose entità appartenenti alla nostra esperienza diretta.) Un modo per comprendere che le frazioni hanno davvero un senso coerente è impiegare questa «definizione» in termini di collezioni infinite di coppie di numeri interi, come abbiamo indicato in precedenza. Ma ciò non significa che 3/8 sia effettivamente una collezione del genere. È meglio pensare che 3/8 sia un'entità con una sua esistenza (platonica) e che la collezione infinita di coppie sia soltanto un nostro modo di scendere a patti con la coerenza di questo tipo d'identità. Familiarizzando con essa, cominciamo a credere di potere facilmente comprendere una no* Questa è chiamata «classe d'equivalenza» perché è effettivamente una classe di entità (che in questo caso particolare sono coppie di numeri interi) ciascuna delle quali è ritenuta essere equivalente, in un senso ben specificato, a ognuna delle altre.
X
Prefazione
zione come 3/8 come qualcosa che ha davvero una sua esistenza e che l'idea di «collezione infinita di coppie» sia soltanto un accorgimento pedante - un accorgimento che rapidamente scompare dalla nostra immaginazione una volta che l'abbiamo compreso. Gran parte della matematica è così fatta. La matematica per un matematico (almeno per la maggior parte, per quanto ne so) non è soltanto un'attività culturale che noi stessi abbiamo creato, ma ha una sua vita e gran parte di essa si trova in stupefacente armonia con l'universo fisico. Non possiamo comprendere profondamente le leggi che reggono il mondo fisico senza entrare nel mondo della matematica. In particolare, la precedente nozione di classe d'equivalenza è pertinente non soltanto a molta matematica importante (ma ambigua), ma anche a molta fisica importante (e ambigua), come la teoria della relatività generale di Einstein e i principi delle «teorie di gauge» che descrivono le forze naturali secondo la moderna fisica delle particelle. Nel campo della fisica moderna non si può evitare di affrontare le sottigliezze di una grande quantità di matematica sofisticata. È per questo motivo che ho dedicato i primi 16 capitoli di questo libro a una descrizione di idee matematiche. Quali consigli posso dare al lettore affinché possa cavarsela? Questo libro può essere letto a quattro livelli. Forse siete lettori che si preoccupano semplicemente ogni volta che compare una formula matematica (e alcuni di questi lettori possono avere difficoltà ad accettare le frazioni). Se è così, credo che possiate guadagnare molto da questo libro, semplicemente saltando tutte le formule e leggendo soltanto le parole. Quando ero adolescente, facevo anch'io la stessa cosa con le riviste di scacchi che erano disseminate in casa. Gli scacchi occupavano gran parte della vita dei miei fratelli e dei miei genitori, ma personalmente m'interessavano pochissimo, tranne per il fatto che mi piaceva leggere gli exploit di quegli eccezionali e spesso bizzarri personaggi che si dedicavano a questo gioco. Traevo qualche beneficio dalla lettura della brillantezza delle mosse che spesso facevano, anche se non le comprendevo e non m'impegnavo a seguirle sulla scacchiera. Tuttavia, la ritenevo un'attività divertente e illuminante che poteva attrarre la mia attenzione. Spero, allo stesso modo, che le descrizioni matematiche qui presentate possano interessare un po' anche ai lettori che non amano per niente la matematica, se avranno il coraggio o la curiosità di seguirmi in questo viaggio d'investigazione delle idee matematiche e fisiche che sembrano stare alla base del nostro universo fisico. Non abbiate timore di tralasciare le equazioni (spesso lo faccio anch'io) e tralasciate anche, se lo desiderate, interi capitoli o parti di capitolo quando cominciano a essere un po' troppo pesanti! Vi sono moltissime difficoltà e moltissimi tecnicismi nella materia, quindi passate ad altro che può essere più di vostro gradimento. Potete semplicemente scegliere di immergervi e dare un'occhiata. La mia speranza è che i numerosi riferimenti incrociati possano illuminare a sufficienza nozioni sconosciute, in modo che sia posXI
LA STRADA CHE PORTA ALLA REALTÀ
sibile rintracciare i concetti e le notazioni occorrenti, ritornando per chiarimenti a sezioni in precedenza tralasciate. A un secondo livello, siete forse lettori pronti a esaminare formule matematiche, ogni volta che una di esse è presentata, ma non avete la tendenza (e forse neppure il tempo) a verificare per vostro conto le affermazioni che farò. Le conferme di molte di queste affermazioni costituiscono le soluzioni degli esercizi che ho disseminato nelle parti matematiche del libro. Se, d'altra parte, siete lettori che desiderano veramente acquistare dimestichezza con queste varie (importanti) nozioni matematiche, ma non avete molta familiarità con le idee che descrivo, spero che l'elaborazione di questi esercizi vi possa fornire un significativo aiuto nel raggiungimento di queste capacità. Spesso in matematica la riflessione personale può offrire una comprensione più profonda sulle cose rispetto a quella offerta da una semplice lettura. (Se avete bisogno delle soluzioni degli esercizi, controllate il sito web www.roadsolutions.ox.ac.uk.) Infine, forse siete già esperti, nel qual caso non dovreste avere alcuna difficoltà con la matematicà (che vi sarà molto familiare) e può darsi che non desidererete perdere tempo con gli esercizi. Potrete tuttavia ottenere qualcosa dai miei punti di vista, che probabilmente sono diversi (e talvolta molto diversi) da quelli consueti su un certo numero di temi. Potreste essere interessati a conoscere le mie opinioni riguardo a un certo numero di teorie moderne (per esempio la supersimmetria, la cosmologia inflazionarla, la natura del Big Bang, i buchi neri, la teoria delle stringhe o M-teoria, le variabili di loop nella gravità quantistica, la teoria dei twistor, persino gli stessi fondamenti della teoria quantistica). In molti di questi temi, senza dubbio troverete diversi punti sui quali non sarete d'accordo con me. Ma le controversie hanno un ruolo importante nello sviluppo della scienza: non ho quindi alcun rammarico nel presentare, come farò, opinioni che possono essere ritenute parzialmente in disaccordo con alcune delle tendenze dominanti della moderna fisica teorica. I;argomento principale di questo libro è davvero la relazione tra matematica e fisica e il modo con cui l'interazione tra queste due discipline influenza gli stimoli che stanno alla base delle nostre ricerche per una migliore teoria dell'universo. In molti sviluppi moderni, un ingrediente essenziale di questi stimoli è costituito dalla valutazione di bellezza, profondità e sofisticazione matematica. Tali influenze matematiche possono essere d'importanza vitale, come nel caso di alcuni dei più significativi successi della fisica del ventesimo secolo: l'equazione di Dirac per l'elettrone, lo schema generale della meccanica quantistica, la relatività generale di Einstein. Ma in tutti questi casi le considerazioni fisiche - in ultima analisi quelle osservazionali - hanno fornito i criteri predominanti per la loro accettazione. In molte delle idee moderne per un progresso fondamentale della nostra comprensione delle leggi dell'universo, adeguati criteri fisici - cioè dati speriXII
Prefazione
mentali o persino la possibilità di investigazioni sperimentali - non sono disponibili e possiamo chiederci se i desiderata matematici disponibili sono sufficienti per riuscire a valutare le probabilità di successo per queste idee. È un problema molto delicato e cercherò di sollevare questioni che credo non siano mai state discusse a sufficienza altrove. Anche se, in alcune sezioni, presenterò opinioni che possono essere considerate discutibili, mi sono preoccupato di mostrare al lettore quando mi prendo effettivamente questa libertà. Questo libro può quindi essere davvero impiegato come un'autentica guida alle idee basilari (e alle meraviglie) della fisica moderna. E considerando la comprensibilità del contenuto e il fatto che siamo ormai entrati nei primi anni del terzo millennio, il testo è appropriato per l'uso didattico come introduzione alla fisica moderna.
Ringraziamenti È inevitabile che, per un libro di questa mole che mi ha richiesto circa otto anni, vi siano molte persone da ringraziare. È quasi altrettanto inevita-
bile che vi sia tra loro un certo numero di persone i cui validi contributi non siano riconosciuti, a causa della mia congenita disorganizzazione e smemoratezza. Per prima cosa lasciatemi esprimere i miei ringraziamenti speciali - e anche le mie scuse - a queste persone, che mi hanno dato il loro aiuto generoso, ma il cui nome non mi viene ora in mente. Ma per le informazioni e l'assistenza che posso individuare con precisione, ringrazio Michael Atiyah, John Baez, Michael Berry, Dorje Brody, Robert Bryant, Hong-Mo Chan, Joy Christian, Andrew Duggins, Maciej Dunajski, Freeman Dyson, Artur Ekert, David Fowler, Margaret Gleason, Jeremy Gray, Stuart Hameroff, Keith Hannabuss, Lucien Hardy, Jim Hartle, Tom Hawkins, Nigel Hitchin, Andrew Hodges, Dipankar Home, Jim Howie, Chris Isham, Ted Jacobson, Bernard Kay, William Marshall, Lionel Mason, Charles Misner, Tristan Needham, Stelios Negrepontis, Sarah Jones Nelson, Ezra (Ted) Newman, Charles Oakley, Daniel Oi, Robert Osserman, Don Page, Oliver Penrose, Alan Rendall, Wolfgang Rindler, Engelbert Schilcking, Bernard Schutz, Joseph Silk, Christoph Simon, George Sparling, John Stachel, Henry Stapp, Richard Thomas, Gerard t'Hooft, Paul Tod, James Vickers, Robert Wald, Rainer Weiss, Ronny Wells, Gerald Westheimer, John Wheeler, Nick Woodhouse e Anton Zeilinger. Un grazie particolare va a Lee Smolin, Kelly Stelle e Lane Hughston per l'assistenza in numerose circostanze. Ho un debito speciale con Florence Tsou (Sheung Tsun) per il suo immenso aiuto nelle questioni di fisica delle particelle, con Fay Dowker per l'assistenza e i pareri sui più svariati argomenti, in particolare per la presentazione di alcuni problemi quantistici, con Subir Sarkar per le sue preziose informazioni riguardanti dati cosmologici e la loro interpretazione, con Vahe Gurzadyan per alcune informazioni riguardo le sue scoperte cosmologiche sulla geometria globale delXIV
Ringraziamenti
l'universo, e in particolare con Abhay Ashtekar, per le esaurienti informazioni sulla teoria delle variabili di loop e anche per altre questioni sulla teoria delle stringhe. Ringrazio la National Science Foundation per il sostegno con le borse di studio PHY 93-96246 e 00-90091 e la Leverhulme Foundation per l'assegnazione di una Leverhulme Emeritus Fellowshìp biennale, durante il 20002002. Incarichi a tempo parziale presso il Gresham College di Londra (19982001 ), e presso il Center for Gravitational Physics and Geometry all'Università della Pennsylvania, negli Stati Uniti, mi sono stati immensamente preziosi per la scrittura di questo libro, così come l'assistenza segretariale (in particolare di Ruth Preston) e l'ufficio al Mathematical Institute dell'Università di Oxford. Inestimabile è stata anche l'assistenza editoriale, soggetta a difficoltosi vincoli di programmazione e con un autore abituato a un lavoro irregolare. L'aiuto di Eddie Mizzi è stato fondamentale per iniziare a convertire i miei caotici scritti in un vero libro, mentre Richard Lawrence, con la sua efficienza e la sua paziente insistenza, è stato cruciale per portare a compimento questo progetto. John Holmes, dovendo accordarsi con rielaborazioni così complicate, ha fatto un ottimo lavoropreparando un magnifico indice analitico. Sono particolarmente grato a William Shaw per essermi venuto in aiuto, in una fase avanzata del lavoro, con la computer graphics (figure 1.2 e 2.19, e nell'implementazione delle trasformazioni implicate nelle figure 2.16 e 2.19), qui impiegata per l'insieme di Mandelbrot e per il piano iperbolico. Ma tutti i ringraziamenti che posso offrire a Jacob Foster, per il suo erculeo sforzo nella selezione delle referenze, per il suo controllo dell'intero manoscritto in un periodo di tempo notevolmente breve e per il fatto di aver colmato numerosi vuoti, non possono in alcun modo rendere giustizia all'importanza del suo aiuto. La sua impronta personale su un enorme numero di note dona loro una qualità speciale. Naturalmente, nessuna delle persone che qui ringrazio deve essere biasimata per gli errori e le omissioni che restano, la responsabilità è totalmente mia. Esprimo speciale gratitudine alla M.C. Escher Company, Olanda, per il permesso di riprodurre alcune opere di Escher nelle figure 2.11, 2.12, 2.16 e 2.22, e in particolare per aver permesso le modifiche di fig. 2.11 impiegate nelle figure 2.12 e 2.16, poiché quest'ultima è un'esplicita trasformazione matematica. Tutte le opere di Escher utilizzate in questo libro sono copyright (2004) The M.C. Escher Company. Ringrazio ànche l'Institute ofTheoretical Physics, dell'Università di Heidelberg e Charles H. Lineweaver per il permesso di riprodurre i grafici nelle figure 27 .19 e 28.19. Infine, la mia infinita gratitudine va alla mia amata moglie Vanessa, non solo per avermi fornito con urgenza la computer graphics da me richiesta (figure 4.1, 4.2, 5.7, 6.2-6.8, 8.15, 9.1, 9.8, 9.12, 21.3b, 21.10, 27.5, 27.14, 27 .15 e i poliedri di fig. 1. 1), ma per il suo amore continuo e la sua attenXV
LA STRADA CHE PORTA ALLA REALTÀ
zione, la sua comprensione e la sua sensibilità, nonostante gli interminabili anni in cui ha avuto un marito presente solo a metà. E anche a Max, che in tutta la sua vita ha avuto solo la possibilità di conoscermi in questo stato confuso, va la mia più calorosa gratitudine - non solo per aver rallentato la scrittura di questo libro ( allungandogli così la vita, dato che ora contiene almeno due importanti informazioni che altrimenti non sarebbero potute esserci) ma per la serenità e l'ottimismo che emana, il che mi ha aiutato a rimanere di buon umore. Dopo tutto è attraverso il rinnovarsi della vita, che egli stesso rappresenta, che arrivano le nuove idee necessarie per un autentico progresso futuro nella ricerca di quelle leggi più profonde che veramente governano l'universo in cui viviamo.
Notazione (Da non leggere fino al momento in cui avrete familiarità con i concetti, ma forse troverete che i caratteri sono fonte di confusione!) Ho cercato di essere ragionevolmente coerente nell'uso di caratteri particolari in questo libro, ma poiché non tutti sono standard al lettore può essere d'aiuto rendere espliciti quelli più utilizzati. Lettere (latine o greche) in corsivo, come w2, p 11 , log z, cos 0, ei 0, o ex sono impiegate nel modo convenzionale per le variabili matematiche che sono grandezze numeriche o scalari; costanti numeriche ben note, come e, i o re, o funzioni ben note, come sin, cos o log, sono indicate con caratteri verticali. Costanti fisiche standard, come e, G, h, n, go k, sono però in corsivo. Una grandezza vettoriale o tensoriale, quando è pensata come un tutto (astratto), è denotata da un carattere corsivo grassetto, come R per il tensore di curvatura di Riemann, mentre l'insieme delle sue componenti può essere scritto in corsivo (anche gli indici), come Rabcd· In accordo con la notazione con indici astratti, qui introdotta in § 12.8, la grandezza Rabcd può, in alternativa, stare al posto dell'intero tensore R, se questa interpretazione è appropriata e messa in rilievo nel testo. Le trasformazioni lineari astratte sono una specie di tensori, quindi anche per esse sono impiegati caratteri corsivi grassetti come T. La forma con indici astratti T\, è impiegata anche per una trasformazione lineare astratta, dove è appropriata, dato che lo sfalsamento degli indici rende chiara la precisa connessione con l'ordinamento della moltiplicazione di matrici. Perciò, l'espressione con indici (astratti) S\ 7\ sta al posto del prodotto ST di due trasformazioni lineari. Come nel caso dei tensori, i simboli S\ 7\ possono anche stare al posto (in base al contesto o a un'esplicita specificazione nel testo) dei corrispondenti insiemi di componenti - che sono matrici - per cui possono anche essere impiegate le corrispondenti lettere tonde in grassetto Se T. In questo caso, ST denota il prodotto delle due matrici. Questa interpretazione «ambivalente» di simbolicome Rabcd o S h ( o per l'insieme delle componenti o per il tensore astratto stes0
XVII
LA STRADA CHE PORTA ALLA REALTÀ
so) non dovrebbe essere fonte di confusione, poiché le relazioni algebriche (o differenziali), a cui questi simboli sono soggetti, sono le stesse in entrambe le interpretazioni. Per queste grandezze a volte viene impiegata una terza notazione -la notazione diagrammatica - che è descritta nelle figure 12.17, 12.18, 14.6, 14.7, 14.21, 19.1 e anche altrove in questo libro. Vi sono sezioni di questo libro in cui ho necessità di distinguere le entità dello spaziotempo 4-dimensionale dalle corrispondenti entità del comune spazio 3-dimensionale. Quindi, mentre una notazione in corsivo grassetto, come p o x, può essere impiegata per il 4-momento o la 4-posizione, rispettivamente, le corrispondenti entità puramente spaziali potrebbero essere denotate dalle corrispondenti lettere verticali in grassetto, p o x. Per analogia con la notazione T per una matrice, in opposizione a T per una trasformazione lineare astratta, le grandezze p e x verrebbero pensate, in ciascun caso, come «rappresentanti» delle tre componenti spaziali, mentre p e x potrebbero essere viste come aventi un'interpretazione più astratta, libera da componenti (anche se in questo non sarò particolarmente rigoroso). La lunghezza «euclidea» di un 3-vettore a= (al' a2 , a 3) può essere scritta come a, con a2 =a/+ a/+ a/, mentre il prodotto scalare di a con b = (b,, b2 , b3) può essere scritto come a• b = a 1b 1 + ai 2 + a3b3 • Questa notazione per i prodotti scalari è applicata anche nel caso generale n-dimensionale per il prodotto scalare (o interno) di un covettore astratto a • çcon un vettore ç. Tuttavia, una complicazione con la notazione nasce nel caso della meccanica quantistica, poiché in questo campo le grandezze fisiche tendono a essere rappresentate da operatori lineari. Io non adotto quella che è una procedura standard in questo contesto, cioè di mettere «cappucci» sulle lettere che rappresentano le versioni quantistiche delle familiari grandezze classiche, poiché credo che ciò crei una confusione di simboli non necessaria. (Preferisco adottare il punto di vista filosofico che gli enti classici e quantistici siano realmente i «medesimi» - e così è giusto impiegare i medesimi simboli per ciascuno - tranne nel caso classico in cui si è giustificati a ignorare grandezze dell'ordine di li, in modo che possano continuare a valere le classiche proprietà di commutazione ab = ba, mentre in meccanica quantistica ab potrebbe differire da ba per qualcosa dell'ordine di li.) In base a quanto detto, sembrerebbe che questi operatori lineari debbano essere denotati con lettere in corsivo grassetto (come T), ma questo renderebbe nulle la filosofia e la distinzione invocate nel paragrafo precedente. Di conseguenza, riguardo a grandezze specifiche come la quantità di moto p op, o la posizione x o x, tenderò a usare la medesima notazione del caso classico, in accordo con quanto è stato detto in precedenza in questo paragrafo; per operatori meno specifici, però, saranno usate lettere in corsivo grassetto come Q. Le lettere N, Z, ~,Ce IF sono adesso standard in matematica, rispettivamente per il sistema dei nufueri naturali (vale a dire gli interi non negativi), degli interi, dei numeri reali, dei numeri complessi e per il campo finito con XVIII
Notazione
q elementi ( q è una potenza di un numero primo; vedi § 16.1 ), così come le corrispondenti N 11 , E11 , IR", C 11 , IF", per i sistemi di ennuple ordinate di tali numeri. Si tratta di entità matematiche canoniche di uso standard. Nel libro (non è così insolito), questa notazione sarà estesa ad alcune altre strutture matematiche standard come il 3-spazio euclideo IE3 o, più in generale al nspazio euclideo IE". Inoltre, è spesso impiegato lo spaziotempo 4-dimensionale standard di Minkowski, che è esso stesso una specie di spazio «pseudo» euclideo, perciò impiegherò la lettera M per questo spazio (con M 11 per indicare la versione n-dimensionale - uno spaziotempo «lorentziano» con 1 dimensione temporale e (n -1) dimensioni spaziali). Alcune volte impiegherò C come un aggettivo, per denotare «complessificato», in modo che possiamo prendere in considerazione il 4-spazio euclideo complesso, per esempio, denotato da CIE11 • Anche la lettera IP può essere usata come un aggettivo, per indicare «proiettivo» (vedi§ 15.6), o come un nome, con IP" che denota un nspazio proiettivo (o userò IRIP" o CIP" se occorre chiarire che ci occupiamo di un n-spazio proiettivo rispettivamente reale o complesso). Nella teoria dei · twistor (capitolo 33), vi è il 4-spazio complesso lf, che è collegato a M (o alla sua complessificazione CM) in modo canonico, e vi è anche la versione proiettiva IPlf. In questa teoria, vi è anche uno spazio N di twistor nulli (il duplice compito che la lettera esegue non causa alcun conflitto in questo caso) e la sua versione proiettiva IPN. Il ruolo della lettera C come aggettivo non deve essere confuso con quello della lettera C, che qui sta al posto di «complesso coniugato di» (come è usato in § 13 .1, 2). Questo è fondamentalmente simile a un altro uso di C nella fisica delle particelle, vale a dire la coniugazione di carica, che è l'operazione che scambia ciascuna particella con la sua antiparticella (vedi capitoli 24, 25). Questa operazione è di solito presa in considerazione assieme ad altre due operazioni fondamentali della fisica delle particelle, vale a dire la parità P che si riferisce all'operazione di simmetria speculare, e T che si riferisce all'inversione del tempo. Caratteri maiuscoli in grassetto servono per etichettare spazi vettoriali, in cui le lettere V, W e H sono quelle più comunemente impiegate. euso di H è specifico per gli spazi di Hilbert della meccanica quantistica, con H11 che indica uno spazio di Hilbert di n dimensioni complesse. Gli spazi vettoriali sono chiaramente piatti; gli spazi che sono (o potrebbero essere) curvi sono indicati con lettere a mano, come 'ilt, So 7.
Prologo Am-tep era il principale artigiano del re, un artista di consumata abilità. Era notte e dormiva sul giaciglio del laboratorio, stanco dopo una lunga giornata di lavoro, ma il suo sonno era irrequieto - forse per un'impalpabile tensione che sembrava aleggiare nell'aria. Non era certo di essere del tutto addormentato quando la cosa avvenne. Era arrivato il giorno - all'improvviso - nonostante le sue ossa gli dicessero che sicuramente doveva essere ancora notte. Si alzò repentinamente. Qualcosa era stranamente insolito. La luce dell'alba non poteva essere a nord; tuttavia la luce rossa proveniva in modo allarmante dall'apertura dell'ampia finestra che guardava verso nord attraverso il mare. Andò alla finestra e guardò fuori, incredulo e stupito. Il sole non era mai sorto a nord prima! Per il suo stato di sbalordimento, gli ci vollero alcuni istanti per comprendere che quello non poteva essere assolutamente il sole. Era un lontano fascio di luce, di un rosso acceso, emesso verticalmente dall'acqua verso il cielo. Una nuvola più scura divenne visibile all'estremità superiore del fascio, dando all'intera struttura l'aspetto di un gigantesco parasole lontano, che splendeva malignamente, con una asta fumosa e fiammeggiante. La parte superiore del parasole cominciò ad allargarsi e a scurirsi, quasi un demone degli inferi. La notte era stata limpida, ma le stelle scomparvero a una a una, inghiottite da questa mostruosa creatura infernale che avanzava. Am-tep non si mosse, nonostante la terribile situazione. Rimase paralizzato per parecchi minuti dalla perfetta simmetria e dalla terrificante bellezza della scena. Ma poi la terribile nuvola cominciò a inclinarsi leggermente verso est, coinvolta dai venti prevalenti. Forse ciò confortò un po' Am-tep e l'incantesimo fu momentaneamente interrotto. Ma il timore gli tornò immediatamente, quando gli sembrò di sentire nel sottosuolo una strana agitazione, accompagnata da brontolii di sinistro augurio, la cui natura era a lui completamente sconosciuta. Cominciò a chiedersi cosa avrebbe potuto causare quella furia. Non era mai stato prima testimone di un'ira di Dio di quella grandezza.
LA STRADA CHE PORTA ALLA REALTÀ
La sua prima reazione fu d'incolpare se stesso per il disegno che aveva appena completato sulla coppa sacrificale. La sua raffigurazione del Dio-Toro non era stata abbastanza terrificante? Quel Dio n'era rimasto offeso? Ma l'assurdità di questo pensiero lo colpì subito. La furia di cui era appena stato testimone non sarebbe mai potuta essere il risultato di un'azione così banale come la sua, e certamente non era indirizzata a lui in particolare. Ma sapeva che vi sarebbero stati guai nel Grande Palazzo. Il Re-Sacerdote non avrebbe perso tempo per tentare di rabbonire questo Dio-Demone. Ci sarebbero voluti dei sacrifici. Le tradizionali offerte di frutti o di animali non sarebbero state sufficienti a placare un'ira di questa grandezza. I sacrifici avrebbero dovuto essere umani. Del tutto all'improvviso e con sua gran sorpresa, fu spinto indietro attraverso la stanza da un'improvvisa folata d'aria, seguita da un forte vento. Il rumore fu così forte da renderlo momentaneamente sordo. Molti dei suoi vasi magnificamente adornati furono strappati dalle mensole e ridotti in pezzi contro la parete posteriore. Mentre stava disteso sul pavimento in un angolo lontano della stanza dove era stato gettato dalla folata d'aria, cominciò a recuperare i sensi e vide che la stanza era in subbuglio. Fu atterrito nel vedere una delle sue urne preferite ridotta in mille pezzi: i magnifici disegni che aveva così accuratamente realizzato non esistevano più. Am-tep si sollevò barcollando dal pavimento e dopo un po' si avvicinò di nuovo alla finestra, questa volta con trepidazione, per esaminare nuovamente la terribile scena nel mare lontano. Pensò che lo sconvolgimento, illuminato da quella lontana fornace, stesse arrivando verso di lui. Sembrava che nell'acqua ci fosse un vasto avvallamento, in rapido movimento verso la costa, seguito da un'onda alta come una scogliera. Ancora una volta rimase bloccato dal terrore, guardando l'onda che avvicinandosi cominciava ad assumere proporzioni gigantesche. Infine lo sconvolgimento raggiunse la costa e il mare immediatamente davanti a lui si ritirò, lasciando molte imbarcazioni arenate sulla spiaggia appena formata. Poi l'onda entrò nelle zone lasciate libere e colpì con incredibile violenza. Senza alcuna eccezione le imbarcazioni furono ridotte a pezzi e molte case vicine alla riva furono immediatamente distrutte. E nonostante l'acqua si alzò a grande altezza davanti a lui, la sua casa fu risparmiata, perché era posta in un luogo elevato, a una buona distanza dal mare. Anche il Grande Palazzo fu in gran parte risparmiato dal mare. Ma Amtep temeva che il peggio dovesse ancora arrivare, e aveva ragione - anche se non sapeva quanto avesse ragione. Sapeva tuttavia che l'ordinario sacrificio di una schiava sarebbe stato, questa volta, insufficiente. Ci sarebbe stato bisogno di qualcosa di più per calmare l'ira funesta di questo terribile Dio. Il suo pensiero corse ai figli e al nipote appena nato. Persino loro potevano non essere al sicuro. Am-tep aveva avuto ragione a temere nuovi sacrifici umani. Una giovane fanciulla e un giovane di buona famiglia erano stati subito arrestati e porta2
Prologo
ti in un tempio vicino, posto in alto sulle pendici di una montagna. E mentre il rituale era in corso si verificò un'altra catastrofe. Il terreno sussultò con violenza devastante, il tetto del tempio crollò, uccidendo immediatamente tutti i sacerdoti e le loro vittime sacrificali. Quando ciò avvenne, il rituale era a metà - per essere seppelliti per più di tre millenni e mezzo. La devastazione fu spaventosa, ma non definitiva. Molti abitanti dell'isola su cui viveva Am-tep sopravvissero al terribile terremoto, anche se il Grande Palazzo fu distrutto quasi completamente. Nel corso degli anni venne messa in atto l'opera di ricostruzione. Anche il Palazzo, costruito sulle rovine del vecchio, recuperò gran parte del suo originale splendore. Am-tep tuttavia aveva giurato di lasciare l'isola. Il suo mondo era irrimediabilmente cambiato. Nel mondo che conosceva vi erano stati mille anni di pace, prosperità e cultura, dove aveva regnato la Dea Terra. Erano fiorite arti meravigliose. Vi era molto commercio con i paesi vicini. Il maestoso Grande Palazzo era un enorme e lussuoso labirinto, una città virtuale per conto proprio, adornato da superbi affreschi di animali e fiori. Vi era acqua corrente, un eccellente drenaggio e fogne pulite. La guerra era quasi sconosciuta e le difese non erano necessarie. Ma Am-tep comprese che la Dea Terra era stata detronizzata da un Essere con valori completamente diversi. Passarono alcuni anni prima che Am-tep abbandonasse davvero l'isola, accompagnato dai familiari superstiti, su un'imbarcazione costruita dal figlio più giovane, un esperto carpentiere e marinaio. Il nipotino di Am-tep era un bambino sveglio che s'interessava a ogni cosa. Il viaggio richiese alcuni giorni, ma le condizioni metereologiche furono dalla loro parte. In una notte chiara Am-tep stava spiegando al nipotino le disposizioni delle stelle, quando uno strano pensiero lo colse di sorpresa. Le disposizioni delle stelle non erano state assolutamente modificate, neppure per uno iota, rispetto alla loro posizione prima della Catastrofe apparizione del terribile Demone. Am-tep conosceva bene queste disposizioni, perché aveva l'occhio acuto dell'artista. Egli pensò che quei minuscoli punti luminosi nel cielo avrebbero sicuramente dovuto spostarsi almeno un po' dalle loro posizioni a causa della violenza di quella notte, proprio come i suoi vasi erano stati ridotti in pezzi e la sua grande urna frantumata. Anche la Luna aveva mantenuto la sua Faccia, proprio come prima, e il suo percorso nel cielo colmo di stelle non era cambiato neanche un po', per quanto Am-tep poteva comprendere. Per molte notti dopo la Catastrofe, il cielo era davvero apparso diverso. Vi era stata oscurità e nuvole strane, la Luna e il Sole erano a volte di un colore insolito. Ma ora sembrava che le loro traiettorie non fossero assolutamente diverse rispetto a prima. E le minuscole stelle, allo stesso modo, non avevano cambiato posizione. Se i cieli avevano mostrato così scarso interesse alla Catastrofe, possedendo una statura notevolmente maggiore di quella del terribile Demone così ragionò Am-tep - perché le forze che controllavano lo stesso Demone 3
LA STRADA CHE PORTA ALLA REALTÀ
avrebbero dovuto mostrare interesse a quello che il piccolo popolo dell'isola stava facendo, a quegli sciocchi rituali e a quei sacrifici umani? Provò anche imbarazzo ripensando ai suoi sciocchi pensieri di allora, che il Demone si fosse potuto adirare solo per i disegni sui suoi vasi. Tuttavia Am-tep era ancora turbato dalla domanda "Perché?" Quali grandi forze controllano il comportamento del mondo e perché esse a volte si manifestano in violenti e in modi apparentemente incomprensibili? Condivise le sue domande col nipote, ma non vi furono risposte.
Passò un secolo, poi un millennio, senza che vi fosse alcuna risposta.
Amphos l'artigiano aveva passato tutta la vita nella stessa piccola città dove avevano vissuto suo padre e tutti i suoi antenati. Si guadagnava da vivere realizzando braccialetti d'oro finemente decorati, orecchini, coppe da cerimonia e altri prodotti della sua abilità artistica. La sua famiglia aveva svolto questo per quaranta generazioni - una serie ininterrotta da quando Am-tep si era stabilito là, millecento anni prima. Ma da generazione a generazione non si era tramandata solo l'abilità artistica. Le domande di Am-tep turbavano Amphos allo stesso modo in cui avevano turbato lo stesso Am-tep in un'epoca molto lontana. La grande storia della Catastrofe, che aveva distrutto un'antica e pacifica civiltà, era stata tramandata da padre a figlio. Anche l'intuizione di Am-tep della Catastrofe era sopravvissuta presso i suoi discendenti. Anche Amphos comprendeva che i cieli avevano una grandezza e una dimensione così grandi da non essere del tutto toccati da quel terribile evento. Nonostante ciò, l'evento aveva avuto un effetto catastrofico sulle poche persone con le loro città e i loro sacrifici umani e gli insignificanti rituali religiosi. Perciò, in confronto, l'evento stesso doveva essere stato il risultato di forze enormi, completamente indifferenti a quelle banali azioni degli esseri umani. Ma la natura di quelle forze era tanto sconosciuta all'epoca di Amphos quanto lo era stata a quella di Am-tep. Amphos aveva studiato la struttura delle piante, degli insetti, di altri piccoli animali e delle rocce cristalline. Il suo occhio attento gli era stato utile anche nei disegni decorativi. S'interessava di agricoltura ed era affascinato dalla crescita del grano e di altre piante dal seme. Ma niente di ciò gli spiegava il 'perché' e così si sentiva insoddisfatto. Credeva che vi fosse veramente una ragione alla base degli schemi della Natura, ma non aveva assolutamente gli strumenti per svelare quelle ragioni. In una notte limpida, Amphos guardò il cielo e tentò di capire dalla disposizione delle stelle le figure di quegli eroi e di quelle eroine che forma4
Prologo
vano le costellazioni nel cielo. Ai suoi occhi di umile artista quelle figure erano ben poco rassomiglianti. Egli stesso avrebbe saputo disporre le stelle in modo molto più convincente. Sconcertato si chiese: perché gli Dei non hanno disposto le stelle in modo più appropriato? Le disposizioni, così com'erano, sembravano più semi sparsi, gettati a caso da un contadino, che il deliberato disegno di un Dio. Allora fu pervaso da un pensiero bizzarro: Non tentare di trovare ragioni nelle specifiche disposizioni delle stelle o di altre sistemazioni spatpagliate di oggetti; tenta, invece, di trovare un ordine universale più profondo nel modo in cui le cose si comportano. Amphos rifletté che, dopo tutto, noi troviamo l'ordine non nelle figure che i semi sparsi formano quando cadono sul terreno, ma nel modo miracoloso con cui ciascuno di quei semi può svilupparsi in una pianta vivente con una superba struttura, simile in gran dettaglio a ogni altra. Noi non cercheremmo di trovare un significato nell'esatta disposizione dei semi sparsi sul suolo; un senso deve esserci, tuttavia, nel segreto mistero delle forze interne che controllano la crescita di ciascun singolo seme, in modo che ciascuno segua sostanzialmente il medesimo corso meraviglioso. Le leggi della Natura devono davvero possedere una precisione superbamente organizzata, affinché questo sia possibile. Amphos si convinse che, senza precisione nelle leggi fondamentali, non vi sarebbe alcun ordine nel mondo, mentre si percepisce molto ordine nel modo con cui le cose si comportano. Inoltre, vi deve essere precisione nel nostro modo di ragionare su tali. questioni, se non dobbiamo essere seriamente fuorviati. Accadde che Amphos venne a sapere di un saggio che viveva in un'altra parte del paese, le cui convinzioni sembravano essere in accordo con la propria. Secondo questo saggio, non si poteva fare affidamento sugli insegnamenti e le tradizioni del passato. Per essere certi delle proprie convinzioni, era necessario ricavare conclusioni precise con l'impiego di ragionamenti incontestabili. La natura di questa precisione doveva essere matematica sostanzialmente dipendente dalla nozione di numero e dalla sua applicazione a forme geometriche. Devono quindi essere numero e geometria, non mito e superstizione, a governare il comportamento del mondo. Amphos s'imbarcò, come aveva fatto Am-tep millecento anni prima di lui. Trovò la strada fino alla città di Crotone, dove il saggio e la sua comunità di 571 uomini saggi e di 28 donne sagge studiavano in cerca di verità. Dopo qualche tempo Amphos fu accettato nella comunità. Il nome di quel saggio era Pitagora.
CAPITOLO
1
LE RADICI DELLA SCIENZA
1.1 La ricerca delle forze che modellano il mondo Quali sono le leggi che governano il nostro universo? Con quali mezzi possiamo conoscerle? In quale modo una simile conoscenza ci aiuta a comprendere e forse a influenzare il mondo? Sin dall'alba dell'umanità gli esseri umani sono stati profondamente interessati a domande come queste. Dapprima avevano cerèato di comprendere le influenze che controllano il mondo rifacendosi a quelle cognizioni che la loro epoca metteva loro a disposizione. Avevano immaginato che qualunque cosa o chiunque controllasse il loro ambiente 1'avrebbe fatto nello stesso modo con cui essi stessi si sarebbero sforzati di controllare le cose: inizialmente pensarono dunque che il loro destino fosse sotto l'influenza di Esseri che agivano in perfetto accordo con i loro propri impulsi umani. Impulsi quali l'orgoglio, l'amore, l'ambizione, la rabbia, la paura, la vendetta, la passione, il castigo, la lealtà, la capacità artistica. Di conseguenza, il corso degli eventi naturali come la luce del sole, la pioggia, la tempesta, la carestia, la malattia o la pestilenza - avrebbe seguito i capricci di Dei o Dee spinti a loro volta da pulsioni umane. E la sola azione capace di esercitare un'influenza su questi eventi era l'appagamento degli Dei. Gradualmente però schemi di differente natura cominciarono a dimostrarsi attendibili. L'esattezza del movimento del Sole nel cielo e l'evidente correlazione con l'alternarsi di giorno e notte offrirono l'esempio più ovvio; ma si vide anche che la posizione del Sole rispetto alla sfera celeste delle stelle era strettamente associata alla inarrestabile e regolare variazione delle stagioni, con una conseguente chiara influenza sul clima e sul comportamento della vegetazione e degli animali. Anche il movimento della Luna sembrava essere rigorosamente controllato, con le sue fasi determinate dalla sua relazione geometrica con il Sole. In quelle regioni del pianeta dove i mari aperti incontravano la terra, si notò che le maree avevano una regolarità strettamente governata dalla posizione ( e fase) della Luna. Infine anche i 7
LA STRADA CHE PORTA ALLA REALTÀ
moti apparenti dei pianeti, molto più complicati, cominciarono a svelare i loro segreti, rivelando un'estrema precisione e regolarità alla loro base. Se i Cieli erano davvero controllati dai capricci degli Dei, allora sembrava che gli stessi Dei agissero sotto l'incantesimo di precise leggi matematiche. Allo stesso modo, le leggi che controllano alcuni fenomeni terrestri e che sembravano influenzate dai Cieli - come le variazioni giornaliere e annuali di temperatura, il flusso e riflusso degli oceani, la crescita delle piante - condividevano la regolarità matematica che sembrava guidare gli Dei. Ma questa relazione tra corpi celesti e comportamento terreno potrebbe apparire a volte esagerata o mal compresa e di conseguenza assumere un'importanza eccessiva, portando così agli aspetti occulti e mistici dell'astrologia. Furono necessari molti secoli prima che il rigore del sapere scientifico permettesse di districare le vere influenze dei Cieli da quelle puramente ipotetiche e mistiche. Fu tuttavia evidente fin dai primissimi tempi che simili influenze esistevano davvero e che, di conseguenza, le leggi matematiche dei Cieli devono avere importanza anche sulla Terra. In modo apparentemente indipendente da ciò, si percepì che vi erano altre regolarità nel comportamento degli oggetti terrestri. Una di queste era la tendenza di tutte le cose in una stessa zona a muoversi nella medesima direzione verso il basso, conformemente all'influenza che adesso chiamiamo gravità. Si osservò che qualche volta la materia si trasformava da una forma in un'altra, come nel caso della fusione del ghiaccio o dello scioglimento del sale, ma sembrava che la quantità totale di quella materia non cambiasse mai; questa è la legge che adesso chiamiamo conservazione della massa. Si notò inoltre che vi erano molti corpi materiali che avevano l'importante proprietà di mantenere la loro forma, fenomeno che fece sorgere l'idea di moto spaziale rigido. Divenne così possibile comprendere le relazioni spaziali in termini di una precisa e ben definita geometria - la geometria tridimensionale che adesso chiamiamo euclidea. Per di più, risultò che la nozione di «linea retta» in questa geometria era la medesima che era offerta dai raggi luminosi (o linee di mira). Queste idee possedevano una notevole precisione e bellezza ed ebbero grande fascino per gli antichi, proprio come per noi adesso. Tuttavia, riguardo alla vita di ogni giorno, le implicazioni di questa precisione matematica per le azioni del mondo spesso apparivano banali e limitate, nonostante la matematica di per sé sembrasse rappresentare una profonda verità. Di conseguenza nei tempi antichi molte persone, affascinate dal1'argomento, si fecero trasportare dall'immaginazione. In astrologia, per esempio, le figure geometriche spesso assunsero connotazioni mistiche e occulte, come i presunti poteri magici di pentagrammi ed eptagrammi. Si tentò persino di mettere in relazione, in modo del tutto ipotetico, i solidi platonici e gli stati elementari fondamentali della materia (vedi fig. L 1). Così per molti secoli non si poté arrivare alle profonde conoscenze che ora ab8
Le radici della scienza
-
;~-;f>_·:.
:,f;:;• . . ,.-:-
Fig. 1.1 - Un'associazione puramente di fantasia fatta dai Greci antichi tra i cinque solidi platonici e i quattro «elementi» (fuoco, aria, acqua e terra), assieme al firmamento celeste rappresentato dal dodecaedro.
biamo riguardo alle vere relazioni tra massa, gravità, geometria, moto planetario e comportamento della luce.
1.2 Verità matematica I primi passi verso la comprensione delle vere influenze che controllano la Natura richiedevano di districare il vero dal puramente ipotetico. Ma gli antichi dovevano raggiungere altri risultati, prima di essere in grado di comprendere la Natura: quello che dovevano fare era innanzitutto scoprire il modo di districare il vero dall'ipotetico in matematica. Era necessario un procedimento per dire se una data affermazione matematica può essere ritenuta vera o meno. E finché tale questione preliminare non fosse stata determinata in modo ragionevole, vi sarebbe stata ben poca speranza di dedicarsi seriamente ai problemi più difficili, riguardanti le forze che controllano l'effettivo comportamento del mondo e le loro diverse relazioni con la verità matematica. La chiave per comprendere la Natura si trovava infatti in una matematica irrefutabile: la percezione di questo fatto fu forse la prima grande conquista della scienza. Sebbene verità matematiche di vario genere fossero state congetturate sin dai tempi degli antichi Egizi e dei Babilonesi, la prima solida pietra angolare della comprensione matematica - e quindi della scienza stessa - fu posta 9
LA STRADA CHE PORTA ALLA REALTÀ
soltanto quando i ·grandi filosofi greci Talete di Mileto (c. 625-c. 547 a. C.) e Pitagora* 1 di Samo (c. 572-497 a. C.) introdussero la nozione di dimostrazione matematica. Sembra che Talete sia stato il primo a parlare della nozione di dimostrazione, ma che fu Pitagora il primo a utilizzarla per dimostrare cose che altrimenti non sarebbero state ovvie. Sembra anche che Pitagora abbia avuto la grande intuizione dell'importanza del numero e dei concetti aritmetici per il controllo delle azioni del mondo fisico. Si dice che giunse alla sua intuizione osservando la relazione tra le più belle armonie prodotte da lire e flauti e i semplici rapporti tra le lunghezze di corde vibranti o di tubi. Si dice anche che a lui si debba l'introduzione della «scala pitagorica», i cui rapporti numerici costituiscono le frequenze che determinano gli intervalli principali su cui è basata sostanzialmente la musica occidentale. 2 Il famoso teorema di Pitagora, che afferma che il quadrato costruito sull'ipotenusa di un triangolo rettangolo è uguale alla somma dei quadrati costruiti sugli altri due lati, mostra, forse più di qualunque altra cosa, che vi è davvero una precisa relazione tra l'aritmetica dei numeri e la geometria dello spazio fisico (vedi capitolo 2). Pitagora ebbe una numerosa comunità di seguaci - i Pitagorici - nella città di Crotone, ma la loro influenza sul mondo esterno fu ostacolata dal fatto che tutti i membri avevano giurato di mantenere il segreto. Di conseguenza, molte delle loro dettagliate conclusioni sono andate perse: solo alcune di queste erano trapelate ugualmente, con disastrose conseguenze per le «talpe», in almeno un'occasione uccise per annegamento! Nel lungo periodo, l'influenza dei Pitagorici sul progresso del pensiero umano è stata enorme. Per la prima volta, con la dimostrazione matematica, era possibile fare affermazioni significative di natura inconfutabile, così che esse sarebbero tanto vere oggi quanto lo erano al momento della loro formulazione, a prescindere da come la nostra conoscenza del mondo sia progredita da allora. La vera natura eterna della matematica stava cominciando a rivelarsi. Ma che cos'è una dimostrazione? Una dimostrazione, in matematica, è un argomento ineccepibile che, impiegando soltanto i metodi del puro ragionamento logico, permette di dedurre la validità di una data asserzione matematica dalla validità, già stabilita, di altre asserzioni matematiche e da certe affermazioni primitive - gli assiomi - la cui validità è ritenuta evidente. Una volta che una simile asserzione matematica è stata stabilita in questo modo, è chiamata teorema. Molti dei teoremi cui i Pitagorici erano interessati erano di natura geometrica. Altri_erano semplicemente asserzioni sui numeri. Quelli che riguardavano soltanto numeri hanno una validità inequivocabile anche oggi, proprio
* Le note numerate, indicate nel suddetto testo, si trovano alla fine del capitolo, 10
Le radici della scienza
come l'avevano al tempo di Pitagora. Cosa dire dei teoremi geometrici che i Pitagorici avevano ottenuto usando i loro procedimenti di dimostrazione matematica? Anch'essi hanno una chiara validità oggigiorno, eppure c'è un problema a complicare le cose. È una questione la cui natura è più comprensibile a noi, dal nostro moderno. osservatorio privilegiato, rispetto a quanto lo fosse al tempo di Pitagora. Gli antichi conoscevano solo un tipo di geometria, in altre parole quella che ora chiamiamo geometria euclidea, ma adesso noi ne conosciamo molti altri tipi. Così, nel prendere in considerazione i teoremi geometrici dell'antica Grecia, diventa importante specificare che la nozione di geometria cui ci si riferisce è proprio la geometria di Euclide. (Nel § 2.4, dove sarà dato un esempio importante di geometria non euclidea, sarò più esplicito su tali questioni.) La geometria euclidea è una specifica struttura matematica, con propri specifici assiomi (che includono alcune asserzioni meno sicure, chiamate postulati), che offriva un'eccellente approssimazione di un particolare aspetto del mondo fisico. Questo era l'aspetto di realtà, ben familiare agli antichi greci, che faceva riferimento alle leggi che reggono la geometria di oggetti rigidi e le loro relazioni con altri oggetti rigidi, quando sono mossi nello spazio tridimensionale. Alcune di queste proprietà erano così familiari e coerenti che tendevano a essere ritenute verità matematiche «ovvie» ed erano prese come assiomi (o postulati). Come vedremo nei capitoli 17-19 e nei §§27.8 e_27.1 l, la relatività generale di Einstein - e anche la geometria di Minkowsky della relatività speciale - forniscono geometrie per l'universo fisico che sono diverse, ma tuttavia più precise della pur straordinariamente precisa geometria di Euclide. Dobbiamo quindi valutare bene, quando prendiamo in considerazione asserzioni geometriche, se sia possibile credere che gli «assiomi» siano, in qualsiasi senso, effettivamente veri. Ma che cosa significa «vero» in questo contesto? Questa difficile questione fu apprezzata dal grande filosofo greco Platone che visse ad Atene circa dal 429 a. C. al 347 a. C., più o meno un secolo dopo Pitagora. Platone chiarì che le asserzioni matematiche - le cose che potevano essere ritenute incontestabilmente vere - si riferivano non a effettivi oggetti fisici (come gli approssimativi quadrati, triangoli, cerchi, sfere e cubi che potevano essere disegnati sulla sabbia, o costruiti con legno o pietra) ma a certe entità idealizzate, o idee. Egli immaginò che queste entità ideali abitassero un altro mondo, distinto dal mondo fisico. Oggigiorno possiamo fare riferimento a questo mondo come al mondo platonico delle forme matematiche. Le strutture fisiche, come i quadrati, i cerchi o i triangoli ritagliati dal papiro o tracciati su una superficie piatta, o forse i cubi, i tetraedri o le sfere scolpiti nel marmo, potrebbero essere rigorosamente conformi a questi ideali, ma soltanto in modo approssimato. I reali quadrati, cubi, cerchi, sfere, triangoli matematici non farebbero parte del 11
LA STRADA Cl!E PORTA ALLA REALTÀ
mondo fisico, ma risiederebbero nel mondo matematico delle forme idealizzate di Platone.
1.3 n mondo matematico di Platone è «reale»? Questa fu un'idea straordinaria per quell'epoca, e si è rivelata molto potente. Ma il mondo matematico platonico esiste effettivamente, in qualsiasi senso? Molti tra filosofi e persone comuni potrebbero ritenere un simile «mondo» una perfetta finzione, un esclusivo prodotto della nostra sfrenata immaginazione. Tuttavia il punto di vista platonico ha davvero un immenso valore. Ci dice di prestare attenzione a distinguere le esatte entità matematiche dalle approssimazioni che vediamo intorno a noi nel mondo delle cose fisiche. Inoltre ci fornisce lo schema in base al quale la scienza moderna ha proceduto da allora. Gli scienziati suggeriscono modelli del mondo - o piuttosto di certi aspetti del mondo - e questi modelli possono essere testati contro osservazioni precedenti e contro i risultati di esperimenti accuratamente progettati. I modelli sono ritenuti appropriati se superano questi rigorosi esami e se, oltre a ciò, sono strutture internamente coerenti. Per la nostra attuale discussione, il punto importante riguardo questi modelli è che essi sono fondamentalmente modelli matematici puramente astratti. La questione stessa della coerenza interna di un modello scientifico, in particolare, richiede che il modello sia esattamente specificato. Questa precisione esige che il modello sia matematico, perché altrimenti non si può essere sicuri che tali questioni abbiano risposte ben definite. Se al modello in sé viene assegnato qualsiasi genere di «esistenza», allora questa esistenza è collocata nel mondo platonico delle forme matematiche. Naturalmente, si potrebbe assumere un punto di vista opposto: e precisamente che il modello in sé esista soltanto nelle nostre menti, invece di ritenere che il mondo di Platone sia in un qualsiasi senso assoluto e «reale». Tuttavia si possono raggiungere significativi risultati postulando che le strutture matematiche abbiano una propria realtà. Le nostre menti individuali, infatti, sono notoriamente imprecise, inaffidabili e incoerenti nei loro giudizi. La precisione, l'affidabilità e la coerenza, che le nostre teorie scientifiche richiedono, esigono qualcosa che vada oltre ciascuna delle nostre labili menti individuali. Nella matematica troviamo una consistenza decisamente maggiore rispetto a quella che può trovarsi in una qualunque mente particolare. Tutto ciò non si rivolge a qualcosa al di fuori di noi e a una realtà che si trova al di là di ciò che ciascun individuo può raggiungere? Nonostante ciò, si potrebbe ancora assumere il punto di vista alternativo che il mondo matematico non abbia alcuna esistenza indipendente e consista soltanto di certe idee, distillate dalle nostre menti, talmente degne di fiducia che hanno conquistato il consenso di tutti. Ma anche questo punto di 12
Le radici della scienza
vista è manchevole sotto molti riguardi. Il «consenso di tutti», per esempio, significa veramente questo o significa il «consenso di quelli che sono saggi» o il «consenso di tutti quelli che hanno un dottorato in matematica» (non di grande utilità al tempo di Platone) e che hanno il diritto di azzardare un'opinione «autorevole»? Sembra che qui vi sia un pericolo di circolarità; infatti, per giudicare se qualcuno è o non è «saggio» occorre basarsi su qualche criterio esterno. E lo stesso avviene per il significato di «autorevole», a meno che non si adotti qualche criterio di natura non scientifica, come «l'opinione della maggioranza» (e si dovrebbe chiarire che l'opinione della maggioranza, per quanto possa essere importante per un governo democratico, non dovrebbe assolutamente essere impiegata come il criterio di accettabilità scientifica). Sembra proprio che la matematica abbia una forza che va ben al di là di ciò che qualsiasi singolo matematico è capace di percepire. Quelli che lavorano in questo campo, siano essi attivamente impegnati nella ricerca matematica o usino solo risultati ottenuti da altri, hanno di solito la sensazione di essere soltanto esploratori in un mondo che giace oltre loro stessi, un mondo che possiede un'obiettività che trascende la semplice opinione, sia che tale opinione sia loro o la congettura di altri, non importa quanto esperti. Può essere d'aiuto sistemare in una maniera differente le argomentazioni a favore dell'esistenza del mondo platonico. Ciò che intendo con il termine «esistenza» è realmente solo l'obiettività della verità matematica. L' esistenza platonica, a mio modo di vedere, fa riferimento all'esistenza di un oggettivo modello esterno che non dipende dalle nostre opinioni individuali e neppure dalla nostra particolare cultura. Una simile «esistenza» potrebbe anche riferirsi a oggetti diversi dalla matematica, come la morale o l'estetica (cfr. § 1.5), ma qui m'interesso solo all'obiettività matematica, che sembra essere una questione molto più chiara. Lasciatemi illustrare tale questione prendendo in considerazione un famoso esempio di verità matematica, e lasciatemi collegarlo alla questione dell'obiettività. Nel 1637 Pierre de Fermat fece la sua famosa asserzione ora nota come «Ultimo Teorema di Fermat» (nessuna potenza ennesima positiva3 può essere la somma di due altre potenze ennesime positive, se n è un numero intero più grande di 2), che poi trascrisse sul margine della sua copia di Arithmetica, un libro scritto nel terzo secolo dal matematico greco Diofanto. Su questo margine Fennat scrisse anche: «Ho trovato una dimostrazione veramente notevole che questo margine non può contenere». L'asserzione matematica di Fermat rimase non confermata per più di 350 anni, nonostante i grandi sforzi di molti eccellenti matematici. Solo nel 1995 Andrew Wiles ha trovato una dimostrazione (che dipende da precedenti lavori di altri matematici) che è stata accettata come un valido argomento dalla comw1ità scientifica. Ora dobbiamo considerare che l'asserzione di Fermat sia sempre stata vera, ancora prima della reale forniulazione dello stesso Fermat, oppure che la sua 13
LA STRADA CHE PORTA ALLA REALTÀ
validità sia una questione puramente culturale, dipendente dagli standard soggettivi della comunità dei matematici? Tentiamo di supporre che la validità dell'affermazione di Fermat sia, in effetti, una questione soggettiva. Non sarebbe stata allora un'assurdità per un matematico X presentarsi con un effettivo e specifico controesempio all'asserzione di Fennat, purché X avesse fatto questo prima del 1995.4 In tali circostanze la comunità matematica avrebbe dovuto accettare la correttezza del controesempio di X. Da allora in avanti qualsiasi sforzo da parte di Wiles di dimostrare l'asserzione di Fermat sarebbe stato infruttuoso, per il motivo che X è arrivato per primo e, a causa di ciò, l 'asserzione di Fermat sarebbe ora falsa! Inoltre potremmo chiederci ulteriormente se, in conseguenza della correttezza dell'imminente controesempio di X, lo stesso Fermat avrèbbe dovuto necessariamente essere in errore nel credere alla fondatezza della sua «veramente notevole dimostrazione», quando scrisse la sua nota a margine. Dal punto di vista soggettivo della verità matematica, probabilmente Fermat aveva una valida dimostrazione (che sarebbe stata allora accettata dai suoi pari, se l'avesse rivelata) e fu la sua riservatezza a consentire che X ottenesse più tardi un controesempio! Io penso che virtualmente tµtti i matematici, a prescindere dagli atteggiamenti professati rispetto al «platonismo», considererebbero simili possibilità palesemente assurde. Potrebbe anche darsi, naturalmente, che l'argomento di Wiles contenga in realtà un errore e che l'asserzione di Fermat sia davvero falsa. O vi potrebbe essere un errore fondamentale nell'argomento di Wiles, ma nonostante ciò l'asserzione di Fermat sarebbe vera. O potrebbe essere che l'argomento di Wiles sia essenzialmente corretto pur contenendo «passaggi non rigorosi» che non sarebbero all'altezza dello standard di qualche futura regola d'accettabilità matematica. Tali questioni non si applicano però al punto che qui sto trattando. Il problema è l'obiettività dell'asserzione di Fermat in sé e per sé, non se la particolare dimostrazione di essa (o della sua negazione) da parte di qualcuno possa risultare convincente alla comunità matematica di qualunque particolare epoca. Si dovrebbe forse precisare che, dal punto di vista della logica matematica, l'asserzione di Fermat è effettivamente un'affermazione matematica di tipo particolarmente semplice, 5 la cui oggettività è piuttosto evidente. Soltanto una piccolissima minoranza6 di matematici riterrebbe che la verità di similì affermazioni sia in qualunque modo «soggettiva» anche se vi potrebbe essere un po' di soggettività sul genere d'argomento che sarebbe ritenuto convincente. A ogni modo, vi sono altri tipi d'affermazione matematica la cui verità potrebbe plausibilmente essere ritenuta una «questione d'opinione». L'affermazione di questo tipo meglio conosciuta è forse l'assioma di scelta. AI momento non è importante per noi sapere che cosa sia l' assioma di scelta. Qui è citato solo come esempio. La maggior parte dei matematici considererebbe probabilmente l'assioma di scelta come «ovviamente vero», mentre altri lo possono ritenere un'asserzione alquanto discutibile, che 14
Le radici della scienza
potrebbe persino essere falsa (io personalmente sono orientato, in una certa misura, verso questo secondo punto di vista). Altri ancora la riterrebbero un'asserzione la cui «verità» è una pura questione d'opinione o, piuttosto, qualcosa che può essere trattato differentemente, in base a quale sia il sistema d'assiomi e di regole di procedura (un «sistema formale»; vedi § 16.6) a cui si sceglie di aderire. I matematici che sostengono quest'ultimo punto di vista (ma che accettano l'oggettività della verità d'affennazioni matematiche particolarmente evidenti, come l'asserzione di Fermat appena discussa) sarebbero dei platonici relativamente deboli. Quelli che aderiscono all 'oggettività, per quanto riguarda la verità dell'assioma di scelta, sarebbero più · fortemente platonici. Ritornerò sull'assioma di scelta nel§ 16.3, poiché è una questione che ha alcune relazioni con la matematica alla base del comportamento del mondo fisico, nonostante non sia molto trattata nella teoria fisica. Per il momento, sarà appropriato non preoccuparsi troppo di tale questione. Se l'assioma di scelta può essere definito in un modo o nell'altro da qualche forma appropriata d'inoppugnabile ragionamento matematico,7 allora la sua verità è davvero una questione interamente oggettiva, ed essa, o la sua negazione, appartiene al mondo platonico, nel senso in cui io interpreto il termine «mondo platonico». Se l'assioma di scelta è, d'altra parte, una pura questione d'opinione o di decisione arbitraria, allora il mondo platonico delle forme matematiche assolute non contiene né l'assioma di scelta né la sua negazione (anche se potrebbe contenere asserzioni nella forma «una certa cosa consegue dall'assioma di scelta» o «l'assioma di scelta è un teorema secondo le regole di un certo sistema matematico»). Le asserzioni matematiche che possono appartenere al mondo platonico sono quelle oggettivamente vere. In verità, io riterrei che l'oggettività matematica sia il reale argomento del platonismo matematico. Dire che un'asserzione matematica ha un'esistenza platonica significa soltanto affermare che è vera in senso oggettivo. Una discussione simile si applica a nozioni matematiche - come il concetto del numero 7, per esempio, o la regola di moltiplicazione dei numeri interi o l'idea di un insieme contenente un numero infinito d'elementi - che hanno tutte un'esistenza platonica perché sono nozioni oggettive. l;esistenza platonica, secondo il mio modo di pensare, è semplicemente una questione di oggettività e, di conseguenza, non dovrebbe essere ritenuta qualcosa di «mistico» o «non scientifico», nonostante alcune persone la pensino in questo modo. Tuttavia, come nel caso dell'assioma di scelta, la questione se qualche particolare proposta di un'entità matematica debba o non debba essere considerata come dotata di un'esistenza oggettiva può essere delicata e qualche volta tecnica. Nonostante ciò, non è certamente necessario essere matematici per apprezzare la generale robustezza di molti concetti matematici. Nella fig. 1.2 ho rappresentato alcune piccole porzioni di quella famosa entità ma15
LA STRADA CHE PORTA ALLA REALTÀ
.
(a)
Fig. 1.2 - (a) Cinsieme di Mandelbrot. (b), (c) e (d) Alcuni dettagli, che illustrano le esplosioni di quelle regioni contrassegnate nello stesso modo in fig. 1.2a, ingranditi per i rispettivi fattori lineari 11.6, 168.9 e 1042.
tematica nota come insieme di Mandelbrot. Questo insieme ha una struttura straordinariamente elaborata, ma non dovuta ad alcun disegno umano. Il fatto notevole è che questa struttura è definita da una regola matematica di particolare semplicità. Ritorneremo esplicitamente su questo punto nel §4.5, perché il tentativo di presentare questa regola in dettaglio adesso ci distrarrebbe dai nostri attuali scopi. Il punto che desidero mostrare è che nessuno, neppure lo stesso Benoit Mandelbrot quando per primo prese visione delle incredibili complicazioni nei dettagli più finì dell'insieme, aveva alcuna vera idea preconcetta della sua straordinaria ricchezza. I.?insieme di Mandelbrot non è stato certamente un'invenzione di qualche mente umana. I.?insieme esiste oggettivamente soltanto nella matematica stessa. Se ha senso assegnare una reale esistenza all'insieme di Mandelbrot, questa esistenza non è nelle nostre menti, perché 16
Le radici della scienza
nessuno può afferrare completamente l'infinita varietà e l'illimitata complicazione di questo insieme. La sua esistenza non può neppure trovarsi nella moltitudine di tabulati sfornati dai computer che cominciano a catturare parte della sua incredibile sofisticazione e della ricchezza di dettagli, poiché questi tabulati possono al più catturare un'ombra di un'approssimazione all'insieme. Esso, tuttavia, ha una forza al di là d'ogni dubbio; la stessa struttura, infatti, si rivela - in tutti i suoi dettagli percepibili, con sempre maggiore finezza quanto più è esaminato da vicino - qualunque sia il matematico o il computer che lo esamina. La sua esistenza può trovarsi solo nel mondo platonico delle forme matematiche. Mi rendo conto che vi sono ancora molti lettori che hanno difficoltà ad assegnare alle strutture matematiche qualche genere di reale esistenza; a questi chiedo solo di allargare la loro nozione di ciò che intendono per «esistenza». Le forme matematiche del mondo platonico non hanno evidentemente lo stesso tipo di esistenza dei comuni oggetti fisici, come tavoli o sedie. Non hanno una posizione spaziale e non esistono nel tempo. Si deve pensare che le nozioni matematiche oggettive siano entità atemporali, che non devono essere considerate come esistenti soltanto nel momento in cui sono percepite dagli esseri umani per la prima volta. Le particolari volute dell'insieme di Mandelbrot, che sono raffigurate in fig. 1.2c o in fig. 1.2d, non hanno raggiunto l'esistenza allorché sono state viste per la prima volta sullo schermo di un computer o su un tabulato; questo non si è verificato neppure quando per la prima volta è stata avanzata l'idea generale alla base dell'insieme di Mandelbrot - in realtà il primo non fu Mandelbrot, ma R. Brooks e J. P. Matelski, nel 1981, o forse ancora prima. Infatti, certamente né Brooks né Matelski, né all'inizio neppure Mandelbrot, avevano alcuna reale idea degli elaborati disegni che vediamo in fig. 1.2c e in fig. 1.2d. Quei disegni «esistevano» già dall'inizio dei tempi in senso potenziale e atemporale, e si sarebbero poi rivelati esattamente nella forma in cui li percepiamo oggigiorno, non importa in quale istante e in quale luogo un essere senziente avrebbe scelto di esaminarli.
1.4 Tre mondi e tre profondi misteri Quindi, l'esistenza matematica è diversa non solo dall'esistenza fisica ma anche da un'esistenza assegnata dalle nostre percezioni mentali. Vi è tuttavia una profonda e misteriosa connessione con ciascuna delle altre due forme d'esistenza: quella fisica e quella mentale. In fig. 1.3 ho schematicamente indicato tutte e tre queste forme d'esistenza - quella fisica, quella mentale e quella matematica platonica - come entità appartenenti a tre «mondi» separati, qui rappresentati da sfere. Sono anche indicate le misteriose connessioni tra questi mondi, e devo dire che nel tracciare questo dia17
LA STRADA CHE PORTA ALLA REALTÀ
mondo matematico platonico 3
~
mondo mentale
mondo fisico
Fig. 1.3 - I tre «mondi» quello matematico platonico, quello fisico e quello mentale e i tre profondi misteri nelle connessioni tra di loro.
gramma ho imposto al lettore alcune delle mie credenze, o dei miei pregiudizi, riguardo a questi misteri. Si può osservare, riguardo al primo di questi misteri - che collega il mondo matematico platonico con quello fisico-, che io accetto che soltanto una piccola parte del mondo matematico sia importante per il funzionamento del mondo fisico. È certo che oggigiorno la maggior parte delle attività dei matematici puri non abbia alcuna ovvia connessione con la fisica, e neppure con qualsiasi altra scienza (vedi §34.9), sebbene spesso possiamo essere sorpresi da inaspettate e importanti applicazioni. Analogamente, a proposito del secondo mistero, per mezzo del quale le facoltà mentali vengono in associazione con certe strutture fisiche (più specificamente, con cervelli umani sani e vigili), non insisto sul fatto che la maggior parte di tali strutture fisiche necessiti di persuadere l'intelligenza. Mentre il cervello di un gatto può davvero evocare qualità mentali, non richiedo che la stessa cosa valga per una roccia. Per il terzo mistero, infine, considero evidente che solo una piccola frazione della nostra attività mentale riguardi necessariamente verità matematiche assolute! (Più probabilmente ci occupiamo dei molteplici piaceri, irritazioni, preoccupazioni, eccitazioni e cose simili che riempiono le nostre vite quotidiane.) Questi tre fatti sono rappresentati dalle scarse dimensioni della base della connessione di ciascun mondo con il successivo, quando i mondi nel diagramma sono presi in senso orario. È, tuttavia, nell'inclusione della totalità di ciascun mondo nell'ambito della sua connessione con il mondo precedente che rivelo i miei pregiudizi. In questo modo, secondo la fig. 1.3, l'intero mondo fisico sembra essere come governato da leggi matematiche. Vedremo nei capitoli successivi come vi siano forti, sia pure incomplete, prove a supporto di questa tesi. Secondo questo punto di vista, tutte le cose nell'universo fisico sono davvero 18
Le radici della scienza
governate, in modo dettagliato e preciso, da principi matematici - forse da equazioni, come quelle di cui verremo a conoscenza nei capitoli successivi, o forse da alcune future nozioni matematiche fondamentalmente diverse da quelle che oggi etichettiamo con il termine «equazioni». Se questo è vero, allora perfino le nostre azioni fisiche sarebbero interamente soggette a untale controllo matematico finale, dove questo «controllo» potrebbe ancora consentire un certo comportamento casuale governato da rigorosi principi probabilistici. Molti si sentono a disagio con asserzioni di questo genere, e devo confessare che io stesso provo questa sensazione. Tuttavia sono pregiudizialmente favorevole a questa natura generale, poiché non si vede come possa essere tracciato un confine che separi le azioni fisiche sotto controllo matematico da quelle che potrebbero esserne al di fuori. A mio parere, il disagio mio e di molti lettori su tale questione deriva in parte da una nozione molto ristretta di ciò che il «controllo matematico» potrebbe comportare. Questo libro si propone tra l'altro di accennare e rivelare al lettore qualcosa della straordinaria ricchezza, potenza e bellezza che può scaturire una volta che sono state scoperte le giuste nozioni matematiche. Nell'insieme di Mandelbrot, com'è illustrato in fig. 1.2, possiamo iniziare ad avere un'idea della portata e della bellezza di tali scoperte. Anche queste strutture, però, occupano solo un ambito molto ristretto della matematica, in cui il comportamento è governato da uno stretto controllo computazionale. Al di .là di quest'ambito vi è un'incredibile ricchezza potenziale. Che cosa penso realmente della possibilità che tutte le mie azioni, e quelle dei miei amici, siano in definitiva governate da principi matematici di questo genere? Ci posso convivere. In verità, preferirei che queste azioni siano controllate da qualcosa che risiede in questo favoloso mondo matematico platonico, piuttosto che soggette al genere di semplicistici motivi, come la ricerca del piacere, l'avidità personale o la violenza aggressiva, che molti potrebbero sostenere essere le implicazioni di un punto di vista rigorosamente scientifico. Immagino tuttavia che moltissimi lettori potrebbero ancora avere difficoltà ad accettare che tutte le azioni nell'universo siano interamente soggette a leggi matematiche. Molti, analogamente, potrebbero muovere obiezioni a due altri miei pregiudizi che sono impliciti in fig. 1.3. Potrebbero pensare, per esempio, che stia assumendo un atteggiamento scientifico troppo duro tracciando il mio diagramma in un modo che implica che tutte le facoltà mentali abbiano le loro radici nella fisicità. Questo è proprio un pregiudizio perché non possiamo esserne completamente sicuri, ma d'altro canto è vero che non abbiamo alcuna ragionevole prova scientifica dell'esistenza di «menti» senza alcuna base fisica. Inoltre molte persone con credenze religiose sosterrebbero fortemente la possibilità di menti fisicamente indipendenti e potrebbero appellarsi a ciò che ritengono essere una potente testimonianza di genere diverso da quella rivelata dalla comune scienza. 19
LA STRADA CHE PORTA ALLA REALTÀ
Un altro mio pregiudizio si riflette nel fatto che in fig. 1.3 ho rappresentato l'intero mondo platonico come inserito nell'ambito delle facoltà mentali. Voglio così indicare che - almeno in linea.di principio- non vi sono verità matematiche che siano oltre la portata della ragione. Naturalmente vi sono affermazioni matematiche (perfino semplici somme aritmetiche) che sono così complicate che nessuno avrebbe la forza d'animo per portare a termine il ragionamento necessario. Tali cose, tuttavia, sarebbero potenzialmente alla portata della mente umana e sarebbero coerenti con il significato della fig. 1.3, come mi sono proposto di rappresentarlo. Nondimeno si deve considerare che vi potrebbero essere altre affermazioni matematiche al di fuori del potenziale ambito della ragione, e queste violerebbero il proposito della fig. 1.3. (Tale questione sarà considerata in maggior dettaglio in § 16.6, dove sarà discussa la sua relazione con il famoso teorema d' incompletezza di Godel.)8 Nella fig. 1.4, come concessione a quelli che non condividono tutti i miei personali pregiudizi su tali questioni, ho ridisegnato le connessioni tra i tre mondi per consentire tutte e tre le possibili violazioni dei miei pregiudizi. Di conseguenza si tiene conto ora anche della possibilità di azioni fisiche al di fuori dell'ambito del controllo matematico. Il diagramma consente anche di credere che potrebbero esistere facoltà mentali non radicate in strutture fisiche. Infine, permette l'esistenza di asserzioni matematiche vere, la cui verità sia in linea di principio inaccessibile alla ragione e al discernimento. Questo disegno presenta ulteriori misteri che superano addirittura quelli che ho ammesso nel mio disegno preferito del mondo, come è stato rappresentato in fig. 1.3. A mio parere, il punto di vista scientifico più rigorosamente organizzato della fig. 1.3 possiede già abbastanza misteri. Questi misteri non sono rimossi dal passaggio allo schema meno rigido della fig. 1.4, mondo matemati platonic
'' ';' ,/;t,r;_.\:r
I, I
mondo mentale
20
mondo fisico
Fig. 1.4 - La fig. 1.3 ridisegnata in modo che siano consentite violazioni di tre dei pregiudizi dell'autore.
Le radici della scienza
in quanto restano un profondo enigma le ragioni per cui al mondo dovrebbero applicarsi leggi matematiche con tale fenomenale precisione. (Potremo intravedere qualcosa della straordinaria accuratezza delle teorie fisiche fondamentali in §19.8, §26.7 e §27.13.) Inoltre, non sono soltanto la precisione ma anche la sottile sofisticazione e la bellezza matematica di queste riuscite teorie a essere profondamente misteriose. Un altro profondo mistero è anche il modo in cui materiale fisico adeguatamente organizzato - e qui faccio specifico riferimento a cervelli umani ( o animali) viventi - possa in qualche modo fare apparire come per magia la facoltà mentale della consapevolezza cosciente. Infine, vi è anche un mistero riguardo il modo in cui percepiamo la verità matematica. Non è solo il fatto che i nostri cervelli siano programmati per «calcolare» in modi affidabili; vi è qualcosa di molto più profondo di questo nelle intuizioni che persino il più modesto tra noi possiede quando apprezza, per esempio, il reale significato dei termini «zero», «uno», «due», «tre», «quattro», eccetera. 9 Di alcuni dei problemi che riguardano questo terzo mistero ci occuperemo nel prossimo capitolo (e più esplicitamente in §§16.5,6) in relazione alla nozione di dimostrazione matematica. La spinta principale di questo libro ha a che fare però con il primo di questi misteri: la notevole relazione tra la matematica e il reale comportamento del mondo fisico. Non si può apprezzare adeguatamente lo straordinario potere della scienza moderna senza qualche conoscenza di queste idee matematiche. Molti lettori, senza dubbio, si scoraggeranno alla prospettiva di dover venire a patti con la matematica per apprezzare la scienza; tuttavia, sono ottimista sul fatto che non troveranno il diavolo così brutto come temono. Spero inoltre di poter persuadere il lettore che, a dispetto delle sue precedenti esperienze, la matematica può essere divertente! Non mi occuperò specificamente qui del secondo dei misteri raffigurati nelle figg. 1.3 e 1.4, vale a dire il problema di come le facoltà mentali - più in particolare la consapevolezza cosciente - siano connesse ad appropriate strutture fisiche (anche se sfiorerò questo profondo problema in §34.7). I.:esplorazione del! 'universo fisico e delle leggi matematiche a esso associate ci terrà già abbastanza occupati; per di più, i problemi riguardanti le facoltà mentali sono profondamente controversi e ci distrarrebbero dallo scopo di questo libro. Forse però un commento non sarebbe fuori luogo. A mio parere, esiste una scarsa probabilità di arrivare a una profonda comprensione della natura della mente senza ampliare prima la conoscenza delle basi stesse della realtà fisica. Come risulterà chiaro dalle discussioni che saranno presentate nei capitoli successivi, io credo che siano necessarie grandi rivoluzioni nelle nostre conoscenze fisiche. Finché queste rivoluzioni non avverranno è soltanto molto ottimistico, secondo me, aspettarsi che molti reali progressi possano essere fatti nella comprensione della reale natura dei processi mentali. 10 21
LA STRADA CHE PORTA ALLA REALTÀ
1.5 Il Buono, il Vero e il Bello Riguardo ciò, vi è un ulteriore insieme di questioni sollevate dalle figg. 1.3 e 1.4. Ho considerato la nozione platonica di «mondo di forme ideali» solo nel senso ristretto di forme matematiche. La matematica si occupa fondamentalmente di un particolare ideale, la verità. Platone avrebbe sostenuto che vi sono altri due fondamentali ideali assoluti, ossia quello del Bello e quello del Buono. Non sono affatto contrario ad ammettere l'esistenza ditali ideali e a considerare che il mondo platonico sia abbastanza esteso per contenere assoluti di questa natura. In seguito incontreremo i nessi tra verità e bellezza che illuminano e confondono i problemi della scoperta e dell'accettazione di teorie fisiche (vedi, in particolare, §§34.2,3,9; vedi anche fig. 34.1 ). Inoltre, a parte l'indubbio (anche se spesso ambiguo) ruolo della bellezza per la matematica alla base del funzionamento del mondo fisico, i criteri estetici sono fondamentali per lo sviluppo di idee matematiche in sé e per sé, fornendo sia lo stimolo verso la scoperta sia una potente guida verso la verità. Supporrei addirittura che un importante elemento nella comune convinzione del matematico che un mondo platonico esterno abbia un'esistenza realmente indipendente da noi provenga dalla straordinariamente inaspettata bellezza nascosta che le idee stesse così spesso rivelano. Di rilevanza meno ovvia qui - ma di evidente importanza nel contesto più ampio - è la questione di un ideale assoluto di moralità: che cosa è buono e che cosa è cattivo, e come le nostre menti percepiscono questi valori? La moralità ha una profonda connessione con il mondo mentale, poiché è così intimamente collegata ai valori assegnati da esseri coscienti e, in modo più importante, alla presenza della coscienza stessa. È difficile capire quale potrebbe essere il significato della moralità in assenza d' esseri senzienti. Quando la scienza e la tecnologia progrediscono, una comprensione delle circostanze fisiche in cui le facoltà mentali si manifestano diventa sempre più importante. Credo che sia più rilevante che mai, nell'attuale cultura tecnologica, che le questioni scientifiche non siano separate dalle loro implicazioni morali. Tuttavia tali questioni ci porterebbero troppo lontano dall'ambito di questo libro. Abbiamo bisogno di trattare la questione della distinzione del vero dal falso prima di poter tentare di applicare una tale comprensione alla distinzione del buono dal cattivo. Vi è, infine, un ulteriore mistero riguardante la fig. 1.3 che ho lasciato per ultimo. Ho disegnato questa figura in modo da illustrare un paradosso. Come è possibile che, secondo i miei pregiudizi, ciascun mondo sembri includere tutto il mondo successivo? Non reputo che questo problema sia un motivo per abbandonare i miei pregiudizi, ma sol{anto per dimostrare la presenza di un mistero, perfino più profondo, che trascende quelli che ho mostrato prima. Vi può essere un senso in cui i tre mondi non siano affatto se22
Le radici della scienza
parati, ma riflettano soltanto, individualmente, aspetti di una verità più profonda del mondo nella sua totalità, verità di cui attualmente abbiamo scarse cognizioni. Dobbiamo percorrere un lungo cammino prima che tali questioni siano adeguatamente chiarite. Mi sono permesso di deviare un po' dalle questioni che ci riguardano; lo scopo principale di questo capitolo è di sottolineare l'importanza fondamentale che la matematica ha nella scienza, sia antica sia moderna. Diamo ora un'occhiata al mondo platonico, o almeno a una parte relativamente piccola ma importante di questo mondo, di particolare rilevanza per la natura della realtà fisica.
Note
I.
2.
3. 4.
5. 6.
Sfortunatamente non si conosce quasi nulla di attendibile su Pitagora, la sua vita, i suoi seguaci e le loro opere. A Pitagora viene però riconosciuto di aver creato i rapporti semplici nell'armonia musicale. Vedi Burkert (1972). Ai pitagorici sono comunque attribuite molte cose importanti; impiegherò quindi il termine «pitagorico» semplicemente come un'etichetta, senza alcuna pretesa di esattezza storica. Questa è la pura «scala diatonica» in cui le frequenze (in proporzione inversa alle lunghezze degli elementi vibranti) sono in rapporto 24:27:30:36:40:45:48, producendo molti casi di rapporti semplici, piacevoli all'orecchio. Le «note bianche» di un pianoforte moderno sono accordate (in base a un compromesso tra purezza pitagorica di armonia e facilità di variazioni di chiave) come approssimazioni a questi rapporti pitagorici, secondo la scala di temperamento equabile con 1 frequenze relative l:a':a4:a5:a7:d1:a11 :a12, dove a= T2 = 1.05946 ... (Nota: a 5 significa la quinta potenza di a, cioè a x a x a x a x a. La quantità è la radice dodicesima di 2, quel numero che elevato alla dodicesima potenza è 2, cioè 2 1112 , così che a 12 = 2. Vedi note 1.3 e §5.2.) Si ricordi dalla nota 2 che la potenza ennesima di un numero è quel numero moltiplicato n volte per se stesso. Così, la terza potenza di 5 è 125, scritta 53 = 125; la quarta potenza di 3 è 81, scritta 34 = 81, eccetera. In effetti, mentre Wiles tentava di «riparare una falla», scoperta dopo la sua presentazione a Cambridge nel giugno del 1993, nella sua dimostrazione dell'ultimo teorema di Fermat, tra la comunità matematica si sparse la voce che Noam Elkies avesse trovato un controesempio all'asserzione di Fermat. Nel 1988, Elkies aveva scoperto un controesempio alla congettura di Eulero - cioè che non vi sono soluzioni positive dell'equazione x 4 + y 4 + z4 = w4 - dimostrandone così la falsità. Pertanto, non era impossibile che egli avesse dimostrato anc):ie la falsità dell'asserzione di Fermat. Tuttavia, l'e-mail che aveva dato inizio a quelle voci era datata 1° aprile e il tutto si rivelò essere una burla perpetrata da Henry Darmon; vedi Singh (1997) pag. 293. Tecnicamente è un TT 1 - enunciato; vedi § 16.6. Mi rendo conto che facendo una tale asserzione cado nella mia stessa trappola, in un certo senso. Il problema non è se i matematici che assumono un'opinio23
LA STRADA CHE PORTA ALLA REALTÀ
7.
8.
9. 10.
ne soggettiva così estrema costituiscano una piccolissima minoranza o meno (e sicuramente io non ho fatto un'inchiesta accurata su questo punto): il problema è se una posizione così estrema possa essere realmente presa sul serio. Lascio che a giudicare sia il lettore. Alcuni lettori potrebbero essere a conoscenza della dimostrazione di GodelCohen secondo cui l'assioma dì scelta è indipendente dagli assiomi standard della teoria degli insiemi (il sistema di assiomi di Zermelo-Fraenkel). Bisognerebbe chiarire che l'argomento di Godel-Cohen non stabilisce di per sé se l'assioma di scelta sarà mai sistemato in un modo o nell'altro. Questo punto è messo in rilievo, per esempio, nella sezione finale del libro di Paul Cohen (1966), capitolo IV, §13, nonostante Cohen sia più esplicitamente interessato all'ipotesi del continuo che all'assioma di scelta; vedi §16.5. Qui vi è forse qualcosa d'ironico per il fatto che un convinto antiplatonico, che crede che la matematica sia «tutta nella mente», debba anche credere - così sembra - che non vi siano affermazioni matematiche che, in linea di principio, siano al di là della ragione. Se l'ultimo teorema di Fermat, per esempio, fosse stato inaccessibile (in linea di principio) alla ragione, questo punto di vista antiplatonico non accorderebbe alcuna validità né alla sua verità né alla sua falsità, poiché una validità tale deriva solo dall'atto mentale di percepire una dimostrazione o una confutazione. Vedi per esempio Penrose (1997). Le mie personali opinioni riguardo al tipo di cambiamento necessario nel nostro punto di vista fisico, affinché le facoltà mentali coscienti vi possano essere incluse, sono espresse in Penrose (1989, 1994, 1997).
CAPITOLO
2
UN ANTICO TEOREMA E UNA QUESTIONE MODERNA
2.1 Il teorema di Pitagora Consideriamo il problema della geometria. Che cosa sono davvero i diversi «tipi di geometria» cui abbiamo alluso nel capitolo precedente? Per prepararci a risolvere questo problema, ritorneremo al nostro incontro con Pitagora e prenderemo in considerazione il famoso teorema che porta il suo nome: 1 per qualsiasi triangolo rettangolo, il quadrato della lunghezza dell'ipotenusa (il lato opposto all'angolo retto) è uguale alla somma dei quadrati delle lunghezze degli altri due lati (fig. 2.1). Quali ragioni abbiamo per credere che questa asserzione sia vera? Come «dimostriamo» in realtà il teorema di Pitagora? Molti ragionamenti sono noti; io desidero prenderne in considerazione due, scelti per la loro particolare chiarezza, ciascuno dei quali ha una diversa enfasi. Per il primo, esaminiamo la struttura illustrata nella fig. 2.2. Essa è interamente composta da quadrati di due diverse dimensioni. Si può ritenere «ovvio» che questa struttura possa essere indefinitamente continuata, e che quindi l'intero piano sia coperto, senza vuoti o sovrapposizioni, da quadrati di queste due dimensioni regolarmente ripetentisi. La natura ripetitiva di questa struttura è resa manifesta dal fatto che, se segniamo i centri dei quadrati più piccoli, essi formano i vertici di un altro sistema di quadrati, molto più grandi di entrambi i quadrati iniziali, ma inclinati rispetto a essi (fig. 2.3) e in grado di coprire da soli l'intero piano. Ciascuno di questi quadrati inclinati è contrassegnato esattamente nello stesso modo, cosicché i segni su que-
b
a a2+b2=c2
Fig. 2.1 - Il teorema di Pitagora: per qualsiasi triangolo rettangolo, il quadrato della lunghezza dell'ipotenusa e è la somma dei quadrati delle lunghezze degli altri due lati a e b. 25
LA STRADA CHE PORTA ALLA REALTÀ
I
I Fig. 2.2 - Una tassellatura del piano con quadrati di due diverse dimensioni.
Fig. 2.3 - I centri dei quadrati più grandi formano i vertici di un reticolo di quadrati ancora più grandi, inclinati di un certo angolo.
sti quadrati si accordino per formare la struttura originaria a due quadrati. La stessa cosa avverrebbe se, invece di prendere i centri dei quadrati più piccoli, scegliessimo qualunque altro punto, insieme a tutti i suoi omologhi in tutta la struttura. La nuova struttura di quadrati inclinati è proprio la stessa di prima ma spostata senza rotazione, cioè per mezzo di un movimento chiamato traslazione. Per semplicità, possiamo ora scegliere come punto di partenza uno degli angoli della struttura originaria (vedi fig. 2.4). Dovrebbe essere chiaro che l'area del quadrato inclinato deve essere uguale alla somma delle aree dei due quadrati più piccoli, vale a dire i pezzi in cui i contrassegni che suddividerebbero questo quadrato più grande possono, per qualunque punto di partenza per i quadrati inclinati, essere spostati, senza rotazione, finché si accordano a formare i due quadrati più piccoli (fig. 2.5). È inoltre evidente dalla fig. 2.4 che la lunghezza dello spigolo del quadrato inclinato è l'ipotenusa di un triangolo rettangolo i cui due altri lati hanno lunghezze uguali ai lati dei due quadrati più piccoli. Abbiamo così dimostrato il teorema di Pitagora: il quadrato sull'ipotenusa è uguale alla somma dei quadrati sugli altri due lati. Tale ragionamento contiene davvero gli elementi essenziali per una semplice dimostrazione di questo teorema e ci offre inoltre qualche «motivo» per credere che il teorema debba essere vero, il che potrebbe non essere così ovvio con argomentazioni più formali, date da una successione di passi logici senza una chiara motivazione. Dovrebbe essere rilevato, a ogni modo, che sono state introdotte parecchie ipotesi implicite in questo ragionamento. La minore di queste ipotesi non è certamente quella che !'apparentemente ovvia struttura di quadrati che si ripetono, mostrata nella fig. 2.2 o persino nella fig. 2.6, sia effettivamente possibile dal punto di vista geometrico - o persino, in modo più critico, che un quadrato sia un qualcosa geometricamente possibile! Dopo tutto, che cosa intendiamo con il termine «quadrato»? Normalmente pensiamo che un quadrato sia una figura piana con lati tutti uguali e con angoli tutti retti. Che cos'è un angolo retto? Ebbene possiamo im26
Un antico teorema e una questione moderna
Fig. 2.4 - Il reticolo di quadrati inclinati può essere spostato per mezzo di una traslazione, in questo caso in modo che i vertici del reticolo inclinato giacciano su vertici dell'originario reticolo dei due diversi quadrati, mostrando che la lunghezza del lato di un quadrato inclinato è l'ipotenusa di un triangolo rettangolo i cui due altri lati sono i lati dei due quadrati iniziali.
Fig. 2.5 - Per qualsiasi particolare punto di partenza per il quadrato inclinato, come quello raffigurato, questi è diviso in pezzi che costituiscono i due quadrati più piccoli.
Fig. 2.6 - Il familiare reticolo di quadrati eguali. Come sappiamo che esiste?
maginare due rette che s'intersecano in un punto formando quattro angoli tutti uguali. Ciascuno di questi angoli uguali è allora un angolo retto. Tentiamo ora di costruire un quadrato. Prendiamo tre segmenti di retta uguali AB, BC e CD, dove gli angoli ABC e BCD sono retti, D e A trovandosi dallo stesso lato della retta BC, come nella fig. 2.7. Nasce la domanda: il segmento AD ha la stessa lunghezza degli altri tre segmenti? Inoltre, anche gli angoli DAB e CDA sono retti? Questi angoli dovrebbero essere uguali l'uno all'altro per ragioni di simmetria tra destra e sinistra nella figura, ma sono effettivamente angoli retti? Il fatto che lo siano ci sembra ovvio soltanto per la nostra familiarità con i quadrati, o forse perché possiamo ricordarci dai nostri studi scolastici qualche affermazione di Euclide che può essere impiegata per assicurarci che i lati BA e CD dovrebbero essere «paralleli» l'uno all'altro, e qualche affermazione che qualsiasi «trasversale» a un paio 27
LA STRADA Cf!E PORTA ALLA REALTÀ
I
I
A► '------.JQ..____
E
a------c
Fig. 2.7 - Tentate di costruire un quadrato. Assumete che ABC e BCD siano angoli retti, con AB= BC = CD. Ne consegue che anche DA sia eguale a queste lunghezze e che anche DAB e CDA siano angoli retti?
di parallele deve avere angoli corrispondenti uguali, là dove essa incontra le due parallele. Da ciò segue che l'angolo DAB dovrebbe essere uguale all'angolo complementare di ADC (cioè all'angolo EDC, nella fig. 2.7, essendo retto l'angolo ADE) oltre a essere, come sopra notato, uguale all'angolo ADC. Un angolo (ADC) può essere uguale al suo angolo complementare (EDC) soltanto se è un angolo retto. Dobbiamo anche dimostrare che il lato AD ha la stessa lunghezza di BC, ma anche questo è subito ottenuto, per esempio dalle proprietà delle trasversali alle rette parallele BA e CD. Così, con questo genere d'argomento euclideo, possiamo davvero provare l'effettiva esistenza di quadrati costituiti da angoli retti. Ma qui si cela un profondo problema.
2.2 I postulati di Euclide Nel costruire la sua nozione di geometria, Euclide prestò particolare attenzione a quali fossero le ipotesi da cui dipendevano le sue dimostrazioni. 2 Si concentrò soprattutto nella distinzione di certe asserzioni chiamate assiomi - che ovviamente erano ritenute vere e che fondamentalmente erano definizioni di ciò che egli intendeva per punti, linee, eccetera - dai cinque postulati che erano invece assunzioni la cui validità sembrava meno certa, ma che apparivano essere veri per la geometria del nostro mondo. Uultima di queste assunzioni, nota come quinto postulato di Euclide, era considerata meno ovvia delle altre e per molti secoli si pensò possibile trovare un modo di dedurla dagli altri postulati più evidenti. Il quinto postulato di Euclide è il cosiddetto postulato della parallela. Prima di discutere il postulato della parallela, vale la pena di fare notare la natura degli altri quattro postulati di Euclide. Questi postulati riguardano la geometria del piano (euclideo), anche se Euclide, nelle sue opere successive, si occupò anche dello spazio tridimensionale. Gli elementi fondamentali della sua geometria piana sono punti, linee rette e cerchi. In questo libro riterrò la «linea retta» (o semplicemente la retta) indefinitamente estesa in entrambe le direzioni; altrimenti parlerò di «segmenti». Il primo postulato di Euclide asserisce effettivamente che vi è un (unico) seg28
Un antico teorema e una questione moderna
mento di retta che unisce due punti qualsiasi. Il suo secondo postulato asserisce l'illimitata estendibilità di qualunque segmento di retta. Il suo terzo postulato asserisce l'esistenza di un cerchio con centro qualsiasi e qualunque raggio. Infine, il suo quarto postulato asserisce l'uguaglianza di tutti gli angoli retti. 3 Da un punto di vista moderno, alcuni di questi postulati appaiono un po' strani; in particolare il quarto, ma dobbiamo tenere in considerazione l'origine delle idee alla base della geometria d'Euclide. Egli era interessato fondamentalmente al movimento di corpi rigidi ideali e alla nozione di congruenza che segnalava quando uno di questi corpi rigidi ideali era mosso in coincidenza con un altro. L'uguaglianza tra un angolo retto appartenente a un corpo e quello appartenente a un altro aveva a che fare con la possibilità di muoverne uno in modo che le rette costituenti il suo angolo retto andassero a coincidere con le rette costituenti l'angolo retto dell'altro. Il quarto postulato, in effetti, asserisce l'isotropia e l'omogeneità dello spazio, così che una figura in un posto possa avere la «stessa» (cioè congruente) forma geometrica di una figura in qualche altro posto. Il secondo e terzo postulato esprimono l'idea che lo spazio è indefinitamente estendibile e senza «interruzioni», mentre il primo esprime la natura fondamentale di un segmento di retta. Anche se la maniera di Euclide di esaminare la geometria era piuttosto differente dalla nostra attuale, i suoi primi quattro postulati racchiudono fondamentalmente l'odierna nozione di spazio metrico (bidimensionale) con completa omogeneità e isotropia, e di estensione infinita. In effetti, un tale quadro sembra essere in stretto accordo con la natura spaziale su scala molto grande del reale universo, secondo la moderna cosmologia, come vedremo in §27.11 e in §28.1 O. Quale è allora la natura del quinto postulato di Euclide, il postulato della parallela? Esso asserisce, nella formulazione essenzialmente dovuta a Euclide, che se due segmenti di retta a e b in un piano intersecano entrambi un'altra retta c (cosicché e è detta una trasversale di a e b) in modo che la somma degli angoli interni dalla stessa parte di c sia minore di due angoli retti, allora a e b, se prolungati a sufficienza da quella parte di e, s'intersecheranno in qualche punto (vedi fig. 2.8a). Una forma equivalente di questo postulato (chiamato talvolta assioma di Playfair) asserisce che, per qualunque retta e per qualunque punto esterno a essa, vi è un'unica retta passante per quel punto e parallela alla prima retta (vedi fig. 2.8b ). Rette «parallele» sono qui due rette nello stesso piano che non s'intersecano (si ricordi che le mie «rette» sono entità indefinitamente estese e non i «segmenti di retta» di Euclide)F 1l [2.1] Dimostra che se vale la forma d'Euclide del postulato della parallela, allora la conclusione di Playfair dell'unicità delle parallele ne deve essere una conseguenza.
29
LA STRADA CHE PORTA ALLA REALTÀ
e
a
b
--
-
:::::==-=
(a)
-
p
angoli retti a e b si incontrano
~
L'unica parallela adaperP
a
-
-
-
(b)
Fig. 2.8 - (a) Il postulato della parallela d'Euclide. Le rette a e b sono trasversali a una terza retta e, in modo che la somma degli angoli interni nei punti d'intersezione sia minore di due angoli retti. Allora a e b (supposte abbastanza estese) si intersecheranno. (b) I.; equivalente assioma di Playfair: se a è una retta in un piano e P un punto non giacente su di essa, allora vi è soltanto una retta parallela ad a passante per P.
Una volta che abbiamo il postulato della parallela, possiamo procedere a provare la proprietà richiesta per l'esistenza di un quadrato. Se una trasversale a una coppia di rette le incontra in modo che la somma degli angoli interni da un lato della trasversale sia due angoli retti, allora si può dimostrare che le rette di quella coppia sono davvero parallele. Inoltre, ne consegue immediatamente che qualsiasi altra trasversale della coppia gode della stessa proprietà angolare. Questo è fondamentalmente ciò che ci occorreva per l'argomento sopra enunciato per la costruzione del nostro quadrato. Vediamo infatti che è proprio il postulato della parallela che dobbiamo impiegare per dimostrare che la nostra costruzione fornisce effettivamente un quadrato, con tutti gli angoli che sono angoli retti e tutti i lati uguali tra loro. Senza il postulato della parallela, non possiamo provare che esistano realmente quadrati (intesi comunemente con tutti gli angoli retti). Preoccuparsi di quali precise assunzioni siano necessarie per fornire una «dimostrazione rigorosa» dell'esistenza di una cosa così ovvia come un quadrato può sembrare soltanto una questione di pedanteria matematica. Dovremmo realmente interessarci di queste pedanti questioni, quando un «quadrato» è proprio quella figura familiare di cui conosciamo tutto? Ebbene, tra poco vedremo che Euclide mostrò effettivamente una straordinaria perspicacia a tale proposito. La pedanteria di Euclide è collegata a un profondo problema che ha moltissimo da dire sull'effettiva geometria del1'universo, e in più di un modo. In particolare, non è assolutamente una questione ovvia quella che si interroga sull'esistenza di «quadrati» fisici su sca30
Un antico teorema e una questione moderna
la cosmologica nell'universo reale. Questa è materia per l'osservazione, ma al momento le prove sono in conflitto (vedi §2.7 e §28.10).
2.3 Dimostrazione del teorema di Pitagora per mezzo della similitudine di aree Nella prossima sezione ritornerò sul significato matematico di non presumere il postulato della parallela. Le pertinenti questioni fisiche saranno riprese in esame in§ 18.4, §27.11, §28.10 e §34.4. Ma prima di discutere questi problemi, è necessario passare all'altra dimostrazione del teorema di Pitagora che ho promesso in precedenza. Considerare la configurazione di un triangolo rettangolo suddiviso in due triangoli più piccoli, per mezzo della perpendicolare all'ipotenusa dal vertice dell'angolo retto (fig. 2.9), è uno dei modi più semplici per verificare la validità dell'asserzione di Pitagora nella geometria euclidea. Vi sono ora tre triangoli: quello originario e i due in cui è stato adesso suddiviso. Evidentemente l'area del triangolo originario è la somma delle aree dei due triangoli più piccoli. È ora semplice vedere che questi tre triangoli sono tutti simili tra loro. Ciò significa che hanno tutti la stessa forma (anche se dimensioni diverse), cioè sono ottenuti l'uno dall'altro mediante un'uniforme espansione o contrazione, assieme a un movimento rigido. Ciò deriva dal fatto che ciascuno dei tre triangoli ha esattamente gli stessi angoli anche se in un ordine diverso. Ciascuno dei due triangoli più piccoli ha un angolo in comune con quello più grande e uno degli angoli di ciascun triangolo è un angolo retto. Anche il terzo angolo deve quindi essere uguale, perché la somma degli angoli di qualsiasi triangolo è sempre la stessa. Ora, una proprietà generale delle figure piane simili è che le loro aree sono in proporzione ai quadrati delle loro corrispondenti dimensioni lineari. In questo caso, possiamo assumere che questa dimensione lineare sia il lato maggiore del triangolo, cioè l'ipotenusa. Notiamo che l'ipotenuFig. 2.9 - Dimostrazione del teorema di Pitagora con l'impiego di triangoli simili. Prendiamo un triangolo rettangolo e tracciamo la perpendicolare all'ipotenusa passante per il vertice dell'angolo retto. I due triangoli, in cui ora il triangolo originario è suddiviso, hanno aree la cui somma è quella del triangolo iniziale. Tutti e tre i triangoli sono simili, cosicché le loro aree sono proporzionali ai quadrati delle rispettive ipotenuse. Da qui segue il teorema di Pitagora.
31
LA STRADA CHE PORTA ALLA REALTÀ
sa di ciascuno dei triangoli più piccoli coincide con uno dei lati (non l'ipotenusa) del triangolo originario. Ne consegue quindi subito (dal fatto che l'area del triangolo originario è la somma delle aree degli altri due) che il quadrato costruito sull'ipotenusa del triangolo originario è davvero la somma dei quadrati costmiti sugli altri due lati: il teorema di Pitagora! Vi sono ancora in questa dimostrazione alcune assunzioni particolari che dovremo esaminare. Un ingrediente importante del ragionamento è che gli angoli di un triangolo hanno sempre la stessa somma. (Il valore di questa somma è naturalmente 180°, ma Euclide avrebbe detto «due angoli retti». La più «naturale» descrizione matematica moderna è quella di affermare che gli angoli di un triangolo, nella geometria d'Euclide, hanno per somma n. Ciò . significa usare i radianti per la misura assoluta degli angoli, dove il segno di grado « 0 » vale come n/180, così che possiamo scrivere 180° = n.) La comune dimostrazione è raffigurata nella fig. 2.1 O. Estendiamo CA a E e tracciamo una retta AD per A, che sia parallela a CB. Allora (come segue dal postulato della parallela) gli angoli EAD e ACB sono uguali, come pure gli angoli DAB e CBA. Poiché gli angoli EAD, DAB e BAC hanno per somma 1t (o 180°, o due angoli retti), la stessa cosa deve avvenire per i tre angoli ACB, CBA e BAC del triangolo - come si doveva dimostrare. Si noti però che qui è impiegato il postulato della parallela. Questa dimostrazione del teorema di Pitagora si basa anche sul fatto che le aree di figure simili sono in proporzione ai quadrati di qualsiasi misura lineare delle loro grandezze. (In questo caso, per rappresentare questa misura lineare scegliamo l'ipotenusa di ciascun triangolo.) Questo fatto non dipende solo dall'esistenza stessa di figure simili con diverse grandezze - che, per i triangoli della fig. 2.9, abbiamo stabilito con l'impiego del postulato della parallela - ma anche da alcune questioni più complicate che si riferiscono a come effettivamente definire un' «area» per forme non rettangolari. Questi problemi generali sono affrontati in termini di procedimenti di limite e perciò in questo momento non desidero entrare in questo genere di discussione,
B
D
e 32
E
Fig. 2.10 - Dimostrazione che la somma degli angoli di un triangolo ABC è uguale a Jt (=180° = due angoli retti). Estendiamo CA fino a E; tracciamo la parallela AD a CB. Dal postulato della parallela segue che gli angoli EAD e ACB sono eguali, così come sono eguali gli angoli DAB e CBA. Poiché la somma degli angoli EAD, DAB e BAC è it, la stessa cosa avviene per gli angoli ACB, CBA e BAC.
Un antico teorema e una questione moderna
che ci avvicinerebbe ad alcune questioni più profonde relative al tipo di numeri che sono impiegati in geometria. Ritorneremo sull'argomento nei §§3.1-3. Un risultato importante delle discussioni affrontate nelle sezioni precedenti è che il teorema di Pitagora sembra dipendere dal postulato della parallela. È realmente così? Supponiamo che il postulato della parallela sia falso? Ciò significa che il teorema di Pitagora è esso stesso effettivamente falso? Una simile possibilità ha qualche senso? Tentiamo di affrontare ciò che avverrebbe se il postulato della parallela potesse davvero essere ritenuto falso. Sembrerebbe di entrare in un presunto mondo misterioso, dove la geometria che abbiamo imparato a scuola è tutta messa sottosopra. Tuttavia, troveremo che in questo ambito vi è anche un'intenzione più profonda.
2.4 Geometria iperbolica: quadro conforme Date un'occhiata al quadro nella fig. 2.11. È una riproduzione di una delle xilografie di M. C. Escher, chiamata Cerchio limite I. Essa ci offre effettivamente una rappresentazione molto accurata di un genere di geometria - la cosiddetta geometria iperbolica (o anche geometria di Lobacevskij) - in cui il postulato della parallela è falso, il teorema di Pitagora non vale e la somma degli angoli di un triangolo non è n. Inoltre, per una forma di una data dimensione non esiste, in generale, una forma simile di dimensione maggiore. Nella fig. 2.11 Escher ha usato una particolare rappresentazione di geometria iperbolica in cui l'intero «universo» del piano iperbolico è «compresso» nell'interno di un cerchio in un comune piano euclideo. La circonferenza di questo cerchio rappresenta l'infinito per questo universo iperbolico. Possiamo vedere che nel quadro di Escher i pesci sembrano accalcarsi quando si avvicinano a questa circonferenza. Ma dobbiamo pensare che questa è un'illusione. Immaginate di essere uno dei pesci. Allora sia che siate situati vicini al bordo dell'immagine di Escher o vicini al suo centro, l'intero universo (iperbolico) vi apparirà il medesimo. La nozione di «distanza» in questa geometria non si accorda con quella del piano euclideo su cui questo universo è stato rappresentato. Quando osserviamo il quadro di Escher dalla nostra prospettiva euclidea, i pesci vicini alla circonferenza ci sembrano diventare minuscoli. Ma dal punto di vista «iperbolico», essi pensano di avere la stessa forma e grandezza di quelli vicini al centro. Inoltre, anche se dalla nostra prospettiva euclidea sembra che essi si avvicinino sempre di più alla circonferenza limitante, dal loro punto di vista iperbolico quella frontiera rimane sempre infinitamente distante. Né la circonferenza limitante né qualunque parte dello spazio «euclideo» all'esterno di essa esiste per loro. Il loro intero universo consiste in ciò che a noi sembra trovarsi all'interno del cerchio. 33
LA STRADA CHE PORTA ALLA REALTÀ
Fig. 2.11 - La xilografia Cerchio Limite l di M. C. Escher, che illustra la rappresentazione conforme del piano iperbolico.
Com'è costruito, in termini più matematici, questo quadro della geometria iperbolica? Pensiamo a un cerchio qualsiasi in un piano euclideo. I.;insieme di punti giacenti all'interno del cerchio deve rappresentare l'insieme di punti dell'intero piano iperbolico. Le linee rette, secondo la geometria iperbolica, devono essere rappresentate come segmenti di circonferenze euclidee che incontrano la circonferenza limitante ortogonalmente - che significa ad angolo retto. Avviene, adesso, che la nozione iperbolica di un angolo tra due curve qualsiasi, nel loro punto d'intersezione, è esattamente la stessa della misura euclidea d'angolo tra due curve al punto d'intersezione. Una rappresentazione di questo tipo è chiamata conforme. Per questo motivo, la particolare rappresentazione della geometria iperbolica usata da Escher è chiamata talvolta il modello conforme del piano iperbolico. (Spesso viene anche chiamata il disco di Poincaré. La dubbiosa giustificazione storica di questa terminologia sarà discussa in §2.6.) Siamo ora in grado di vedere se gli angoli di un triangolo, nella geometria iperbolica, hanno per somma n oppure no. Un rapido sguardo alla fig. 2.12 ci spinge verso la seconda ipotesi, cioè che la loro somma sia più piccola. In effetti, la somma degli angoli di un triangolo nella geometria iperbolica è sempre inferiore a n. Potremmo ritenere che questa sia una spiacevole caratteristica della geometria iperbolica, poiché non otteniamo una risposta «netta» per la somma degli angoli di un triangolo. Tuttavia vi è davvero qualco34
Un antico teorema e una questione moderna
Fig. 2.12 - Il medesimo quadro di Escher, dove vengono però rappresentate linee rette iperboliche (circonferenze euclidee o linee che incontrano ortogonalmente il cerchio limitante) così come un triangolo iperbolico. Gli angoli iperbolici sono eguali a quelli euclidei. Il postulato della parallela è chiaramente violato e la somma degli angoli di un triangolo iperbolico è minore di Tt.
sa di particolarmente elegante e notevole in ciò che avviene quando sommiamo gli angoli di un triangolo iperbolico: il valore che si ottiene sottraendo tale somma a re è sempre proporzionale all'area del triangolo. Più esplicitamente, se i tre angoli del triangolo sono a, /3 e y, allora abbiamo la formula (dovuta a Johann Heinrich Lambert, 1728-1777)
rc-(a+f]+y)=C.d dove L1 è l'area del triangolo e C è una costante. Questa costante dipende dalle «unità» che sono scelte per misurare lunghezze e aree. Possiamo sempre aggiustare proporzionalmente i valori in modo che C = 1. È davvero un fatto notevole che l'area di un triangolo, nella geometria iperbolica, possa essere espressa in modo così semplice. Nella geometria euclidea, non vi è alcun modo di esprimere l'area di un triangolo semplicemente in termini dei suoi angoli, e l'espressione dell'area di un triangolo in termini delle lunghezze dei suoi lati è notevolmente più complicata. 35
LA STRADA CHE PORTA ALLA REALTÀ
In effetti, non ho ancora del tutto terminato la mia descrizione della geometria iperbolica in termini di questa rappresentazione conforme, poiché non ho ancora descritto come debba essere definita la distanza iperbolica tra due punti (e sembrerebbe appropriato sapere che cosa sia la «distanza» prima di potere realmente parlare di area). Lasciate che vi dia un'espressione per la distanza iperbolica tra due punti A e B all'interno del cerchio. Questa è l
QA·PB ogQB·PA
in cui P e Q sono i punti dove la circonferenza euclidea (cioè la retta iperbolica) per A e B ortogonale alla circonferenza limitante incontra questa circonferenza e in cui «QA», «PB», eccetera, sono le distanze euclidee (vedi fig. 2.13 ). Se desiderate includere la C della formula di Lambert dell'area (con C -:t I), moltiplicate l'espressione di prima per c- I12 (il reciproco della radice quadrata di C). 4 (2 -21Per motivi che spero diventeranno più chiari in seguito chiamerò la quantità c- I12 lo pseudoraggio della geometria. Se espressioni matematiche come la formula «log» di prima sembrano scoraggianti, non preoccupatevi. Le fornisco solo per quelli che amano vedere esplicitamente le cose. In qualsiasi caso, non spiegherò perché questa espressione funziona (in altre parole, perché la minima distanza iperbolica tra due punti, definita in questo modo, è effettivamente misurata lungo una retta iperbolica, o perché le distanze lungo una retta iperbolica «si addizionano» in modo appropriato )_[2- 31 Chiedo anche scusa per il «log» (logaritmo), ma questo è il modo in cui stanno le cose. In effetti, questo è un logaritmo
Fig. 2.13 - La distanza iperbolica tra A e B
è, nella rappresentazione conforme, log {QA • PB/QB • PA} dove QA, eccetera sono distanze euclidee e P e Q sono le intersezioni della circonferenza euclidea, passante per A e B e ortogonale alla circonferenza limite, con questa circonferenza. [2.2] Ne comprendi il motivo? [2.3] Prova a dimostrare che, secondo questa formula, se A, B e C sono tre punti successivi su una retta iperbolica, allora le distanze iperboliche «AB», eccetera soddisfano la relazione «AB»+ «BC» = «AC». Puoi assumere la proprietà generale dei logaritmi, log (ab)= log a + log b, che sarà descritta in §5.2 e §5.3. 36
Un antico teorema e una questione moderna
t
naturale («logaritmo in base e») e ne dovrò parlare a lungo nei §§5.2,3. Scopriremo che i logaritmi sono realmente entità magnifiche e misteriose (così come il numero e), oltre a essere importanti in molte situazioni differenti. Risulta pertanto che la geometria iperbolica, con questa definizione di distanza, possiede tutte le proprietà della geometria euclidea tranne quelle che richiedono il postulato della parallela. Possiamo costruire triangoli, e altre figure piane, di differenti forme e grandezze, e possiamo spostarle «rigidamente» (mantenendo le loro forme e grandezze iperboliche) con la stessa libertà con cui possiamo farlo nella geometria euclidea. In questo modo nasce una nozione naturale di forme «congruenti», proprio come nella geometria euclidea (dove «congruente» significa «che una forma può essere spostata rigidamente fino a coincidere con l'altra»). Tutti i pesci bianchi nella xilografia di Escher sono davvero congruenti tra loro, secondo questa geometria iperbolica, e la stessa cosa è vera per tutti i pesci neri.
2.5 Altre rappresentazioni della geometria iperbolica Naturalmente non tutti i pesci bianchi sembrano avere la stessa forma e grandezza, ma questo è dovuto al fatto che li osserviamo da un punto di vista euclideo e non da uno iperbolico. Il quadro di Escher fa semplicemente uso di una particolare rappresentazione euclidea della geometria iperbolica. La geometria iperbolica in sé e per sé è un qualcosa di più astratto che non dipende da qualunque rappresentazione euclidea. Queste rappresentazioni ci sono però molto utili, perché offrono un modo di visualizzare la geometria iperbolica riportandola a qualcosa che ci è più familiare e apparentemente più «concreto», e precisamente la geometria euclidea. Simili rappresentazioni, inoltre, rendono manifesto che la geometria iperbolica è una struttura coerente e che, di conseguenza, il postulato della parallela non può essere derivato dalle altre leggi della geometria euclidea. Vi sono certamente altre rappresentazioni della geometria iperbolica espresse in termini di geometria euclidea che sono diverse da quella confonne impiegata da Escher. Una di queste è quella nota come il modello proiettivo. In questo modello l'intero piano iperbolico è ancora raffigurato come l'interno di un cerchio in un piano euclideo, ma le rette iperboliche sono ora rappresentate da rette euclidee (invece che da archi di circonferenza). Tuttavia si deve pagare un prezzo per quest'apparente semplificazione, perché gli angoli iperbolici non sono ora uguali agli angoli euclidei: molte persone riterrebbero questo prezzo troppo alto. Per i lettori interessati, la distanza iperbolica tra due punti A e B, in questa rappresentazione, è data dall'espressione (vedi fig. 2.14)
1
RA·SB
21ogRB·SA 37
LA STRADA CHE PORTA ALLA REALTÀ
Fig. 2.14 - Nella rappresentazione proiettiva la formula per la distanza iperbolica è _!_log {RA-SB/RB·SA}, dove Re S sono le 2 intersezioni della retta euclidea (cioè iperbolica) AB con la circonferenza limitante.
(prendendo C = 1, questa è quasi la stessa espressione che avevamo prima, nel caso della rappresentazione conforme) dove R e S sono le intersezioni della retta AB con la circonferenza limitante. Questa rappresentazione della geometria iperbolica può essere ottenuta da quella conforme per mezzo di un'espansione radiale dal centro di un ammontare dato da 2R 2
R 2 +r; dove R è il raggio del cerchio limitante e re è la distanza euclidea dal centro del cerchio limitante di un punto nella rappresentazione conforme (vedi fig. 2.15).[ZAJ Nella figura 2.16 ho trasformato il quadro di Escher della fig. 2.11 dalla rappresentazione conforme a quella proiettiva usando questa formula. (Nonostante la perdita di dettagli, l'abilità artistica di Escher appare ancora evidente.) Sebbene si presenti meno attraente in questo modo, la figura offre un nuovo punto di vista! Vi è un modo più direttamente geometrico di collegare la rappresentazione, conforme e quella proiettiva, per mezzo di un'altra ingegnosa rappre-
Fig. 2.15 - Per passare dalla rappresentazione conforme a quella proiettiva, espandete dal centro perun fattore 2R 2 /(R 2 + rJ), doveR è il raggio del cerchio limitante e re è la distanza euclidea dal centro del punto nella rappresentazione conforme. [2.4] Dimostralo. (Suggerimento: puoi usare, se vuoi, la geometria di Beltrami illustrata in fig. 2.17.) 38
Un antico teorema e una questione moderna
Fig. 2.16 - Il quadro di Escher di fig. 2.11 trasformato dalla rappresentazione conforme a quella proiettiva.
sentazione di questa stessa geometria. Tutte e tre queste rappresentazioni sono dovute al geniale geometra italiano Eugenio Beltrami (1835-1900). Consideriamo una sfera S, il cui equatore coincide con la circonferenza limitan; te dell'una o dell'altra delle due rappresentazioni della geometria iperbolica date in precedenza. Troveremo ora una rappresentazione della geometria iperbolica sulla semisfèra nord s+ di S, che chiamerò la rappresentazione semisferica (vedi fig. 2.17). Per passare dalla rappresentazione proiettiva nel piano (considerato orizzontale) alla nuova sulla sfera, proiettiamo semplicemente in verticqle verso l'alto (fig. 2.17a). Le rette nel piano, che rappresentano rette iperboliche, sono rappresentate su s+ da semicirconferenze che incontrano l'equatore ortogonalmente. Per ottenere ora dalla rappresentazione su s+ la rappresentazione conforme sul piano, proiettiamo dal polo sud (vedi fig. 2.17b). Ciò prende il nome di proiezione stereografica e svolgerà un ruolo importante nelle pagine successive di questo libro (vedi §8.3, § 18.4, §22.9, §33.6). La proiezione stereografica, come vedremo in §8.3, possiede due importanti proprietà: è conforme, quindi preserva gli angoli, e invia cerchi sulla sfera su cerchi (o, eccezionalmente, su rette) sul pianoP. 5U2-6l [2.5] Assumendo queste esposte proprietà della proiezione stereografica e della rappresentazione conforme della geometria iperbolica, dimostra che la rappresentazione semisferica di Beltrami ha le proprietà enunciate nel testo. [2.6] Sapresti dimostrare queste proprietà? (Suggerimento: dimostra, nel caso di circonferenze, che il cono di proiezione è intersecato da due piani d'inclinazione esattamente opposta.) 39
LA STRADA CHE PORTA ALLA REALTÀ
Fig. 2.17 - La geometria di Beltrami che collega tre delle sue rappresentazioni della geometria iperbolica. (a) La rappresentazione semisferica (conforme sulla semisfera nord s+) si proietta verticalmente nella rappresentazione proiettiva sul disco equatoriale. (b) La rappresentazione semisferica si proietta stereograficamente dal polo sud nella rappresentazione conforme sul disco equatoriale.
L'esistenza di differenti modelli, espressi in termini di spazio euclideo, della geometria iperbolica serve a enfatizzare che questi sono proprio soltanto «modelli euclidei» della geometria iperbolica e non si deve ritenere che ci dicano che cosa sia effettivamente la geometria iperbolica. La geometria iperbolica ha la sua «esistenza platonica», proprio come la geometria euclidea (vedi § 1.3 e la Prefazione). Nessun modello deve essere ritenuto la «corretta» raffigurazione della geometria iperbolica, a spese degli altri. Le sue rappresentazioni, da me prese in considerazione, sono molto utili per aiutarci a comprendere, ma solo perché il modello euclideo è quello cui siamo più abituati. Per qualcuno educato a un'esperienza diretta con la geometria iperbolica, invece che con quella euclidea, un modello di geo40
Un antico teorema e una questione moderna
metria euclidea in termini di quella iperbolica potrebbe sembrare molto più naturale! In §18.4 incontreremo di nuovo un altro modello della geometria iperbolica, questa volta in termini della geometria di Minkowski della relatività speciale. Per terminare questa sezione, ritorniamo al problema dell'esistenza di quadrati nella geometria iperbolica. Anche se quadrati i cui angoli siano retti non esistono nella geometria iperbolica, vi sono «quadrati» di tipo più generale, i cui angoli sono minori di un angolo retto. La maniera più facile di costruire un quadrato di questo genere è di tracciare due rette che si intersecano ad angoli retti in un punto O. Il nostro «quadrato» è ora il quadrilatero i cui quattro vertici sono -le intersezioni A, B, C, D (prese in ordine ciclico) di queste due rette con qualche circonferenza di centro O. (Vedi fig. 2.18.) A causa della simmetria della figura, i quattro lati del quadrilatero risultante ABCD sono tutti uguali e anche i suoi quattro angoli devono essere uguali. Ma questi angoli sono angoli retti? Non nella geometria iperbolica. In effetti, possono essere qualunque angolo (positivo), a nostro piacere, minore di un angolo retto, ma non un angolo retto. Più è grande il quadrato iperbolico (vale a dire, più è grande la circonferenza di prima), più piccoli saranno i suoi angoli. Nella fig. 2.19a ho tracciato un reticolo di quadrati iperbolici, usando il modello conforme, dove vi sono cinque quadrati a ciascun vertice o 72°. (invece dei quattro della geometria euclidea), cosicché l'angolo è Nella fig. 2.19b ho tracciato il medesimo reticolo usando il modello proiettivo. Si vedrà che questo non permette le modifiche che sarebbero necessarie per il reticolo a due quadrati della fig. 2.2Y• 7l
¾n,
B
e
A
D
Fig. 2.18 - Un «quadrato» iperbolico è un quadrilatero iperbolico i cui vertici sono le intersezioni A, B, C, D (prese in ordine ciclico) di due rette iperboliche perpendicolari per un qualche punto O con un qualche cerchio con centro in O. A causa della simmetria, i quattro lati di ABCD sono eguali, così come i quattro angoli. Questi angoli non sono retti, ma possono essere eguali a qualunque dato angolo positivo minore di ¾n.
[2.7] Vedi se sei capace di fare qualcosa di simile, ma con pentagoni regolari e quadrati iperbolici. 41
LA STRADA CHE PORTA ALLA REALTÀ
Fig. 2.19 - Un reticolo di quadrati, nello spazio iperbolico, in cui cinque quadrati s'incontrano in ciascun vertice, così che gli angoli del quadrato sono Zn, o 72°. (a) Rap5 presentazione conforme. (b) Rappresentazione proiettiva.
2.6 Aspetti storici della geometria iperbolica Sono ora opportuni alcuni commenti storici sulla scoperta della geometria iperbolica. Per secoli, dopo la pubblicazione degli elementi di Euclide, verso il 300 a.e., diversi matematici tentarono di derivare il quinto postulato dagli assiomi e dagli altri postulati. Questi sforzi raggiunsero il culmine con l'eroico lavoro del gesuita Girolamo Saccheri nel 1733. Pare che Saccheri stesso avesse ritenuto fallimentare il suo lavoro di una vita: non era infatti riuscito a dimostrare il postulato della parallela, poiché l'ipotesi che la somma degli angoli di un qualsiasi triangolo sia minore di due angoli retti conduceva a una contraddizione. Incapace di farlo logicamente dopo numerosi e vani tentativi, concluse piuttosto debolmente in questo modo: !;ipotesi d'angolo acuto è assolutamente falsa; essa ripugna alla natura della linea retta. 5
L'ipotesi di «angolo acuto» asserisce che le rette a e b di fig. 2.8 qualche volta non si incontrano. Questo è di fatto possibile e produce la geometria iperbolica! In quale modo Saccheri ha effettivamente scoperto qualcosa che stava tentando di mostrare impossibile? La proposta di Saccheri per dimostrare il quinto postulato di Euclide fu di formulare l'ipotesi che il quinto postulato fosse falso e poi derivare una contraddizione da questa ipotesi. Propose quindi di impiegare uno dei principi più utili e consacrati dal tempo che sia mai stato avanzato in matematica- molto probabilmente introdotto per la prima volta dai pitagorici - chiamato dimostrazione per assurdo (o reductio ad absurdum, in la42
Un antico teorema e una questione moderna
tino). Secondo questo procedimento, per dimostrare che qualche asserzione è vera si suppone dapprima che questa asserzione sia falsa e poi si fa vedere che da ciò consegue qualche contraddizione. E quindi, trovando una simile contraddizione, si deduce che, dopo tutto, l'asserzione deve essere vera. 6 La dimostrazione per assurdo fornisce un metodo di ragionamento molto efficace in matematica ed è frequentemente applicato oggigiorno. A questo punto è appropriata una citazione dall'illustre matematico G. H. Hardy: La reductio ad absurdum che Euclide amava così tanto è una delle migliori armi di un matematico. È una mossa decisamente migliore di qualunque mossa scacchistica: un giocatore di scacchi può offrire il sacrificio di un pedone o persino di un pezzo, ma un matematico offre il gioco. 7
Vedremo più avanti (§3.le §§ 16.4,6) altre applicazioni di questo importante principio. Tuttavia Saccheri fallì nel suo tentativo di trovare una contraddizione e non fu quindi in grado di ottenere una dimostrazione del quinto postulato. Ma trovò in effetti qualcosa di più grande: una nuova geometria, differente da quella di Euclide, ossia la geometria discussa nei §§2.4,5, che ora chiamiamo geometria iperbolica. Dall'ipotesi che il quinto postulato fosse falso, egli ottenne, invece di una vera contraddizione, una grande quantità di strani, appena credibili, ma interessanti teoremi. Per quanto strani apparissero questi risultati, nessuno di essi era però effettivamente una contraddizione. Come ora sappiamo, non vi era alcuna possibilità che Saccheri trovasse, in questo modo, un'autentica contraddizione nel senso matematico di una simile struttura coerente, in quanto la geometria iperbolica esiste realmente. Nella terminologia di § 1.3 la geometria iperbolica risiede nel mondo platonico delle forme matematiche. (La questione della realtà fisica della geometria iperbolica sarà trattata in §2.7 e §28.10.) Poco dopo Saccheri, anche Johann Heinrich Lambert (1728-1777), matematico dotato di grande intuito, derivò numerosi e affascinanti risultati geometrici dall'ipotesi che il quinto postulato di Euclide fosse falso, ivi incluso il magnifico risultato menzionato in §2.4 che dà l'area di un triangolo iperbolico in termini della somma dei suoi angoli. Probabilmente Lambert si convinse, almeno in qualche fase della sua vita, che si potesse ottenere una geometria coerente dalla negazione del quinto postulato di Euclide. Sembra che alla base della sua esitazione vi sia stata la possibilità teorica della geometria su una «sfera di raggio immaginario», cioè per la quale il «quadrato del raggio» della sfera è negativo. La formula di Lambert 7t - (a+ f3 + '}1 = C1 dà l'area, L1, di un triangolo iperbolico, dove a, f3 e ysono gli angoli del triangolo e dove C è una costante positiva ( - C è ciò che ora chiameremmo la «curvatura gaussiana» del piano iperbolico). Questa formula appare fondamentalmente eguale a una già precedentemente nota, 43
LA STRADA CHE PORTA ALLA REALTÀ
dovuta a Thomas Hariot (1560-1621), .d = R2(a + f3 + y- n), che dà l'area .d di un triangolo sferico, formato da archi di cerchio massimo 8 su una sfera di raggio R (vedi fig. 2.20)P• 8l Per ritrovare la formula di Lambert dobbiamo porre
Ma per avere il valore positivo di C, che è richiesto dalla geometria iperbolica, occorre che il raggio della sfera sia «immaginario» (sia cioè la radice quadrata di un numero negativo). Si noti che il raggio R è dato dalla quantità immaginaria (- q- 112 • Questo spiega il termine «pseudoraggio», introdotto in §2.4, per la quantità reale C- 112 • In effetti, il procedimento di Lambert è pe1fettamente giustificato secondo i nostri punti di vista più moderni (vedi capitolo 4 e § 18.4) e il fatto che egli lo abbia previsto è un segno del suo grande intuito. Tuttavia, è opinione comune (ma alquanto ingiusta a mio parere) quella di negare a Lambert l'onore di essere stato il primo a costruire una geometria non euclidea e di ritenere che (circa mezzo secolo dopo) la prima persona ad arrivare a un'assoluta accettazione dell'esistenza di una geometria completamente coerente - ma distinta da quella di Euclide, in cui il postulato della parallela è falso - sia stato il grande matematico Carl Friedrich Gauss. Il quale, essendo un uomo eccezionalmente cauto e timoroso delle controversie che una simile rivelazione avrebbe potuto causare, non pubblicò le sue scoperte e le tenne per sé. 9 Circa trent'anni dopo che Gauss aveva iniziato a
Fig. 2.20 - La formula di Hariot per l'area di un triangolo J:ferico, con angoli a, /3, y, è l\ = R2( a+ f3 + y- n). La formula di Lambert per un triangolo iperbolico ha C = l/R 2 • (2.8] Tenta di dimostrare questa formula, impiegando fondamentalmente solo argomenti di simmetria e il fatto che l'area di una sfera è 41tR2 • Suggerimento: comincia col trovare l'area di una porzione sferica limitata da due cerchi massimi che connettono una coppia di punti agli antipodi sulla sfera; poi taglia e incolla e impiega argomenti di simmetria. Tieni a mente la fig. 2.20.
44
Un antico teorema e una questione moderna
lavorarci, la geometria iperbolica fu riscoperta indipendentemente da alcuni altri studiosi, tra cui I 'ungherese Janos Bolyai (dal 1829), ma in particolare il russo Nikolai Ivanovich Lobachevsky attorno al 1826 (per questo motivo la geometria iperbolica viene spesso indicata come geometria di Lobachevsky). Le specifiche realizzazioni, proiettiva e conforme, della geometria iperbolica che ho descritto in precedenza furono entrambe trovate da Eugenio Beltrami, che le pubblicò nel 1868 insieme ad altre eleganti rappresentazioni, tra cui quella emisferica menzionata in §2.5. La rappresentazione conforme è, tuttavia, comunemente chiamata «modello di Poincaré», poiché lariscoperta da parte di Poincaré di questa rappresentazione, nel 1882, è meglio conosciuta del lavoro originario di Beltrami (in gran parte per l'importante uso che Poincaré fece di questo modello). 10 Allo stesso modo, la rappresentazione proiettiva del povero vecchio Beltrami è qualche volta chiamata «rappresentazione di Klein». Non è insolito che in matematica il nome normalmente collegato a un concetto matematico non sia quello dell'iniziale scopritore. Ma in questo caso Poincaré riscoprì perlomeno la rappresentazione conforme (come fece Klein per quella proiettiva nel 1871 ). Vi sono altri esempi, in matematica, dove il matematico il cui nome è collegato a un certo risultato non conosceva neppure il risultato in questione! 11 La rappresentazione della geometria iperbolica per cui Beltrami è maggiormente noto è ancora un'altra, che lui trovò sempre nel 1868. Questa rappresenta la geometria su una certa superficie nota come pseudosfera (vedi fig. 2.21 ). Tale superficie è ottenuta dalla rotazione di una curva conosciuta come trattrice, investigata per la prima volta da lsaac Newton nel 1676, attorno al suo «asintoto». Vasintoto è una linea retta a cui la curva si avvicina, diventando asintoticamente tangente a essa quando la curva si allontana all'infinito. Qui dobbiamo immaginare che l'asintoto sia tracciato su un piano orizzontale scabro. Immaginiamo adesso una barra leggera, dritta e rigida, alla cui estremità P è attaccato un peso puntiforme, mentre l'altra sua estremità R si muove lungo l'asjntoto. Il punto P traccia allora una trattrice. Fer-
R (a)
Asintoto
(b)
Fig. 2.21 - (a) Una pseudosfera. Questa è ottenuta ruotando una trattrice attorno al suo asintoto. (b) Per costruire una trattrice, immaginiamo che su un piano orizzontale sia trascinata una barra leggera, dritta e rigida. Un'estremità della barra è un peso puntiforme P e l'altra estremità si muove lungo l'asintoto (una retta).
45
LA STRADA CHE PORTA ALLA REALTÀ
dinand Minding scoprì nel 1839 che la pseudosfera ha una geometria intrinseca a costante negativa e Beltrami impiegò questa scoperta per costruire il primo modello di geometria iperbolica. Sembra che sia stato il modello della pseudosfera di Beltrami ad aver convinto i matematici della coerenza della geometria iperbolica piana, poiché la misura della distanza iperbolica coincide con la distanza euclidea lungo quella superficie. Questo è, tuttavia, un modello poco maneggevole, perché rappresenta la geometria iperbolica solo localmente, invece di presentare simultaneamente l'intera geometria, come fanno gli altri modelli di Beltrami.
2. 7 Relazione con lo spazio fisico La geometria iperbolica funziona perfettamente anche in spazi con un numero più alto di dimensioni. Inoltre vi sono versioni a un numero maggiore di dimensioni di entrambi i modelli, conforme e proiettivo. Nel caso della geometria iperbolica tridimensionale, invece di una circonferenza limitante, abbiamo una sfera limitante. I..:intera infinita geometria iperbolica tridimensionale è rappresentata dall'interno di questa sfera euclidea finita. Il resto è fondamentalmente come prima. Nel modello conforme, le linee rette in questa geometria iperbolica tridimensionale sono rappresentate da cerchi euclidei che incontrano ortogonalmente la sfera limitante; gli angoli sono dati dalle misure euclidee e le distanze sono date dalla stessa formula del caso bidimensionale. Nel modello proiettivo, le linee rette iperboliche sono rette euclidee e le distanze sono ancora date dalla stessa fonnula del caso bidimensionale. Che cosa si può dire del nostro reale universo su scale cosmologiche? Ci aspettiamo che la sua geometria spaziale sia euclidea, o potrebbe essere che si accordi più rigorosamente con qualche altra geometria, come la notevole geometria iperbolica (ma in tre dimensioni) che abbiamo esaminato in §§2.4-6? Questo è davvero un quesito interessante. Sappiamo dalla relatività generale di Einstein (di cui tratteremo in§ 17.9 e in§ 19.6) che la geometria euclidea è soltanto un'approssimazione (straordinariamente accurata) alla reale geomeh-ia dello spazio fisico. Questa geometria non è neppure esattamente uniforme, avendo piccole increspature a causa della presenza della materia. Tuttavia, secondo i migliori dati osservazionali oggi disponibili ai cosmologi, sembra che queste increspature si medino, in modo notevolmente preciso, su scale cosmologiche (vedi §27.13 e §§28.4-10), e che la geometria spaziale dell'universo reale si accordi, in modo molto stretto, con una geometria uniforme (omogenea e isotropa). Sembrerebbe che almeno i primi quattro postulati d'Euclide abbiano resistito notevolmente alla prova del tempo. A questo punto è necessario un commento chiarificatore. Vi sono, fondamentalmente, tre tipi di geometria che soddisferebbero le condizioni di omogeneità e isotropia: la geometria euclidea, quella iperbolica e quella ellittica. 46
Un antico teorema e 11na q11estione moderna
La geometria euclidea ci è familiare (e lo è stata per circa ventitré secoli). La geometria iperbolica è stata al centro di questo capitolo. E la geometria ellittica? Di cosa si tratta? Sostanzialmente la geometria ellittica piana è quella soddisfatta dalle figure tracciate sulla superficie di una sfera ed è comparsa nella discussione dell'approccio di Lambert alla geometria iperbolica,
(a)
(b)
Fig. 2.22 - Le tre specie fondamentali di geometria piana unifo1me, come vengono illustrate da Escher con l'impiego di tassellature con angeli e diavoli. (a) Il caso ellittico (curvatura positiva), (b) il caso euclideo (curvatura nulla) e (c) il caso iperbolico (curvatura negativa)-nella rappresentazione conforme ( Cerchio limite IV di Escher, da paragonare con fig. 2.17).
47
LA STRADA CHE PORTA ALLA REALTA
in §2.6. Si vedano le figure 2.22a, b, c in cui per la rappresentazione di Escher dei casi ellittico, euclideo e iperbolico rispettivamente, è stata usata un'analoga tassellatura di angeli e diavoli in tutti e tre i casi; il terzo fornisce un'interessante alternativa alla fig. 2.11. (Vi è anche una versione tridimensionale della geometria ellittica e vi sono anche versioni in cui punti diametralmente opposti sulla sfera sono considerati rappresentare il medesimo punto. Tali questioni saranno discusse un po' più dettagliatamente in §27.11.) Si potrebbe tuttavia affermare che il caso ellittico violi il secondo e il terzo postulato d'Euclide (come pure il primo). Infatti, è una geometria che ha una misura finita (e nella quale una coppia di punti è congiunta da più di un segmento di retta). Qual è, allora, lo stato delle osservazioni sulla geometria spaziale, su grande scala, dell'universo? È giusto soltanto affermare che non la conosciamo ancora, sebbene recentemente sia stato affermato, e notevolmente pubblicizzato, che Euclide aveva completamente ragione e che anche il suo quinto postulato è vero, così che la geometria spaziale mediata è proprio quella che chiamiamo «euclidea». 12 D'altra parte, vi sono anche prove (alcune provenienti dagli stessi espelimenti) che sembrano indicare fermamente una geometria globale iperbolica per l'universo spaziale. 13 Inoltre, alcuni teorici hanno sostenuto a lungo il caso ellittico e questo non è certamente escluso dalle stesse prove che si ritiene siano di supporto al caso euclideo (vedi alla fine di §34.4). Come il lettore avrà occasione di vedere, la questione è ancora piena di controversie e, come ci si potrebbe aspettare, oggetto di accese discussioni. In alcuni capitoli di questo libro cercherò di presentare molte delle considerazioni che sono state avanzate su ciò ( e non cercherò di nascondere il mio pregiudizio a favore del caso iperbolico, pur tentando di essere il più possibile equilibrato nei riguardi degli altri). Fortunatamente per quelli che come me sono attratti dalla bellezza della geometria iperbolica e anche dalla maestosità della fisica moderna, vi è un altro ruolo per questa superba geometria che è indiscutibilmente fondamentale per la nostra attuale comprensione dell'universo fisico. Infatti secondo la moderna teoria della relatività, lo spazio delle velocità è certamente una geometria iperbolica tridimensionale (vedi §18.4), piuttosto che quella euclidea che varrebbe nella più antica teoria newtoniana. Ciò ci aiuta a comprendere alcuni degli enigmi della relatività. Immaginiamo, per esempio, un proiettile scagliato in avanti, con una velocità prossima a quella della luce, da un veicolo che si muove anch'esso in avanti con velocità comparabile dietro un edificio. Tuttavia, relativamente a quell'edificio, il proiettile non può mai superare la velocità della luce. Ciò sembra impossibile, ma vedremo in § 18.4 che questo fatto trova una diretta spiegazione in termini di geometria iperbolica. Ma queste affascinanti questioni devono attendere i prossimi capitoli. Che cosa dire del teorema di Pitagora, che come abbiamo visto non vale nella geometria iperbolica? Dobbiamo abbandonare il più grande dei doni di 48
Un antico teorema e una questione moderna
Pitagora alla posterità? Niente affatto. La geometria iperbolica- e anche tutte le geometrie «riemanniane» che generalizzano la geometria iperbolica nel caso di spazi a curvatura irregolare (formando lo schema essenziale per la teoria della relatività generale di Einstein; vedi§ 13.8, § 14.7, § 18.1, § 19.6)dipende in modo fondamentale dal fatto che il teorema di Pitagora vale nel limite di piccole distanze. Inoltre, la sua enorme influenza permea altre vaste aree della matematica e della fisica (per esempio, la struttura metrica «unitaria» della meccanica quantistica, vedi §22.3). Nonostante questo teorema sia stato in un certo senso messo da parte per le «grandi» distanze, rimane importante per la struttura della geometria su piccola scala, trovando un campo di applicazione che supera di gran lunga quello per cui era stato originariamente proposto.
Note I.
2.
3. 4.
5. 6.
7. 8.
Non è molto chiaro dal punto di vista storico chi sia stato davvero il primo a dimostrare quello che ora chiamiamo «teorema di Pitagora», vedi nota 1.1. Sembra però che gli antichi Egizi e i Babilonesi avessero già applicato questo teorema. II ruolo svolto da Pitagora e dai suoi seguaci è quindi in larga misura supposto. Tuttavia, persino con tutta questa attenzione, diverse assunzioni nascoste rimasero nel lavoro di Euclide. Esse hanno soprattutto a che vedere con problemi che ora definiremmo «topologici», ma che a Euclide e ai suoi contemporanei sarebbero sembrati «intuitivamente ovvi». Queste tacite assunzioni sono state evidenziate solo molto tempo dopo, in particolare da Hilbert alla fine del diciannovesimo secolo. In seguito le ignorerò. Vedi, per esempio, Thomas (1939). La notazione «esponenziale», come C- 112 , sarà frequentemente impiegata in questo libro. Come già detto nella nota 1.1, a 5 significa a x a x a x a x a; analogamente, per qualsiasi intero positivo n, il prodotto di n fattori a è rappresentato da a". Questa notazione viene estesa anche a esponenti negativi, così che a- 1 è il reciproco 1/a di a e a- 11 è il reciproco 1/a" di a" che si può anche scrivere (a- 1)". In accordo con la discussione più generale di §5 .2, a 11", per un numero positivo a, è la «radice ennesima di a», che è il numero (positivo) soddisfacente la relazione (a 11")" = a (vedi nota 1.1). Inoltre, a 1111" è l'emmesima potenza di a 1111 • Saccheri (1773). Prop. XXXIII. Vi è un punto di vista noto come intuizionismo che è sostenuto da una minoranza (abbastanza ridotta) di matematici, in cui il principio della «dimostrazione per assurdo» non è accettato. Vobiezione è che questo principio può essere non costruttivo, poiché può condurre all'affermazione dell'esistenza di qualche entità matematica senza fornire un metodo di costruzione per essa. Questo avrà importanza per gli argomenti discussi in § 16.6. Vedi Heyting ( 1956). Hardy (1940). Gli archi di cerchio massimo sono le curve «più brevi» (geodetiche) sulla superficie di una sfera; esse giacciono su piani che passano per il centro del-
49
LA STRADA CHE PORTA ALLA REALTÀ
la sfera. 9. È argomento di discussione il fatto che Gauss, che professionalmente si occupava di questioni di geodesia, possa davvero aver tentato di accertare se vi siano deviazioni misurabili dalla geometria euclidea nello spazio fisico. A causa della sua ben nota reticenza in materia di geometria non euclidea, è improbabile che lo avrebbe reso noto, anche se avesse veramente tentato di farlo, soprattutto perché sarebbe stato destinato al fallimento per la piccolezza del!' effetto, secondo la teoria moderna. Attualmente si ritiene che Gauss facesse «soltanto geodesia», occupandosi della curvatura della Terra e non di quella dello spazio. Il fatto curioso è che le sue misurazioni degli angoli di un triangolo non sarebbero comunque state influenzate dalla curvatura della Terra. Trovo però abbastanza difficile credere che egli non sarebbe stato anche in guardia per qualunque discrepanza significativa con la geometria euclidea; vedi Fauve! e Gray (1987). 10. La cosiddetta rappresentazione del «semipiano di Poincaré» è anch'essa originariamente dovuta a Beltrami; vedi Beltrami (1868). 11. Sembra che ciò si applichi anche allo stesso grande Gauss (che, d'altra parte, ha spesso anticipato il lavoro di altri matematici). Vi è un importante teorema matematico di topologia, noto come «teorema di Gauss-Bonnet», che può essere elegantemente dimostrato con l'uso della cosiddetta «applicazione di Gauss». Sembra però che questo teorema sia effettivamente dovuto a Blaschke e che la sua elegante dimostrazione sia stata scoperta da Olinde Rodrigues. Appare che né il risultato né il procedimento di dimostrazione fossero conosciuti da Gauss o da Bonnet. Vi è un teorema di «Gauss-Bonnet» più elementare, correttamente citato in testi precedenti, vedi Willmore (1959), anche Rindler (2001). 12. La principale prova sperimentale per la struttura globale dell'universo deriva da una dettagliata analisi della cosmic microwave background radiation (CMB) che sarà discussa in §§27.7, 10, li, 13, §§28.5, 10 e §30.14. Un riferimento fondamentale è de Bernardis et al. (2000); per dati più accurati e più recenti, vedi Netterfield et al. (2001) (riguardo a BOOMERanG). Vedi anche Hannay et al. (2000) (riguardo a MAXIMA) e Halverson et al. (2001) (riguardo a DASI). 13. Vedi Gurzadyan e Torres (1997) e Gurzadyan e Kocharian (1994) per le basi teoriche, e Gurzadyan e Kocharian (1992) (per i dati COBE) e Gurzadyan et al. (2002, 2003) (per i dati BOOMERanG e (2004) per i dati WMAP) per la corrispondente analisi dei dati CMB.
CAPITOLO 3
TIPI DI NUMERO NEL MONDO FISICO
3.1 Una catastrofe pitagorica? Ritorniamo ora al problema della dimostrazione per assurdo, quel principio che Saccheri cercò disperatamente di impiegare nel suo tentativo di dimostrare il quinto postulato di Euclide. Nella matematica classica vi sono molti casi in cui questo principio è stato applicato con successo. Uno dei più famosi risale ai pitagorici e regolò un problema matematico in un modo che li turbò molto. Il problema era il seguente: si può trovare un numero razionale (vale a dire una frazione) il cui quadrato sia esattamente il numero 2? Larisposta fu «no» e l'asserzione matematica che dimostrerò tra poco riguarda proprio il fatto che un simile numero razionale non esiste. Perché i pitagorici furono così turbati da questa scoperta? Si ricordi che una frazione è qualcosa che può essere espresso come il rapporto a/b di due interi a e b (dove «intero» significa «numero intero»), in cui b è diverso da zero. (Vedi la Prefazione per la definizione di «frazione».) Inizialmente i pitagorici avevano sperato che tutta la loro geometria potesse essere espressa in termini di lunghezze misurabili attraverso numeri razionali. I numeri razionali sono quantità abbastanza semplici, essendo descrivibili e comprensibili in semplici termini finiti; possono tuttavia essere impiegati per specificare distanze, grandi o piccole quanto vogliamo. Se tutta la geometria potesse essere fatta con i numeri razionali, ciò renderebbe le cose relativamente semplici e facilmente comprensibili. La nozione di numero «irrazionale», d'altra parte, richiede procedimenti infiniti, e ciò aveva presentato considerevoli difficoltà per gli antichi (per motivi più che validi). Perché vi è una difficoltà nel fatto che non esista nessun numero razionale il cui quadrato sia 2? Questa difficoltà deriva proprio dal teorema di Pitagora. Se, nella geometria euclidea, abbiamo un quadrato il cui lato ha lunghezza 1, allora la lunghezza della sua diagonale è un numero il cui quadrato è l2 + l2 = 2 (vedi fig. 3.1). Per una geometria sarebbe veramente una catastrofe se non vi fosse nessun numero effettivo che potesse 51
LA STRADA CHE PORTA ALLA REALTÀ
Fig. 3.1 Un quadrato di lato unitario ha diagonale ✓ 2, per il teorema di Pitagora.
descrivere la lunghezza della diagonale di un quadrato. I pitagorici tentarono dapprima di cavarsela con una nozione di «numero effettivo» che potesse essere descritta semplicemente in termini di rapporti di numeri interi. Vediamo perché questo non funziona. Il problema è di vedere perché l'equazione
(~J
~2
non ha nessuna soluzione con a e b interi, quando supponiamo che questi interi siano positivi. Useremo la «dimostrazione per assurdo» per verificare che numeri simili non esistono effettivamente. Cerchiamo quindi di supporre che inveçe esistano un tale a e un tale b. Moltiplicando entrambi i membri dell'equazione precedente per b 2 , troviamo che essa diventa a2 = 2b 2
e concludiamo 1 che evidentemente a2 > b 2 >O.Il membro di destra di quest'equazione, 2b 2, è pari, perciò a deve essere pari (non dispari, poiché il quadrato di qualunque numero dispari è dispari). Quindi a= 2c, per qualche intero positivo c. Sostituendo 2c ad a nell'equazione precedente ed elevando al quadrato, otteniamo 4c2 = 2b 2 cioè (dividendo entrambi i membri per 2) b2 = 2c2
e concludiamo che b 2 > c2 > O. Questa è esattamente l'equazione di prima, solo che b rimpiazza a e e rimpiazza b. Si noti che i corrispondenti interi sono più piccoli di quelli di prima. Possiamo ora ripetere il procedimento molte volte, ottenendo una successione senza fine di equazioni a2 = 2b 2, b2 = 2c2, c2 = 2d 2, d 2= 2e2, ... , dove
a2>b2>c2>d2>e2> ... , 52
Tipi di numero nel mondo fisico
tutti questi interi essendo positivi. Qualsiasi successione decrescente di interi positivi deve però finire, in contraddizione con il fatto che questa successione è senza fine. Ciò ci fornisce una contraddizione con quello che era stato supposto, e precisamente che vi è un numero razionale il cui quadrato è 2. Ne segue che un simile numero razionale non esiste, come si voleva dimostrare. 2 Si prendano ora in considerazione alcuni punti di questo ragionamento. In primo luogo, secondo le normali procedure di dimostrazione matematica, in questo ragionamento si è fatto ricorso a certe proprietà dei numeri che sono state ritenute o «ovvie» o dimostrate in precedenza. Per esempio, abbiamo utilizzato il fatto che il quadrato di un numero dispari è sempre dispari e inoltre che se un intero non è dispari, allora è pari. Altro fatto fondamentale al quale abbiamo fatto ricorso è quello per cui ogni successione rigorosamente decrescente di interi positivi deve terminare. Uno dei motivi per cui può essere importante identificare con precisione le assunzioni che entrano in una dimostrazione - anche se alcune di queste assunzioni potrebbero essere perfettamente «ovvie» - è che i matematici sono spesso interessati a tipi di entità diversi da quelli di cui si occupava la dimostrazione originaria. Se tali entità soddisfano le medesime assunzioni, allora la dimostrazione andrà ancora bene e si vedrà che l'asserzione dimostrata ha una generalità maggiore di quella inizialmente supposta, in quanto si applica anche a queste altre entità. D'altra parte, se alcune delle assunzioni necessarie non valgono per queste entità alternative, allora può succedere che l'asserzione sia falsa per queste entità. (Per esempio, è importante rendersi conto che, nelle dimostrazioni del teorema di Pitagora mostrate in §2.2, è stato usato il postulato della parallela; infatti, il teorema risulta falso per la geometria iperbolica.) Nel ragionamento spiegato precedentemente, le entità iniziali sono intere e ci occupiamo di quei numeri - i numeri razionali che sono costruiti come quozienti di interi. È proprio vero che nessuno di simili numeri ha per quadrato 2. Ma vi sono altri tipi di numero, oltre a quelli interi e razionali. In realtà, la necessità di avere la radice quadrata di 2 spinse gli antichi greci, assolutamente contro la loro volontà, ad andare oltre i confini dei numeri interi e razionali, i soli tipi di numero che fino ad allora erano stati preparati ad accettare. Il tipo di numero cui furono condotti fu quello che noi ora chiamiamo «numero reale»: un numero che esprimiamo in termini di uno sviluppo decimale senza fine (anche se un simile sviluppo era ancora ignoto agli antichi greci). In effetti, 2 ha proprio una radice quadrata che è un numero reale, e precisamente (come lo scriveremmo noi adesso)
✓ 2 = 1.414 213 562 373 095 048 801 688 72 ... 53
LA STRADA CHE PORTA ALLA REALTÀ
Prenderemo in considerazione lo stato ji'sico di questi numeri «reali» più da vicino nella prossima sezione. A titolo di curiosità, possiamo chiederci perché la precedente dimostrazione della non esistenza di una radice quadrata di 2 fallisce per i numeri reali (o per i rapporti di numeri reali, che è la stessa cosa). Che cosa succede se in tutto il ragionamento rimpiazziamo «intero» con «numero reale»? La differenza fondamentale è che non è vero che qualsiasi successione strettamente decrescente di numeri reali positivi (o persino di frazioni) debba terminare, e il ragionamento quindi fallisce a questo punto. 3 (Consideriamo, per esem1 1 . 1a success1011e · · f.m1ta · 1, 1 , 1 , 1 , JK' , ...) c·1 s1· potrebb e preoccup10, m 2 4 8 32 pare del significato di numero reale «pari» o «dispari» in questo contesto; ma, in effetti, il ragionamento non incontra alcuna difficoltà a quel punto perché tutti i numeri reali dovrebbero essere ritenuti «pari», poiché per qualsiasi reale a vi è sempre un reale e tale che a = 2c, essendo la divisione per 2 sempre possibile per i numeri reali.
3.2 Il sistema dei numeri reali In questo modo i greci furono costretti a capire che i numeri razionali non erano sufficienti, se le idee della geometria ( di Euclide) dovevano essere opportunamente sviluppate. Oggigiorno non ci preoccupiamo eccessivamente se una certa quantità geometrica non può essere misurata soltanto in termini dei soli numeri razionali. Ciò accade perché la nozione di «numero reale» ci è molto familiare. Anche se i nostri calcolatori tascabili esprimono i numeri solo in termini di un numero finito di cifre, possiamo facilmente accettare che questa è un'approssimazione impostaci dal fatto che il calcolatore è un oggetto finito. Siamo pronti ad ammettere che il numero matematico ideale (platonico) potrebbe certamente richiedere che lo sviluppo decimale continui indefinitamente. Questo si applica anche, naturalmente, alla rappresentazione decimale della maggior parte delle frazioni, come
} =0.333 333 333 ... , 29
= 2.416 666 666 ... , ; = 1.285 714 285 714 285, 237 148 = 1.601 351 351 35 .... 12
Lo sviluppo decimale, per una frazione, è sempre alla fine periodico, il che vuol dire che dopo un certo punto la successione infinita di cifre è formata da una sequenza finita che si ripete indefinitamente. Negli esempi precedenti le sequenze ripetute sono rispettivamente 3, 6, 285714 e 135. 54
Tipi di numero nel mondo fisico
Questi sviluppi decimali erano ignoti agli antichi greci, che avevano però propri modi di trattare i numeri irrazionali. Quello che adottarono fu, in effetti, un sistema di rappresentazione dei numeri in termini di quelle che ora sono chiamate frazioni continue. Non vi è alcun bisogno di addentrarsi nei dettagli, ma alcuni brevi commenti sono opportuni. Una frazione continua4 è un'espressione limitata o illimitata del tipo a + (b + (e + (d + ... )- 1)-1)-1, dove a, b, e, d, ... sono numeri interi positivi: 1
a+----1 b+---1 c+-d+ ... Qualsiasi numero razionale più grande di 1 può essere scritto come un'espressione limitata di questo tipo ( dove, per evitare ambiguità, normalmente richiediamo che l'intero finale sia maggiore di 1), per esempio 52/9 = 5 + (1 + (3 + (2)- 1)- 1)- 1: 52 9
= 5+
1 1+-13+ 1 2
mentre, per rappresentare un razionale positivo minore di 1, permettiamo che il primo intero dell'espressione sia zero. Per esprimere un numero reale, che non sia razionale, permettiamo semplicementeP- 11 che la frazione continua prosegua per sempre, come per esempio 5
..Ji = 1 + (2 +(2 +(2 +(2 + ...)-lrl)-1)-l,
1-.fi = 5 +(3 +c1 +c2 +c1 +c2 +c1 +c2 + ...r 1r 1r 1r 1r 1r 1r1, 7t = 3+(7 +(15 +(1 +(292 +(1 +(1 +(1 +(2 + ...rlrlrlrl)-lrlrlrl. Nei primi due di questi esempi illimitati, le sequenze di numeri naturali che appaiono-vale a dire 1, 2, 2, 2, 2, ... nel primo caso e 5, 3, 1, 2, 1, 2, 1, 2, ... nel secondo - hanno la proprietà di essere infine periodiche (col 2 che si ripete indefinitamente nel primo caso, mentre nel secondo si ripete indefinitamente la sequenza 1, 2).l3-2J Ricordate che, come già fatto notare prima, nella [3.1] Tentate di ottenere col vostro calcolatore tascabile (supponendo che abbiate i tasti «--.f» e 1.
presa tra i valori - 1 e + 1, le curve che raffigurano queste somme parziali convergono davvero al risultato (1 - x 2 )- 1, come ci aspettavamo. Ma al di fuori di questo intervallo, la serie diverge e non raggiunge affatto un qualche valore finito. A titolo di breve digressione, è qui utile prendere in esame una questione che sarà importante per noi in seguito. Poniamoci la seguente domanda: l'equazione che otteniamo ponendo x = 2 nell'espressione precedente, e precisamente
ha effettivamente qualche senso? Il grande matematico del diciottesimo secolo, Leonhard Euler, scriveva spesso equazioni come questa ed era diventato quasi una moda punzecchiarlo gentilmente per il suo sostegno a tali assurdità, mentre lo si potrebbe scusare per il fatto che in quell'epoca non si conosceva praticamente nulla delle questioni di «convergenza» e di cose simili. In effetti, è vero che il trattamento matematicamente rigoroso delle serie non arrivò prima degli ultimi anni del diciottesimo secolo e dei primi del diciannovesimo, attraverso il lavoro di Augustin Cauchy e di altri. Inoltre, secondo questo trattamento rigoroso, l'equazione di sopra sarebbe ufficialmente classificata come una sciocchezza. Tuttavia io penso che sia importante rendersi conto che, nel senso appropriato, Euler sapeva veramente quello che faceva quando ,scriveva apparenti assurdità di questa natura, e che esistono sensi in cui l'equazione di sopra deve essere considerata «corretta». 78
I magici numeri complessi
In matematica è infatti imperativo essere assolutamente chiari nel richiedere che le equazioni abbiano un significato esatto e accurato. È egualmente importante anche non essere indifferenti alle «cose che avvengono dietro le scene» che, in definitiva, possono condurre a intuizioni più profonde. È facile perdere di vista tali cose aderendo con troppo rigore a ciò che appare essere strettamente logico, come il fatto che la somma dei termini positivi 1 + 4 + 16 + 64 + 256 + ... non può verosimilmente essere -½. Come esempio pertinente, ricordiamo l'assurdità logica di trovare una soluzione reale per l'equazionex2 + 1 =O.Non vi è alcuna soluzione; tuttavia, se la lasciamo lì, perdiamo tutte le profonde comprensioni offerte dall'introduzione dei numeri complessi. La stessa osservazione può essere applicata all'assurdità di una soluzione razionale all'equazione x2 = 2. In effetti, è perfettamente possibile dare un senso matematico al risultato «-½ » per la se1ie infinita di sopra, ma si deve fare attenzione alle regole che ci dicono quello che è permesso e quello che non è permesso. Non ho qui intenzione di discutere simili questioni in dettaglio, 8 ma si può porre in rilievo che nella fisica moderna, in particolare nella teoria quantistica dei campi, si incontrano spesso serie divergenti di questo genere (vedi in particolare §§26.7,9 e §§31.2,13). È un problema molto delicato decidere se i «risultati» ottenuti in questo modo abbiano effettivamente significato e siano effettivamente corretti. Alcune volte, risultati estremamente accurati sono davvero ottenuti con la manipolazione di simili espressioni divergenti e, in qualche occasione, sono sorprendentemente confermati dal confronto con reali esperimenti fisici. D'altra parte, non si è sempre così fortunati. Questi delicati problemi recitano ruoli importanti nelle attuali teorie fisiche e sono molto pertinenti per i nostri tentativi di valutarle. Il punto di immediata attinenza a noi, qui, è che il «senso» che si può essere in grado di attribuire a simili espressioni apparentemente senza significato dipende, in modo essenziale, dalle proprietà dei numeri complessi. Ritorniamo ora al problema della convergenza delle serie, cercando di vedere come i numeri complessi si inseriscono in questo quadro. Consideriamo, per questo scopo, una funzione solo leggermente differente da ( 1 - x 2)- 1, e precisamente (1 + x 2 )- 1, e tentiamo di vedere se questa ha uno sviluppo ragionevole in serie di potenze. Sembrerebbe che, in questo caso, vi sia una maggiore probabilità di completa convergenza, perché (1 + x 2 )- 1 rimane liscia e finita in tutto il campo dei numeri reali. Vi è, infatti, per ( 1 + x 2 )- 1 una serie dall'aspetto semplice, soltanto leggermente diversa da quella di prima, e precisamente
1 - x2 + x4 - x6 + xs - ... = ( 1 + xz) - 1' essendo la differenza soltanto un cambiamento di segno a termini alternati.l4·51 Nella fig. 4.2, ho plottato le somme parziali della serie in successione fino a cinque termini, proprio come prima, assieme al risultato (1 + x 2)- 1• Ciò che appare sorprendente è che le somme parziali convergono ancora al [4.5] Riuscite a trovare un motivo elementare per questa semplice relazione tra le due serie? 79
LA STRADA CHE PORTA ALLA REALTÀ
.'. .'.''.'' ...' ' ''
.'',,'
,, ,, '•,,,,
---------
-------\:
-X
Fig. 4.2 - Sono analogamente tracciate le rispettive somme parziali 1, 1 - x 2, 1 - x 2 + x4, 1 - x 2 + x4 - x 6 , 1 - x 2 + x4 - x 6 + x 8, della serie per (1 + ,-2)~ 1, e vi è ancora convergenza per lxi < 1 e divergenza per Jxl > 1, nonostante la funzione non abbia nessuna singolarità nei punti x = ± I.
risultato soltanto nell'intervallo da - 1 a+ 1. Sembra che, all'esterno di questo intervallo, si abbia divergenza, anche se il risultato non va affatto all'infinito, a differenza del caso precedente. Questa cosa può essere verificata esplicitamente, usando i medesimi tre valori x = l,x =2,x = ½ di prima, e troviamo che come prima si ha convergenza solo nel caso x =½,dove il risultato concorda esattamente con il valore limite { della somma di tutta la serie: x=l:
1, O, 1, O, 1, O, 1, eccetera,
x=2:
1, - 3, 13, - 51, 205, - 819, eccetera, 3
13
51
1, " ' n,, 64'
205 819 256 , 1o24 '
eccetera.
Notiamo che la «divergenza» nel primo caso è semplicemente un'incapacità delle somme parziali di stabilizzarsi, anche se non divergono effettivamente ali' infinito. Così, in termini dei soli numeri reali, vi è una sconcertante discrepanza tra la somma della serie e il «risultato» che si suppone che la serie rappresenti. Le somme parziali semplicemente «decollano» (o, piuttosto, sbatacchiano selvaggiamente in su e in giù) proprio negli stessi punti (e precisamente x = ± 1) dove nascevano guai nel caso precedente, anche se adesso il presunto risultato della somma infinita, e precisamente (1 + x 2)- 1, non mostra affatto nessuna strana caratteristica in questi punti. La risoluzione di questo mistero può essere trovata se esaminiamo i valori complessi di questa funzione invece di limitarci alla considerazione dei soli valori reali. 80
I magici numeri complessi
4.4 Il piano complesso di Caspar Wessel Per capire ciò che avviene in questo caso, sarà importante usare la rappresentazione geometrica standard dei numeri complessi sul piano euclideo. Caspar Wessel nel 1797, Jean Robert Argand nel 1806, John Warren nel 1828 e Carl Friedrich Gauss, sicuramente prima del 1831, arrivarono tutti indipendentemente all'idea di piano complesso (vedi fig. 4.3), in cui diedero una chiara interpretazione geometrica delle operazioni di addizione e moltiplicazione dei numeri complessi. In fig. 4.3 ho impiegato assi cartesiani standard, con l'asse x orizzontale e diretto verso destra e l'asse y verticale e diretto verso l'alto. Il numero complesso z=x+ iy
è rappresentato dal punto del piano con coordinate cartesiane (x, y). Adesso dobbiamo pensare a un numero reale x come a un caso particolare del numero complesso z = x + iy, in cui y = O. In questo modo, pensiamo che l'asse x del diagramma rappresenti la retta reale (in altre parole, la totalità dei numeri reali, linearmente ordinati lungo una retta). Il piano complesso, quindi, ci dà una rappresentazione grafica diretta di come il sistema dei numeri reali venga esteso per diventare l'intero sistema dei numeri complessi. Questa retta reale è spesso chiamata «l'asse reale» nel piano complesso. Vasse y è invece chiamato «l'asse immaginario»; esso è costituito da tutti i multipli reali di i. Ritorniamo ora alle due funzioni che abbiamo tentato di rappresentare in termini di serie di potenze. Le avevamo considerate come funzioni della variabile reale x, e precisamente (1 - x 2)- 1 e (1 + x 2)- 1, ma ora le estendiamo in modo che si applichino a una variabile complessa z. Non vi è nessun proble-
asse immaginario
"
3i -1+2i
2i y
1+2i
-l+i
i
l+i
z =x+iy "'t I
2+i
I
I
3+i
--
I
-2
I
-1
o
1
2
-1-i
-i
1-i
2-i
X
3 asse reaie 3-i
Fig. 4.3 - Il piano complesso di = x + iy. In coordinate cartesiane (x, y), l'asse orizzontale x orientato verso destra è l'asse reale, mentre l'asse verticale y orientato verso l'alto è l'asse immaginario.
z
81
LA STRADA CHE PORTA ALLA REALTÀ
ma per fare ciò: scriviamo semplicemente queste funzioni estese come ( 1- z 2)- 1 e ( 1 + z 2)- 1, rispettivamente. Nel caso della prima funzione reale ( 1 - x 2)- 1, eravamo stati in grado di riconoscere dove iniziavano i guai dovuti alla divergenza, perché questa funzione è singolare (nel senso che diventa infinita) nei due punti x = - I e x = + I; ma, nel caso di ( 1 + x 2)- 1, non vediamo alcuna singolarità in questi punti e non vediamo affatto singolarità reali in nessun luogo. Tuttavia, in termini della variabile complessa z, vediamo che queste due funzioni sono molto di più alla pari tra di loro. Abbiamo notato le singolarità di (1 - z 2)- 1 nei due punti z = ± I, a distanza unitaria dall'origine lungo l'asse reale; ma adesso vediamo che anche (1 + z 2)- 1 ha delle singolarità, e precisamente nei due punti z =±i (poiché per questi valori 1 + z2 = O), che sono a distanza unitaria dall'origine lungo l'asse immaginario. Ma che cosa hanno a che fare queste singolarità complesse con il problema della convergenza o della divergenza della corrispondente serie di potenze? Per questa domanda vi è una risposta sorprendente. Noi adesso pensiamo alle nostre serie di potenze come a funzioni della variabile complessa z, invece che della variabile reale x, e possiamo chiederci quali sono i punti di z nel piano complesso in cui la serie converge e quali quelli in cui diverge. La notevole risposta generale,9 per qualunque serie di potenze di qualsiasi genere
è che nel piano complesso vi è un cerchio, con centro nel punto O, chiamato cerchio di convergenza, con la proprietà per cui se il numero complesso z giace all'interno di questo cerchio, allora la serie converge per quel valore di z, mentre se z giace ali' esterno di questo cerchio, allora la serie diverge per quel valore di z. (La questione della convergenza o no della serie per un valore di z che giaccia esattamente sulla circonferenza di questo cerchio è un problema piuttosto delicato di cui non ci occuperemo qui, anche se ha qualche importanza per le questioni che tratteremo in §§9.6,7.) In questa affermazione includo anche due situazioni estreme: quella in cui la serie diverge per tutti i valori di z diversi da zero, quando il cerchio di convergenza ha raggio zero, e quella in cui la serie converge per tutti i valori di z, quando cioè il raggio del cerchio diventa infinito. Per trovare quale sia realmente il raggio del cerchio di convergenza, per qualche particolare funzione data, dobbiamo vedere dove sono collocate nel piano complesso le singolarità di questa funzione e tracciare il più grande cerchio, con centro nell'origine, che non contenga al suo interno nessuna di queste singolarità (lo tracciamo cioè facendolo passare per la singolarità più vicina all'origine). Nei casi particolari (1 - z 2)- 1 e (I + z 2)- 1 che abbiamo appena preso in esame, le singolarità sono di un tipo semplice chiamato polo (che nasce quando un polinomio, che compare in forma reciproca, si annulla). Qui tutti i poli si trovano a distanza unitaria dall'origine, quindi il cerchio di convergenza è, in 82
I magici numeri comples$i
Fig. 4.4 - Le funzioni (1 - z2)- 1 e (1 + z2)- 1, nel piano complesso, hanno il medesimo cerchio di convergenza, essendoci poli per la prima nei punti z = ± 1 e per la seconda nei punti z = ± i, tutti a distanza unitaria dall'origine.
entrambi i casi, proprio il cerchio unitario intorno all'origine. I punti dove questo cerchio incontra l'asse reale sono gli stessi in ciascun caso, vale a dire i due punti z = ± 1. (Vedi fig. 4.4.) Ciò spiega perché le due funzioni convergono e divergono nelle medesime regioni- un fatto che non è evidente dalle loro proprietà come semplici funzioni di variabili reali. In questo modo, i numeri complessi ci offrono intuizioni più profonde sul comportamento delle serie di potenze; intuizioni che non sono disponibili dalla semplice considerazione della loro struttura in termini di variabili reali.
4.5 Come costruire l'insieme di Mandelbrot Per finire questo capitolo, esaminiamo un altro problema di convergenza e divergenza. È quello che si trova alla base della costruzione di quella straordinaria configurazione, a cui si è accennato in § 1.3 e che è riprodotta in fig. 1.2, nota come l'insieme di Mandelbrot. In verità, questo non è altro che un sottoinsieme del piano complesso di Wessel che può essere definito in maniera sorprendentemente semplice, se si tiene conto dell'estrema complicazione di questo insieme. Tutto quello che dobbiamo fare è esaminare le ripetute applicazioni della sostituzione
z ➔ z2 + e, dove e è un numero complesso fissato. Pensiamo a e come a un punto nel piano complesso e cominciamo con z =O.Iteriamo poi questa trasformazione (in altre parole, applichiamola ripetutamente) e vediamo come si comporta il punto z nel piano. Se si allontana verso l'infinito, allora al punto e deve venire assegnato il colore bianco; se z si aggira in una regione ristretta senza mai allontanarsi all'infinito, allora a e deve essere assegnato il colore nero. La regione nera ci dà l'insieme di Mandelbrot. 83
LA STRADA CHE PORTA ALLA REALTÀ
Descriviamo questo procedimento con un po' più di dettaglio. Come procede l'iterazione? Per prima cosa, fissiamo c. Prendiamo poi un punto z e applichiamo la trasformazione, cosicché z diventa z 2 + c. Applichiamola poi ancora, cosicché ora sostituiamo lo in z2 + e con z2 + e, ottenendo (z2 + e)2 + c. Poi rimpiazziamo lo sono sommati tenendo a mente che sottrarre 21t da 0 + non produrrebbe alcuna differenza), com'è implicito nella legge dei «triangoli simili» di fig. 5.1 b. Abbandonerò quindi la notazione [r, 0] e userò invece l'espressione sopra mostrata. Si noti che, se r = 1, 0 = 1t, otteniamo - 1 e ritroviamo la famosa formula di Eulero erri + 1 = O che abbiamo visto sopra, usando la geometria di fig. 5 .4a; se r = 1 e 0 = 21t, otteniamo + 1 e ritroviamo e2rri = 1. La circonferenza con r = 1 è detta la circonferenza unitaria nel piano complesso (vedi fig. 5.8); questa è data da w = ei 8 per 0 reale, in accordo con l'e[5.6] Deducete da questo che z + 1ti è un logaritmo di - w. 95
LA STRADA CHE PORTA ALLA REALTÀ
circonferenza unitaria
l,. -]
Fig. 5.8 - La circonferenza unitaria, formata dai numeri complessi di modulo I. La formula di Cotes-Euler li dà come ei 8 = cos0 + isin0 per 0 reale.
-i
spressione precedente. Confrontando questa espressione con le precedenti x = r cos 0 e y = r sin 0 date in precedenza, per la parte reale e immaginaria di quella che è ora la grandezza w = x + iy, otteniamo la prolifica «formula di (Cotes-)Eulern 5 ei 8 = cos 0 + i sin 0, che fondamentalmente include gli elementi essenziali della trigonometria nelle proprietà molto più semplici delle funzioni esponenziali complesse. Vediamo come la cosa funziona in alcuni casi elementari. In particolare, la relazione fondamentale e"+b = eaeh, quando è sviluppata in termini di parti reali e immaginarie, dà immediatamente[5.71 le espressioni dall'aspetto molto più complicato (senza alcun dubbio famigeratamente familiari ad alcuni lettori): cos (a+ b) =cosa cos b- sin a sin b, sin (a+ b) = sin a cos b +cosa sin b. Analogamente, sviluppando e 3;8 = (ei8) 3, per esempio, si ottiene[5-8l6 cos 30 = cos 3 0 - 3 cos 0 sin2 0, sin 30 = 3 sin 0 cos 2 0 - sin 3 0. C'è davvero qualcosa di magico nel modo diretto con cui queste formule alquanto complicate saltano fuori da semplici espressioni in termini di numeri complessi.
5.4 Potenze complesse Ritorniamo ora alla definizione di w= (o bZ, come scritto prima). Possiamo ottenerla scrivendo W'
(5.7) Verificatelo. (5.8] Fatelo.
96
= ezlogw
La geometria di logaritmi, potenze e radici
(poiché eziogw = (elogw)' ed elogw = w). Ma notiamo che, a causa dell'ambiguità in log w, possiamo addizionare qualsiasi multiplo intero di 2ni a log w per ottenere un'altra possibile risposta. Ciò significa che possiamo moltiplicare o dividere qualunque scelta particolare di wz per e 2 • 2rci quante volte vogliamo ottenendo ancora un possibile «w=». È divertente vedere la configurazione di punti nel piano complesso che si ottiene nel caso generale. Questa è illustrata in fig. 5.9. I punti si trovano alle intersezioni di due spirali equiangole. (Una spirale equiangola - o logaritmica - è una curva piana che forma un angolo costante con le rette che escono da un punto del piano.)l5·91 Questa ambiguità ci conduce verso svariati problemi, se non facciamo attenzioneY-'01 Sembra che il modo migliore di evitare questi problemi sia adottare la regola per cui la notazione wz sia impiegata soltanto quando è stata spec(fìcata una scelta particolare di log w. (Nel caso speciale di eZ, la tacita convenzione è sempre quella di prendere la scelta particolare loge = 1. Allora la notazione standard e 2 è coerente con il nostro più generale w=.) Una volta che è fatta questa scelta di log w, allora w 2 è definito senza ambiguità per tutti i valori di z. Si può far notare, a questo punto, che abbiamo anche bisogno di una specificazione per log b, se dobbiamo definire il «logaritmo in base b» a cui abbiamo accennato in precedenza in questa sezione (la funzione indicata da «log b»), perché ci occorre un w = bz non ambiguo per definire z = logbw. Anche così, logb w avrà naturalmente molti valori (come era il caso con logb w), dove possiamo addizionare a logbw qualsiasi multiplo intero di 2ni/log b.f5•11 l Una curiosità che ha notevolmente affascinato nel passato molti matematici è la grandezza ji_ Questa poteva sembrare «la cosa più immaginaria che si potesse ottenere»; troviamo tuttavia la risposta reale . 1 .
1
ii= eilogi = e ·2m = e-rtlz = 0.207879576 ... ,
Fig. 5.9 - I diversi valori di w= (= e 2 log w). Qualsiasi multiplo intero di 21ti può essere addizionato a logz, il che moltiplica o divide w= per e=2•i un numero intero di volte. Nel caso generale, questi sono rappresentati nel piano complesso come le intersezioni di due spirali equiangole (ciascuna delle quali forma un angolo costante con rette passanti per l'origine). [5.9] Dimostratelo. In quanti modi? Trovate anche tutti i casi speciali. [5.10] Risolvete il seguente paradosso: e e1 + 2•ì, e= (e 1 +Z•i) 1 +zm e 1 + 4•i- 4•' = e 1 - 4•'. [5.11] Dimostratelo. 97
LA STRADA CHE PORTA ALLA REALTÀ
specificando log i= {rei _[5- 121Vi sono anche molte altre risposte, date dalle altre specificazioni di log i. Si ricavano moltiplicando la grandezza sopra ottenuta per e2nn, dove n è un intero qualsiasi (o, in modo equivalente, innalzando la grandezza di sopra a qualunque potenza della forma 4n + 1, dove n è un intero - positivo o negativo).[5-131 È sorprendente che tutti i valori di ii siano in effetti reali! Vediamo ora come la notazione w funzioni per z = Ci aspettiamo di essere in grado di rappresentare, in un certo senso, le due grandezze ±✓ w come «wll2». Otteniamo, in effetti, queste due grandezze semplicemente specificando per la prima un valore per log w e per la seconda specificando il valore ottenuto sommando 2rci al primo valore. Questo dà come risultato un cambiamento di segno in w I12 (per la formula di Euler eni = - I). In modo analogo, possiamo generare tutte le n soluzioni di zn = w, quando n è 3, 4, 5, ... , come la grandezza w 11n, specificando successivamente differenti valori di log w.l5• 141Più in generale, possiamo ritornare alla questione delle radici di ordine z di un numero complesso w diverso da zero, a cui si è accennato in §4.2. Possiamo esprimere una simile radice di ordine z come w I1Z, ottenendo in generale un numero infinito di valori alternativi, che dipendono dalla scelta fatta per log w. Con la giusta scelta specificata per log (w 112), e precisamente quella data da (log w)/z, otteniamo proprio (w 11=)= = w. Facciamo notare che, più in generale (wa)b = Wab,
±,
dove, una volta che abbiamo fatto una specificazione di log w (per il lato di destra), dobbiamo specificare che (per il lato di sinistra) log (wa) è a(log w).[5.1 51 Quando z è un intero positivo n, le cose sono molto più semplici e si ottengono proprio n radici. In questo caso, una situazione di particolare interesse si riscontra quando w = I . Allora, specificando successivamente i possibili valori di (log I), e precisamente O, 2rci, 4rci, 61ti, ... , otteniamo 1 = e0, e2ni111 , e4ni111 , e6niln, ••• per i possibili valori di 11111 • Possiamo scriverli come 1, E, c 2, c 3 , ••. , con E= e 2nu,,_ Nel piano complesso questi sono n punti egualmente spaziati sulla circonferenza unitaria, chiamati radici ennesime del! 'unità; essi costituiscono i vertici di un poligono regolare di n lati (vedi fig. 5.10). (Si noti che le scelte - 21ti, - 4rci, - 6rci, eccetera, per log I darebbero le stesse radici ennesime in ordine inverso.) È abbastanza interessante osservare che, per un dato n, le radici ennesime del! 'unità costituiscono quello che è chiamato un gruppo moltiplicativo finito, più in particolare il gruppo ciclico Zn (vedi §13.1). Abbiamo n grandezze con la proprietà che moltiplicando tra loro due qualsiasi di esse otteniamo un'altra [5.12] Perché questa è una specificazione ammissibile? [5.13] Mostrate perché questo funziona. [5.14] Enunciatelo esplicitamente. [5.15] Dimostratelo. 98
La geometria di logaritmi, potenze e radici
Fig. 5.10 - Le radici ennesime dell'unità e 2mii11 (r = 1, 2, ... , n), egualmente spaziate lungo la circonferenza unitaria, forniscono i vertici di un ennagono regolare. Qui n = 5.
di queste grandezze. Possiamo anche dividerle tra loro ottenendo lo stesso risultato. A titolo d'esempio, consideriamo il caso n = 3; otteniamo ora tre elementi 1, ro, ro 2, dove ro = e21tv3 ( così ro3 = 1 e ro- 1 = ro 2). Abbiamo per questi numeri le seguenti semplici tabelle di moltiplicazione e divisione: X
1
1
O)
(1)2
O)
(1)2
1
O)
(1)2
1
1
(1)2
O)
(1)2
O)
O)
(1)2
1
O)
O)
1
0)2
(1)2
1
O)
(1)2
(1)2
O)
Questi particolari numeri sono rappresentati nel piano complesso dai vertici di un triangolo equilatero. La moltiplicazione per ro fa ruotare il triangolo di }1t (vale a dire 120°) in senso antiorario e quella per ro 2 causa la stessa rotazione, ma in senso orario; nel caso della divisione, la rotazione è nella direzione opposta (vedi fig. 5.11).
Fig. 5.11 - Il triangolo equilatero delle radici cubiche I, ro, ro2 dell'unità. La moltiplicazione per ro fa ruotare di 120° in senso antiorario, quella per ro2 di 120° in senso orario.
99
LA STRADA CIIE PORTA ALLA REALTÀ
5.5 Alcune relazioni con la moderna fisica delle particelle Numeri come questi sono interessanti per la moderna fisica delle particelle, poiché forniscono i casi possibili di un numero quantico moltiplicativo. In §3.5, ho commentato il fatto che i numeri quantici additivi (scalari) della fisica delle particelle sono invariabilmente quantificati, per quanto se ne sa, da interi. Vi sono anche alcuni esempi di numeri quantici moltiplicativi, e questi sembrano essere quantificati in termini delle radici ennesime dell'unità. Conosco solo pochi esempi di simili grandezze nella convenzionale fisica delle particelle, e nella maggior parte di questi la situazione è il caso relativamente poco interessante di n = 2. Vi è un unico chiaro caso dove n = 3 e forse un caso per cui n = 4. Sfortunatamente, nella maggior parte dei casi il numero quantico non è universale; in altre parole non può essere applicato coerentemente a tutte le particelle. In tali situazioni, dirò che il numero quantico è solo approssimato. La grandezza chiamata parità è un numero quantico moltiplicativo (approssimato) con n = 2. (Vi sono anche altre grandezze approssimate, con n = 2, simili sotto molti aspetti alla parità, come la G-parità. Non le discuterò qui.) La nozione di parità per un sistema composto è costruita (moltiplicativamente) dalle parità delle particelle costituenti. Per ciascuna di queste particelle costituenti, la parità può essere pari, nel qual caso la riflessione speculare della particella è la particella stessa; in alternativa, la sua parità può essere dispari, nel qual caso la sua riflessione,speculare è quella che è chiamata la sua antiparticella (vedi §3.5, §§24.1-3,8 e §26.4). Poiché la nozione di riflessione speculare, o di antiparticella, è un qualcosa il cui «quadrato è l'unità», (cioè la sua ripetizione ci riporta al punto di partenza), il numero quantico-indichiamolo con E-deve avere la proprietà E2 = 1, così che deve essere una «radice ennesima dell'unità» per n = 2 (cioè E = + 1 o E = 1). Questa nozione è solo approssimata perché la parità non è conservata rispetto a quelle che sono chiamate «interazioni deboli»; non vi può quindi essere, a causa di ciò, una parità ben definita per certe particelle (vedi §§25.3,4). La nozione di parità inoltre si applica, nelle normali descrizioni, solo alla famiglia di particelle note come bosoni. Le altre particelle appartengono a un'altra famiglia e sono note come fermioni. La distinzione tra bosoni e fermioni è molto importante, ma piuttosto sofisticata, e la riprenderemo più avanti, in §§23.7,8. (In una manifestazione, essa ha a che fare con quello che avviene quando ruotiamo con continuità lo stato di una particella di 2n, cioè di 360°. Soltanto i bosoni ritornano del tutto ai loro stati iniziali dopo una simile rotazione; per i fermioni una simile rotazione deve essere fatta due volte! Vedi §11.3 e §22.8.) In un certo senso «due fermioni fanno un bosone», mentre «anche due bosoni fanno un bosone» e «un bosone e un fermione fanno un fermione». In questo modo, possiamo assegnare il numero quanti100
La geometria di logaritmi, potenze e radici
co moltiplicativo - 1 a un fermione e + 1 a un bosone per descrivere la sua natura rispetto alla parità, ottenendo così un altro numero quantico moltiplicativo con n = 2. Per quanto è finora noto, questa grandezza è un numero quantico moltiplicativo esatto. Sembra che vi sia anche una nozione di parità che può essere applicata ai fermioni, anche se non sembra che sia una terminologia convenzionale. Questa deve essere combinata con il numero quantico fermione/bosone per dare un numero quantico moltiplicativo con n = 4. Il valore di parità, per un fermione, dovrebbe essere + i o - i, e una sua doppia riflessione speculare equivarrebbe a una rotazione di 21t; per un bosone, il valore di parità sarebbe ± 1, come prima. Il numero quantico moltiplicativo con n = 3 a cui ho accennato è quello che chiamerò quarkiness. (Questa non è una terminologia standard e non è neppure consueto riferirsi a questo concetto come a un numero quantico, ma esso racchiude un aspetto importante della nostra attuale comprensione della fisica delle particelle.) In §3.5, ho accennato al punto di vista moderno secondo cui le particelle «interagenti fortemente» note come adroni (protoni, neutroni, mesoni 1t, eccetera) siano composte da quark (vedi §25.6). Questi quark hanno cariche elettriche i cui valori non sono multipli interi della carica elettrica dell'elettrone, ma sono invece multipli interi di un terzo di questa carica. I quark, tuttavia, non possono esistere come singole particelle separate e i loro composti possono esistere, come singole individualità, soltanto se la somma delle cariche dei singoli costituenti è un multiplo intero della carica dell'elettrone. Sia q il valore della carica elettrica misurata nelle unità negative dell'elettrone (così che per l'elettrone abbiamo q = - l, poiché, convenzionalmente, la carica dell'elettroper gli antiquark, ne è presa come negativa). Per i quark, abbiamo q = { o q= o In questo modo, se prendiamo per la quarkiness il numero quantico moltiplicativo e- 2'f"Ì, troviamo che esso assume i valori 1, w, co 2• Per un quark, la quarkiness è w e, per un antiquark, è co 2 • Una particella può esistere da sola, per proprio conto, solo se la sua quarkiness è 1. In accordo con §5.4, i valori di quarkiness costituiscono il gruppo ciclico "lL 3 • (In §16.1, vedremo come, con un elemento aggiuntivo «O» e ùna notazione additiva, questo gruppo può essere esteso al campo finito IF4 .) In questa sezione e in quella precedente, ho mostrato alcuni degli aspetti matematici della magia dei numeri complessi e ho accennato a un numero ristrettissimo delle loro applicazioni. Ma non ho ancora menzionato gli aspetti dei numeri complessi (che saranno evidenziati nel capitolo 7) che io stesso ho trovato i più magici di tutti quando li ho appresi da studente universitario di matematica. Negli anni successivi, mi sono imbattuto in aspetti ancora più sorprendenti di questa magia, e uno di questi (descritto alla fine del capitolo 9) è stranamente complementare a quello che più mi aveva colpito come studente universitario. Tuttavia, queste cose dipendono da certe nozioni fondamentali di calcolo infinitesimale. Quindi, per trasmettere parte dita-
f
f.
-½;
101
LA STRADA CHE PORTA ALLA REALTÀ
le magia al lettore, sarà dapprima necessario fare alcuni accenni riguardo a queste nozioni fondamentali. Ma vi è naturalmente anche un'altra ragione: il calcolo infinitesimale è assolutamente essenziale per un'adeguata comprensione della fisica!
Note 1.
2. 3. 4.
5.
6.
Si dovrebbe anche tener conto delle funzioni trigonometriche cot 0 = cos 0 I sin 0= (tan 0t 1, sec 0= (cos 0)- 1 e cosec 0= (sin 0)- 1, così come delle versioni «iperboliche» delle funzioni trigonometriche, sin ht = ½( e1 - e-1), cos ht = ½(e1 + e- 1), tan ht = sin ht/cos ht, eccetera. Si noti anche che l'inverso di queste operazioni sono denotate da cor 1, sin h- 1, eccetera, come con la «tan- 1 (y/x)» di §5.1. I logaritmi sono stati introdotti nel 1614 da John Napier e resi pratici da Henry Briggs nel 1624. Il logaritmo naturale è comunemente indicato anche con «In». Da quello che è stato finora dimostrato, non possiamo inferire che «i0» nella formula z = log r + i0non dovrebbe essere un multiplo reale di i0. Questorichiede il calcolo. Cotes (1714) possedeva la formula equivalente log (cos 0+ i sin 0) = i0. Sembra che la formula di Euler ei 8 = cos 0 + i sin 0 sia comparsa per la prima volta trent'anni più tardi (vedi Euler 1748). Sto qui impiegando la notazione comoda (ma alquanto illogica) cos 3 0per (cos 0) 3, eccetera. Dovrebbe essere notata l'incoerenza di questa notazione con (la più logica) cos- 10, questa ultima essendo anche comunemente indicata con are cos 0. La formula sin n0+ i cos n0= (sin 0+ i cos 0)11 è nota anche come «teorema di De Moivre». Sembra cheAbraham De Moivre, un contemporaneo di Roger Cotes (vedi la nota precedente), abbia scoperto anche lui la formula ei 11 = sin 0 + i cos 0.
CAPITOLO 6
IL CALCOLO INFINITESIMALE NEL CAMPO REALE
6.1 Che cosa fa una funzione perbene? Il calcolo infinitesimale - o, per dargli un nome più sofisticato, l'analisi matematica - è costituito da due ingredienti fondamentali: la derivazione e l'integrazione. La derivazione si occupa di velocità e accelerazioni, di coefficienti angolari e curvature di curve e superfici e cose simili, ossia tassi di cambiamento e grandezze definite localmente, in termini della struttura o del comportamento dei più piccoli intorni di singoli punti. L'integrazione si occupa invece di aree e volumi, di centri di gravità e di molte altre cose di questo genere che implicano misure di globalità, in una forma o in un'altra, e non sono definite semplicemente da ciò che avviene nell'intorno locale o infinitesimale di singoli punti. Il fatto notevole, chiamato teorema .fondamentale del calcolo infinitesimale, è che ciascuno di questi due ingredienti è sostanzialmente l'inverso dell'altro. È in gran parte dovuto a ciò il fatto che questi due importanti campi di studio matematico si combinino insieme per fornire un potente corpo di comprensione e di tecniche computazionali. Questo campo dell'analisi matematica, sorto nel diciassettesimo secolo grazie a Fermat, Newton e Leibniz e che si riallaccia alle idee di Archimede sviluppate nel terzo secolo a. C., viene chiamato «calcolo infinitesimale» perché fornisce proprio un corpo di tecniche di calcolo grazie alle quali problemi che altrimenti sarebbero concettualmente difficili da trattare possono spesso essere risolti «automaticamente», seguendo semplicemente poche regole elementari applicabili senza bisogno di esercitare un grande sforzo mentale. Tuttavia in questo calcolo infinitesimale esiste uno stridente contrasto tra le operazioni di derivazione e integrazione riguardo a quale sia quella «facile» e quale quella «difficile». Quando si tratta di applicare le operazioni a formule esplicite implicanti funzioni note, quella «facile» è la derivazione e quella «difficile» è l 'integrazione, che in molti casi non può affatto essere eseguita in modo esplicito. D'altra parte, quando le funzioni non sono date in termini di formule, ma in termini di liste tabulate di dati numerici, l'operazione «facile» è l'integrazione 103
LA STRADA CHE PORTA ALLA REALTÀ
mentre quella «difficile» risulta la derivazione, che, rigorosamente parlando, non può essere affatto possibile nel modo normale. Le tecniche numeriche si occupano di solito di approssimazioni, ma anche nella teoria esatta vi è un elemento analogo a questo aspetto; inoltre l'integrazione può essere eseguita anche in circostanze in cui la derivazione non può esserlo. Cerchiamo di capirne qualcosa. Questi problemi hanno in effetti a che fare con quello che realmente si intende con la parola «funzione». Per Euler e gli altri matematici del diciassettesimo e diciottesimo secolo, una «funzione» avrebbe rappresentato qualcosa da poter scrivere esplicitamente, come x 2 o sinx o log(3 - x + e), o forse definita da qualche formula implicante un'integrazione o da una serie di potenze data esplicitamente. Oggi preferiamo pensare in termini di «applicazioni», dove un insieme A di numeri (o di entità più generali) chiamato dominio della funzione è «applicato» su qualche altro insieme B, chiamato target della funzione (vedi fig. 6.1). Il punto essenziale di tutto ciò è che la funzione assegna un membro del target Ba ciascun membro del dominio A. (Si pensi alla funzione come a qualcosa «che esamina» un numero appartenente ad A e poi, in base solo al numero che trova, produce un numero definito appartenente a B.) Questo genere di funzione può essere solo una «tabella da consultare»; non vi sarebbe alcuna richiesta per una formula «dall'aspetto ragionevole» per esprimere l'azione della funzione in modo chiaramente esplicito. Esaminiamo alcuni esempi. Nella fig. 6.2, ho tracciato i grafici di tre semplici funzioni, precisamente quelle date da x2, /xl e 0(x). 1 In ciascun caso, il dominio e il target sono entrambi l'insieme di tutti i numeri reali, di solito indicato con R. La funzione che denoto con eleva semplicemente al quadrato il numero reale che sta esaminando. La funzione denotata da /xl (chiamata valore assoluto) produce esattamente x, se x non è negativo, ma dà - x sex è negativo; così /xl non è mai negativo. La funzione 0(x) è O sex è negativo ed è 1 sex è positivo; di solito si adotta la definizione 0(0) (Questa funzione è chiamata lafunzione a gradino di Heaviside; vedi §21.1 per un'altra importante influenza matematica di Oliver Heaviside, che è forse più conosciuto per avere postulato per primo l'esistenza dello «strato di Heaviside» dell'atmosfera terrestre, così vitale per le trasmissioni radio.)
=f.
Dominio 104
Target
Fig. 6.1- Unafunzìone come una «applicazione», con cui il suo dominio (un insieme A di numeri o di altri enti) è «applicato» sul suo target (un altro insieme B).A ogni elemento di A è assegnato un particolare elemento di B, anche se a differenti elementi di A può essere assegnato lo stesso elemento di Be alcuni elementi di B non corrispondono a nessun elemento di A.
Il calcolo infinitesimale nel campo reale y
y
y =lxi
y = B(x)
X
X
X
Fig. 6.2 - I grafici di (a) lxi, (b) x2 e (e) 0(x); in tutti e tre i casi il dominio e il target sono il sistema di numeri reali.
Ciascuna di queste è una funzione perfettamente accettabile nel senso moderno del termine, ma Euler2 avrebbe avuto difficoltà ad accettare lxi e 0(x) come vere funzioni nel suo significato del termine. Perché potrebbe avvenire ciò? Si potrebbe pensare che il problema con lxi e 0(x) è che vi è una sovrabbondanza di espressioni del genere: «Sex è una certa cosa fai la tale cosa, mentre sex è ... », ma non vi è alcuna «bella formula» per la funzione. Tutto ciò è però alquanto vago, e in qualsiasi caso potremmo chiederci cosa ci sia di realmente errato nel ritenere che jxj sia una «formula». Inoltre, una volta che abbiamo accettato jxj, potremmo scrivere[6-1l una formula per 0(x):
e(x) = lxl+x
2x (anche se potremmo chiederci in quale senso questa formula ci fornisca il giusto valore per 0(0), poiché essa ci dà 0/0). Più pertinente è che il problema con lxi non è tanto che la sua espressione esplicita non sia «bella», quanto che questa funzione non sia «liscia». Lo vediamo «nell'angolo» nel mezzo della fig. 6.2a. La presenza di quest'angolo è ciò che impedisce a lxi di avere una pendenza ben definita nel punto x = O. Cerchiamo di scendere a patti con questa nozione.
6.2 Pendenze di funzioni Come è stato fatto notare in precedenza, il calcolo differenziale ha a che fare anche con il calcolo di «pendenze». Vediamo chiaramente dal grafico di jxj, mostrato nella fig. 6.2a, che non vi è un'unica pendenza all'origine, là [6.1] Dimostratelo (ignorando x = O). 105
LA STRADA CHE PORTA ALLA REALTÀ
dove si trova il nostro scomodo angolo. In qualunque altro punto la pendenza è ben definita, ma non all'origine. È a causa di questo problema all'origine che diciamo che lxl non è derivabile all'origine o, in altri termini, che qui non è liscia. La funzione x2, invece, ha dovunque una pendenza perfettamente ben definita, come illustrato nella fig. 6.2b. In effetti, la funzione x 2 è derivabile ovunque. La situazione con 0(x), come è illustrata nella fig. 6.2c, è persino peggiore di quella di lxi- Si noti che 0(x) fa uno spiacevole «salto» all'origine (x = O). Diciamo che 0(x) è discontinua all'origine; mentre entrambe le funzioni x 2 e lxl sono ovunque continue. eimpaccio di lxl all'origine non è dovuto a un difetto di continuità, ma a una mancanza di derivabilità. (Anche se la mancanza di continuità e di liscezza sono cose diverse, esse sono però concetti realmente collegati tra loro, come vedremo tra breve.) Nessuna di queste due manchevolezze sarebbe presumibilmente piaciuta a Euler ed entrambe sembrano fornire evidenti motivi per ritenere che lxl e 0(x) non siano funzioni «decorose». Ma prendiamo ora in esame le due funzioni illustrate nella fig. 6.3. La prima, x 3, sarebbe accettabile secondo ogni criterio; ma cosa dire della seconda, che può essere definita dall'espressione xlxl e che illustra la funzione che è x 2, quando x non è negativo, e - x 2 quando x è negativo? I due grafici, a guardarli, sembrano abbastanza simili l'uno all'altro e certamente «lisci». In effetti, hanno entrambi un valore perfettamente definito per la «pendenza» all'origine, e precisamente «zero» (che significa che qui le curve hanno una tangente orizzontale) e sono derivabili ovunque, nel significato più diretto della parola. Tuttavia, certamente non sembra che xlxl sia quella «bella» specie di funzione che sarebbe piaciuta a Euler. Una cosa «sbagliata» in xlxl è che non ha una curvatura ben definita al1'origine, essendo la nozione di curvatura certamente qualcosa di cui il calcolo differenziale si occupa. In effetti, la «curvatura» è qualcosa che implica quelle che sono chiamate «derivate seconde», il che significa eseguire due
y y =xlxl
X
(a)
(b)
Fig. 6.3 - I grafici di (a) x 3 e di (b) xlxl (cioè, x 2 sex 2 O e -x 2 sex< O). 106
Il calcolo infinitesimale nel campo reale
volte la derivazione. In questo caso, diciamo che la funzione xlxl non è derivabile due volte all'origine. Tratteremo le derivate seconde e quelle di ordine più elevato in §6.3. Per cominciare a capire questi concetti, dovremo vedere che cosa fa realmente l'operazione di derivazione; a questo scopo, abbiamo bisogno di sapere come si misura una pendenza. Ciò è illustrato nella fig. 6.4, in cui è illustrata una funzione puttosto rappresentativa che chiamerò f(x). La curva nella fig. 6.4a rappresenta la relazione y = f(x), dove il valore della coordinata y misura l'altezza, mentre x misura lo spostamento orizzontale, come avviene di solito in una descrizione cartesiana. Ho indicato la pendenza della curva a un particolare punto p come l'incremento della coordinata y diviso per l'incremento della coordinata x quando ci muoviamo lungo la retta tangente alla curva, che la tocca al punto p. (La definizione tecnica di «retta tangente» dipende dagli opportuni procedimenti di passaggio al limite, ma qui il mio scopo non è di fornire questi dettagli tecnici. Spero che il lettore troverà le mie descrizioni intuitive adeguate per i nostri scopi immediati.)3 La notazione standard per il valore di questa pendenza è dy/dx (si dice "dy su dx"). Possiamo pensare che «dy» sia un incremento molto piccolo del valore di y lungo la curva e che «dx» sia il corrispondente piccolissimo aumento del valore dix. (Qui l'esattezza tecnica ci richiederebbe di-passare al «limite», quando ciascuno di questi minuscoli incrementi si riduce a zero.) Possiamo ora prendere in esame un'altra curva che riporta (rispetto a x) questa pendenza per ciascun punto p, per le varie possibili scelte della coordinata x; vedi fig. 6.4b. Sto ancora impiegando una descrizione cartesiana, ma questa volta sull'asse verticale viene riportato il valore di dy/dx, invece di quello di y. Lo spostamento orizzontale è ancora misurato da x. La funzione che viene qua plottata è comunemente chiamata!' (x) e possiamo scrivere dy/dx = f' (x). Chiamiamo dy/dx la derivata di y rispetto a x, e diciamo che la funzionef'(x) è la derivata dif(x). 4
6.3 Derivate di ordine superiore - Funzioni di classe C00 Vediamo ora quello che succede quando deriviamo una seconda volta. Ciò significa che ora osserviamo la funzione pendenza per la nuova curva della fig. 6.4b, che riporta u = f'(x), dove usta al posto di dy/dx. Nella fig. 6.4c ho riportato questa funzione pendenza del «secondo ordine», che è il grafico di du/dx rispetto a x, così come ho fatto sopra per dy/dx, cosicché il valore di du/dx ci dà la pendenza della seconda curva u = f'(x). Otteniamo così quella che viene chiamata la derivata seconda della funzione originariaf(x); questa è comunemente indicata conf" (x). Quando in du/dx sostituiamo u con dyldx, otteniamo la derivata seconda di y rispetto a x, che (in modo leggermente illogico) viene scritta d2 y/dx2 ( e pronunciata «di due y su dx al quadrato»). 107
LA STRADA CHE PORTA ALLA REALTÀ
y
pendenza:~
(a) u
X
u = f'(x)
(b)
(e)
Fig. 6.4 - I grafici cartesiani di (a) y = f(x), (b) la derivata u = f'(x) (= dy/dx), e (c) la derivata seconda f" (x) = d2y/d.2. (Si noti che f(x) ha tangente orizzontale dove f' (x) incontra l'asse delle x e ha un punto di flesso dovef"(x) incontra questo asse.) 108
Il calcolo infinitesimale nel campo reale
Si noti che i valori dix dove la funzione originaria ha tangente orizzontale sono proprio quelli in cui/' (x) incontra l'asse x (cioè dove dy/dx si annulla); questi sono anche i punti dovef(x) assume un massimo o un minimo (locali). Questa è una cosa importante quando siamo interessati a trovare i valori massimi e minimi (locali) di una funzione. Cosa dire dei punti dove la derivata seconda/" (x) incontra l'asse x? Questi si trovano dove si annulla la curvatura dij(x). Questi punti si trovano, in generale, dove la direzione in cui la curva «piega» cambia da un lato della curva all'altro; questi punti si chiamano punti d'inflessione. In effetti, non sarebbe esatto dire chef"(x) «misura» realmente la curvatura della curva definita day = f(x ), in generale; la curvatura effettiva è data da un' espressione 5 più complicata di/" (x), ma che implicaf"(x) e che si annulla quandof"(x) si annulla. Consideriamo adesso le due funzioni dall'aspetto (superficialmente) simile x 3 e xix!, prima esaminate. In fig. 6.5a, b, c ho plottato x 3 e le sue derivate, prima e seconda, come ho fatto con la funzionef(x) nella fig. 6.4, e in fig. 6.5d, e, fho fatto la stessa cosa con xix!. Nel caso di x 3, vediamo che non vi sono problemi di continuità o di liscezza per entrambe le derivate, prima
y = x3
(a)
y = 6x
(b)
(e)
y = xlxl
(d)
y = 2+4B(x)
(e)
(f)
Fig. 6.5 - (a), (b ), (c) I grafici di x3, della sua derivata prima 3x2 e della sua derivata seconda 6x, rispettivamente. (d), (e), (f) I grafici di xix!, della sua derivata prima 21xl e della sua derivata seconda - 2 + 40(x), rispettivamente. 109
LA STRADA CHE PORTA ALLA REALTÀ
o seconda. In effetti, la derivata prima è 3x 2 e quella seconda è 6x; nessuna delle due avrebbe dato a Euler la minima preoccupazione. (Vedremo tra poco come ottenere queste espressioni esplicite.) Nel caso di xlxl, tuttavia, troviamo qualcosa di molto simile «all'angolo» della fig. 6.2a per la derivata prima e un comportamento da «funzione a gradino» per la derivata seconda, molto simile a fig. 6.2c. Abbiamo un difetto di liscezza per la derivata prima e un difetto di continuità per quella seconda. A Euler questa cosa non avrebbe per nulla fatto piacere. La derivata prima è, in effetti, 2lxl e quella seconda - 2 + 40(x). (I miei lettori più pignoli potrebbero lamentarsi perché non avrei dovuto con tanta disinvoltura scrivere una «derivata» per 2lxl, che non è realmente derivabile all'origine. Questo è vero, ma è soltanto un cavillo: una giustificazione completa in proposito può essere ottenuta usando le nozioni che saranno introdotte alla fine del capitolo 9.) Possiamo facilmente immaginare che possano essere costruite funzioni per cui simili difetti di liscezza o di continuità non si mostrano fino a che non sia stato fatto un grande numero di derivazioni. In effetti, funzioni della forma x"lxl, dove n è un numero intero positivo, grande a piacere, vanno bene per questo scopo. La terminologia matematica in questi casi asserisce che la funzione/(x) è di classe C", se può essere derivata n volte (in ciascun punto del suo dominio) e l'ennesima derivata è continua. 6 La funzione x"lxl è effettivamente di classe C", ma non di classe C" + 1 ali' origine. Quanto dovrebbe essere grande n per soddisfare Euler? Sembra chiaro che il matematico non si sarebbe accontentato di qualsiasi particolare valore di n; qualsiasi funzione per bene che riscuoterebbe l'approvazione di Euler dovrebbe poter essere differenziata tante volte quante vogliamo. A questo fine, i matematici dicono che una funzione è di classe C00 se è di classe C 11 per ogni intero positivo n. Per dirlo in un'altra maniera, una funzione di classe C00 deve essere differenziabile tante volte quante vogliamo. Presumiamo che la nozione di Euler di una funzione avrebbe richiesto qualcosa di analogo a una funzione di classe C00 • Ci possiamo immaginare che si sarebbe per lo meno aspettato che le sue funzioni fossero di classe C 00 nella maggior parte dei punti del loro dominio. Ma cosa possiamo dire della funzione lix? (Vedi fig. 6.6.) Questa non è certamente di classe C 00 all'origine; non è neppure definita all'origine, nel senso moderno di funzione. Il nostro Euler, tuttavia, l'avrebbe certamente accettata come «funzione» decente, nonostante questo problema. Dopo tutto, vi è per essa una semplice formula dall'aspetto naturale. Ci si può immaginare che Euler non si sarebbe preoccupato più di tanto se le sue funzioni non fossero state di classe C 00 in ogni punto del loro dominio (supponendo che si sarebbe preoccupato per il «dominio»). Forse non avrebbe importanza se le cose andassero male in un punto strano; ma lxi e 0(x) vanno male allo stesso «punto strano» di lix. Sembra che, a dispetto di tutti i nostri sforzi, non abbiamo ancora afferrato la nozione «euleriana» di funzione per cui ci siamo impegnati. 110
Il calcolo infinitesima/e nel campo reale
y
Fig. 6.6 - Il grafico di ~. X
Prendiamo in esame un altro esempio. Consideriamo la funzione h(x), definita dalle regole h(x) ={~-lix
sex ::;;o, sex>O.
Il grafico di questa funzione è raffigurato nella fig. 6.7. Questa ha certamente l'aspetto di una funzione liscia. In effetti, è molto liscia; è di classe C00 nell'intero dominio dei numeri reali. (La dimostrazione di questo fatto si esegue nei primi corsi universitari di matematica. Io stesso ricordo di aver dovuto affrontare questa prova.[6•2l) Si può certamente immaginare che, a dispetto di questa estrema liscezza, Euler avrebbe storto il naso dinanzi a una funzione definita in questo modo. Chiaramente non è proprio una «unica funzione», nel senso euleriano; sono «due funzioni incollate assieme», non importa quanto lavoro sia
y
-l;x
y=e
y=O X
Fig. 6. 7 - Il grafico di y = h(x) (= O sex :s; O e = e- 11x sex> O), che è di classe C
00
•
[6.2) Se avete la necessaria preparazione, cercate di dimostrare questo concetto.
11 I
LA STRADA CHE PORTA ALLA REALTÀ
stato fatto per rendere liscio il punto d'intoppo all'origine. Per Euler, invece, la funzione ¾è proprio una funzione unica, nonostante il fatto che sia separata in due pezzi da un orribile «spuntone» all'origine, dove non è neppure continua, per non parlare di liscezza (fig. 6.6). La funzione h(x), per il nostro Euler, non sarebbe veramente migliore di lxi o di 0(x); in quei casi, avevamo chiaramente «due funzioni incollate assieme», anche se con un lavoro d'incollatura molto più scadente (e, nel caso di 0(x), sembra addirittura che i pezzi incollati si siano del tutto separati).
6.4 La nozione «euleriana» di funzione? Come dobbiamo scendere a patti con questa concezione «euleriana» di avere proprio una singola funzione invece di un collage di funzioni separate? Come l'esempio di h(x) mostra chiaramente, l'appartenenza alla classe C00 non è abbastanza. Vi sono effettivamente due approcci completamente differenti per risolvere questo problema. Uno di questi usa i numeri complessi ed è ingannevolmente semplice da formulare, anche se molto importante per le sue implicazioni. Chiediamo semplicemente che la nostra funzione /(x) sia estensibile a una funzione/(x) della variabile complessaz, così che/(x) è liscia nel senso che si richiede soltanto che sia differenziabile una volta rispetto alla variabile complessa z. (Così/(x) è in senso complesso una specie di funzione di classe C 1.) Il fatto che sia necessario assumere solo questo è una straordinaria manifestazione di autentica magia. Se f(x) può essere derivata una volta rispetto al parametro complesso z, allora può essere differenziata tante volte quante vogliamo! Ritornerò sulla questione del calcolo complesso nel capitolo successivo. Ma vi è un altro approccio alla soluzione di questa «nozione euleriana di funzione» che usa solo i numeri reali e che implica il concetto di serie di potenze da noi incontrato in §2.5. (Una delle cose in cui Euler era veramente un maestro era la manipolazione di serie di potenze.) Sarà utile considerare, in questa sezione, la questione delle serie di potenze, prima di ritornare al problema della differenziabilità complessa. Il fatto che, localmente, la differenziabilità complessa si riveli essere equivalente alla validità degli sviluppi in serie di potenze è una delle cose veramente grandi della magia dei numeri complessi. Tratterò tutti questi argomenti al momento debito, ma per ora rimaniamo con le funzioni di numeri reali. Supponiamo che qualche funzione.fi:x) abbia effettivamente una rappresentazione in serie di potenze:
Vi sono dei metodi per trovare, da/(x), i coefficienti a0 , al' a2 , a3 , a4 , ••• Affinché un simile sviluppo esista, è necessario (anche se non sufficiente, come vedremo tra breve) che/(x) sia una funzione di classe C00 , così che avremo nuove 112
Il calcolo infinitesimale nel campo reale
funzioni/'(x),f"(.x),f 111 (.x),f1111 (x), ... ecc., che sono la prima, seconda, terza, quarta, eccetera derivata di.flx), rispettivamente. In realtà, saremo interessati ai valori di queste funzioni soltanto all'origine (x = O) e avremo quindi bisogno che f(x) sia di classe C00 soltanto in quel punto. Il risultato (qualche volta chiamato serie di Maclaurin )7 è che, se f(x) ha un simile sviluppo in serie di potenze, allora[6.31
(Si rammenti da §5.3 che n! = 1 x 2 x ... x n.) Ma cosa possiamo dire del procedimento inverso? Se i coefficienti a sono dati in questo modo, ne consegue che la somma ci dia effettivamente/(x) (in qualche intervallo racchiudente l'origine)? Ritorniamo alla nostra h(x) apparentemente senza giunture. Possiamo forse individuare un difetto al punto di giunzione (x = O) usando questa idea. Tentiamo di vedere se h(x) ha uno sviluppo in serie di potenze. Prendendo, nella formula considerata sopra,f(x) = h(x), esaminiamo i vari coefficienti a0 , al' a2, a 3, a4, ••• , notando che si devono tutti annullare, perché la serie deve accordarsi con il valore h(x) = Otutte le volte che x è alla sinistra dell'origine. In realtà, troviamo che si annullano tutti anche per e- 11X, che è fondamentalmente il motivo per cui h(x) è di classe C 00 all'origine, dovendosi raccordare l'una all'altra tutte le derivate dai due lati. Ma questo ci dice anche che la serie di potenze non può assolutamente funzionare, perché tutti i termini sono zero (vedi esercizio 6.1) e non possono quindi dare come somma e- 11x. Vi è così un difetto al punto di giunzione x = O: la funzione h(x) non può essere espressa come una serie di potenze. Diciamo che h(x) non è analitica nel punto x = O. Nella discussione precedente, mi sono realmente riferito a quello che sarebbe chiamato uno sviluppo in serie di potenze attorno ali'origine. Un analogo discorso vale per qualsiasi altro punto del dominio reale della funzione; ma allora dobbiamo «traslare l'origine» in qualche altro punto particolare, definito dal numero reale p in questo dominio, il che significa rimpiazzare x con x - p nello sviluppo in serie di potenze, ottenendo: f ( x) = a 0 + a1( x - p) + a 2 ( x - p
dove adesso a = f(p) a O
,
= I
)2 + a3 ( x - p )3 +... ,
, ,, ,, , f (p) a = f (p) a = f (p)
l!
•
2
2!
'
3
3!
Questo è noto come sviluppo in serie di potenze intorno a p. La funzione f(x) è detta analitica in p, se può essere espressa come una simile serie di potenze in qualche intervallo racchiudente il punto x = p. Se f(x) è analitica in tutti i punti (6.3] Dimostratelo, usando le regole date verso la fine della sezione. 113
LA STRADA CHE PORTA ALLA REALTÀ
del suo dominio, diciamo che è una/unzione analitica o, in modo equivalente, che è una funzione di classe ero. Le funzioni analitiche sono persino «più lisce» delle funzioni di classe C00 • Inoltre, possiedono anche la proprietà per cui non è possibile «cavarsela» incollando assieme due funzioni analitiche «differenti», come negli esempi 0(x), lxi, xl.xl, x"lxl, o h(x) dati sopra. Euler sarebbe stato soddisfatto delle funzioni analitiche. Sono davvero funzioni «perbene»! Tutte queste serie di potenze sono, però, elementi poco maneggevoli da trattare, persino con la sola immaginazione. Il modo «complesso» di osservare le cose si rivela enormemente più economico; fornisce, inoltre, una maggiore profondità di comprensione. La funzione per esempio, non è analitica nel punto x = O; tuttavia, è ancora una «funzione unica»J6.4l La «filosofia delle serie di potenze» non ci dice direttamente questo; ma, dal punto di vista dei numeri complessi, ½è chiaramente una funzione unica, come vedremo.
½,
6.5 Le regole di derivazione Prima di discutere questi problemi, sarà utile dire qualcosa delle meravigliose regole che il calcolo differenziale ci offre: regole che ci permettono di derivare funzioni quasi senza pensarci, ma solo dopo mesi di pratica, naturalmente! Queste regole ci offrono la possibilità di vedere come scrivere direttamente la derivata di molte funzioni, in particolare quando sono rappresentate in termini di serie di potenze. Si rammenti che prima ho fatto notare di sfuggita che la derivata di x 3 è 2 3x • Questo è un caso particolare di una formula semplice, ma importante: la derivata di xn è nxn - 1, che possiamo scrivere
d(x") --=nxn-l. dx (La spiegazione della validità di questa formula ci distrarrebbe troppo; non è realmente difficile da dimostrare e il lettore interessato può trovare tutto il necessario in qualsiasi testo elementare di calcolo infinitesimale. 8 Per inciso, non occorre che n sia un intero.) Possiamo anche esprimere9 questa equazione ("moltiplicandola per dx") nella conveniente formula: d(xn) = nxn- 1 dx. Non abbiamo bisogno di conoscere molto di più per quanto riguarda la differenziazione delle serie di potenze. Vi sono fondamentalmente altre due regole. La prima è che la derivata di una somma di funzioni è la somma delle derivate delle funzioni:
d[/(x) + g(x)] = d/(x) + dg(x).
[6.4] Considerate la "funzione unica" e- 11x'. Dimostrate che è di classe C00, ma non è analitica ali' origine. 114
Il calcolo infinitesimale nel campo reale
Questo è poi esteso a una somma di qualunque numero finito di funzioni. 10 La seconda è che la derivata di una costante moltiplicata per una funzione è quella costante moltiplicata per la derivata di quella funzione: d{af(x)} = a df(x). Con il termine «costante» intendo un numero che non varia al variare dix. I coefficienti a 0 , a 1, a 2, a 3, ... nella serie di potenze sono costanti. Con queste regole possiamo differenziare direttamente qualunque serie di potenze.l6•5l Un altro modo di indicare che a è una costante è scrivere
da=O. Tenendo in mente tutto ciò, troviamo che la regola appena data sopra è realmente un caso speciale (con g(x) = a) della «legge di Leibniz»: d{f(x) g(x)} = f(x) dg(x) + g(x) df(x) (il fatto che d(x")/dx = nx" 1, per qualsiasi numero naturale n, può anche essere ottenuto dalla legge di Leibniz[6-6l). Un'altra regola utile è la seguente: d{f(g(x))} = f'(g(x)) g'(x) dx. Dalle ultime due e dalla prima formula, ponendo f(x )[g(x) J- 1 nella legge di Leibniz, possiamo dedurre[ 6-7l che
d(f(x)) = g(x)df(x)- f(x) dg(x). g(x) g(x) 2 Armati di queste poche regole (e con anni e anni di pratica), si può diventare «esperti in differenziazione» senza bisogno di avere una vera comprensione del perché queste regole funzionino! Questo è il potere di un buon sistema di calcolo.[6-81 Inoltre, con la conoscenza delle derivate di poche funzioni speciali,[6·91 si può persino diventare qualcosa più di un esperto. Affinché il lettore non addetto ai lavori possa immediatamente diventare un «membro» del club degli esperti differenziatori, lasciatemi elencare i principali esempi:[6-101, 11
[6.5] Usando la serie di potenze per e' data in §5.3, dimostrate che de'= e b, i segni andrebbero invertiti. 117
LA STRADA CHE PORTA ALLA REALTÀ
g
g(b)
S
g(a)
f'
a
X
I I
I I I I I X
Fig. 6.9 - Considerate b > a per un valore molto piccolo. Nella figura in basso, l'area di una striscia molto sottile tra le rette x = a, x = b è essenzialmente il prodotto della larghezza della striscia b - a per la sua altezza (dall'asse x alla curva). Questa altezza è la pendenza della curva in alto, per cui l'area della striscia è tale pendenza per la larghezza della striscia, che è la quantità di cui la curva in cima sale nel passaggio da a a b, cioè g(b)- g(a). Sommando molte strisce sottili, troviamo che l'area di una striscia larga sotto la curva in basso è il corrispondente ammontare della salita della curva in cima.
Nella fig. 6.9 ho tentato di rendere credibile, in modo intuitivo, il perché vi sia questa relazione inversa tra pendenze e aree. Immaginiamo che b sia di pochissimo più grande di a; allora l'area da considerare, nel disegno in basso, è quella della striscia molto sottile limitata dalle rette x = a ex= b, molto vicine tra loro. La misura di quest'area è sostanzialmente il prodotto della minuscola ampiezza della striscia (vale a dire, b- a) per la sua altezza (dall'asse x fino alla curva). Ma si suppone che l'altezza della striscia misuri la pendenza della curva in alto in quel punto. Quindi, l'area della striscia è questa pendenza moltiplicata per la larghezza della striscia; ma la pendenza della curva in alto moltiplicata per la larghezza della striscia è la quantità di cui cresce la curva in alto passando da a a b, è cioè la differenza g(b)- g(a). In questo modo, per strisce molto strette, l'area è davvero misurata da questa differenza. Le strisce più ampie sono formate dall'unione di grandi numeri di strisce strette; otteniamo quindi la loro area misurando l'innalzamento della curva in alto in tutto l'intervallo. Vi è un punto significativo che qui dovrei mettere in evidenza. Nel passaggio dalla curva in basso a quella in alto, non vi è unicità su quanto in alto debba essere posta la curva superiore. Ci interessiamo soltanto alle differenze tra le altezze della curva in alto, cosicché la traslazione dell'intera curva in su o in giù non fa nessuna differenza. Ciò risulta chiaramente anche dall'interpretazione in termini di «pendenza», poiché la pendenza in punti diversi della curva in alto sarà proprio la stessa di prima, sia nel caso di traslazione verso l'alto che in quello di traslazione verso il basso. Dal punto di 118
Il calcolo infinitesimale nel campo reale
vista del calcolo differenziale, ciò significa che se aggiungiamo una costante Ca g(x) la funzione risultante ha ancora come derivataf(x): d(g(x) + C) = dg(x) + dC = f(x) dx+ O= f(x) dx. La funzione g(x), o allo stesso modo g(x) + C, dove C è una costante arbitraria, è chiamata un integrale indefinito dif(x), e possiamo scrivere
ff(x) dx =g(x) + cost. Questo è soltanto un altro modo di esprimere la relazione d[g(x) + cost] = f(x)dx, cosicché possiamo pensare che il segno «f» sia proprio l'inverso del simbolo «d». Se vogliamo calcolare l'area compresa tra x = a ex= b, allora vogliamo quello che è chiamato l'integrale definito, che possiamo scrivere come
J: f(x)dx= g(b)-g(a). Se conosciamo la funzionef(x) e desideriamo ottenere il suo integrale g(x), non abbiamo quasi nessuna regola diretta per ottenerlo, diversamente da quanto avviene per la differenziazione. Si conosce una gran quantità di trucchi, molti dei quali possono essere trovati in comuni manuali o in programmi per computer, ma non sono sufficienti per trattare tutti i casi. In effetti, spesso la famiglia delle funzioni esplicite standard, precedentemente in uso, deve essere ampliata e devono essere «inventate» nuove funzioni per esprimere i risultati dell'integrazione. In realtà abbiamo già visto questo negli esempi speciali mostrati precedentemente. Supponiamo di conoscere soltanto le funzioni costituite da combinazioni di potenze dix. Data una generica potenza xn, possiamo integrarla ottenendo x" + 1/(n + 1). (Ciò significa impiegare la formula di sopra, in §6.5, con n + 1 al posto di n: d(x" + 1)/dx = (n + 1)xn.) Tutto funziona a meraviglia finché non abbiamo a che fare con n = - 1; in questo caso, infatti, il presunto risultato x" + 1/(n + 1) ha zero al denominatore e quindi non può funzionare. Come possiamo integrare x- 1? Ebbene, con nostra grandissima fortuna, possiamo notare che nella nostra lista in §6.5 c'è la formula d(log x) = .r 1dx. Così la risposta è log x + cost. Questa volta siamo stati fortunati! Già in precedenza la funzione logaritmica era stata studiata per un motivo diverso, scoprendo così alcune delle sue proprietà. Ma in altre occasioni, potrebbe accadere che non vi sia alcuna funzione già nota con cui poter esprimere il risultato di un'integrazione. In effetti, gli integrali offrono spesso un modo appropriato per definire nuove funzioni. È in questo senso che l'integrazione esplicita risulta «difficile». D'altra parte, se non siamo così interessati a espressioni esplicite, ma ci preoccupiamo di questioni di esistenza di funzioni che siano le derivate o gli integrali di date funzioni, allora le cose sono del tutto diverse. In questo caso l'integrazione è l'operazione che funziona senza complicazioni, mentre è 119
LA STRADA CHE PORTA ALLA REALTÀ
la differenziazione a causare problemi. La stessa cosa avviene quando si eseguono queste operazioni partendo da dati numerici. Il problema fondamentale con la differenziazione è che dipende molto criticamente dai minuti dettagli della funzione che deve essere differenziata. Ciò può rappresentare un problema se non abbiamo un'espressione esplicita per questa funzione. L'integrazione invece è relativamente insensibile a tali questioni, poiché riguarda soprattutto la natura globale della funzione da integrare. In effetti, qualunque funzione continua (una funzione di classe C0) il cui dominio è un intervallo «chiuso» a $ x $ b può essere integrata, 12 essendo il risultato una funzione di classe C 1• Questa può ancora essere integrata, essendo il risultato una funzione di classe C 2, che a sua volta può essere di nuovo integrata dando una funzione di classe C 3, e così via. L'integrazione rende le funzioni sempre più lisce e ci consente di proseguire indefinitamente. La differenziazione, d'altra parte, peggiora le cose e si può arrivare a un punto in cui la funzione risultante non è più «differenziabile». Vi sono, tuttavia, approcci a tali questioni che permettono anche al processo di differenziazione di essere proseguito indefinitamente. Ho già fatto alcuni accenni quando mi sono permesso di differenziare la funzione lxi per ottenere 0(x), anche se /xl non è «differenziabile». Potremmo tentare di proseguire e di differenziare anche 0(x), nonostante possieda una pendenza infinita all'origine. Il risultato coincide con la cosiddetta/unzione delta di Dirac, 13 un'entità di notevole importanza nella matematica della meccanica quantistica. In realtà la funzione delta non è affatto una funzione, nel senso attuale di «funzione» che applica domini in spazi target. La funzione delta non ha alcun «valore» all'origine (questo potrebbe essere infatti soltanto infinito). Eppure, la funzione delta acquista una precisa definizione matematica entro diverse e più ampie classi di entità matematiche, tra le quali le distribuzioni sono le più conosciute. A questo scopo, dobbiamo estendere la nostra nozione di funzioni di classe C11 a casi in cui n sia un intero negativo. Allora la funzione 0(x) è di classe c- 1 e la funzione delta è di classe c- 2 • Ogni volta che differenziamo, dobbiamo diminuire la classe di differenziabilità di un'unità (in altre parole, la classe diventa più negativa per un'unità). Apparentemente in questo modo ci allontaniamo sempre di più dalla nozione di «funzione perbene» di Euler, che in effetti non ha niente a che vedere con cose simili, se non per un fatto di utilità. Tuttavia, a tempo debito scopriremo che è proprio qui che i numeri complessi ci sbalordiscono con ironia, un'ironia che si esprime in una delle loro più grandi azioni magiche! Dovremo aspettare sino alla fine del capitolo 9 per scoprire di cosa si tratta, perché non è qualcosa che posso descrivere adeguatamente in questo momento. Il lettore deve avere pazienza ancora per un po', perché prima dovrò preparare il terreno, lastricandolo con altri ingredienti superbamente magici.
120
Il calcolo infinitesimale nel campo reale
Note 1. Sto qui compiendo un piccolo «abuso di notazione», poiché tecnicamente x 2,
2.
3. 4.
5. 6.
7.
8. 9.
1O.
11.
12. 13.
per esempio, denota il valore della funzione più che la funzione stessa. Questa applica x in x 2 e potrebbe essere denotata da x H> x 2, o da Àx [x2] secondo il calcolo lambda di Alonzo Church; vedi capitolo 2 di Penrose (1989). In questa sezione, accennerò spesso a quelle che sarebbero state le convinzioni di Euler riguardo alla nozione di funzione. Devo tuttavia chiarire che lo «Eulern a cui mi riferisco è, in realtà, una persona ipotetica o idealizzata. Non ho alcuna informazione diretta delle opinioni del vero Leonhard Euler, ma le opinioni che attribuisco al «mio» Euler potrebbero non essere in disaccordo con quelle del vero Euler. Per maggiori informazioni su di lui, vedi Boyer (1968); Thiele (1982); Dunham (1999). Per i dettagli, vedi Burkill (1962). In termini rigorosi, è la funzione!' che è la derivata della funzione_(, non il valore f'(x) dif(x); non possiamo ottenere il valore dif' in x semplicemente dal valore dif in x. Cioè,f"(x)/[1 + f'(x) 2]31 2 • In realtà, ciò implica che tutte le derivate fino all'ennesima inclusa devono essere continue, perché la definizione tecnica di derivabilità richiede la continuità. Lo sviluppo in serie di potenze intorno all'origine è tradizionalmente noto (con scarsa giustificazione storica) come serie di Maclaurin; lo sviluppo più generale intorno al punto p (vedi più avanti nella sezione) è attribuito a Brook Taylor (1685- 1731). Vedi Edwards e Penney (2002). Per il momento, trattate le espressioni seguenti formalmente, o se la cosa vi rende più felici «dividete di nuovo per dx» mentalmente. La notazione che sto qui impiegando è coerente con quella delle forme differenziali, che saranno trattate in §§12.3-6. Vi è, tuttavia, una sottigliezza tecnica circa l'applicazione di questa legge alla somma del numero infinito di termini di cui abbiamo bisogno per una serie di potenze. Questa sottigliezza può essere ignorata per valori dix rigorosamente all'interno del cerchio di convergenza; vedi §2.5. Vedi Priestly (2003). Si ricordi da §5 .1 che sin- 1, cos- 1, e tan- 1 sono le funzioni inverse di sin, cos e tan, rispettivamente. Quindi, sin(sin- 1x ) = x, eccetera. Dobbiamo tuttavia tenere a mente che queste funzioni inverse sono «funzioni a molti valori» e solitamente si selezionano i valori per cui - rc/2 ::S: sin- 1 x '.:S: rc/2, O ::S: cos- 1 x '.:S: 1C e rc/2 ::S: tan- 1 x < rc/2. La richiesta significativa per il dominio è che sia compatto; vedi§ 12.6. Gli intervalli finiti della retta reale che includono le loro estremità sono compatti. A quanto pare, anche Oliver Heaviside aveva concepito la «funzione delta» molti anni prima di Dirac.
CAPITOLO
7
CALCOLO INFINITESIMALE CON NUMERI COMPLESSI
7.1 Liscezza complessa, funzioni olomorfe Come dobbiamo intendere la nozione di differenziazione quando è applicata a una funzione complessa/(z)? Non è opportuno che io tratti tale questione in tutti i suoi dettagli,1 dato che non l'ho fatto nemmeno, in §6.2, per una funzione reale. Ma posso almeno provare a trasmettere l'essenza di ciò che vi è implicato. Le pagine che seguono rappresentano un abbozzo molto conciso dell'argomento essenziale per mostrare i risultati della differenziabilità complessa. In seguito mi diffonderò un po' di più su alcuni dei suoi sorprendenti ingredienti. Per la differenziazione complessa, richiediamo fondamentalmente che vi sia una nozione di «pendenza» della curva complessa w = f(z) in ogni punto z del dominio della funzione. (Sia la funzione/(z) che la variabile z possono ora assumere valori complessi.) Affinché questa nozione di «pendenza» abbia un significato coerente, quando muoviamo di poco la variabile z in diverse direzioni nel piano complesso della variabile z, è necessario che/(z) soddisfi due particolari equazioni, le cosiddette equazioni di Cauchy-Riemann, 2 che implicano le derivate delle parti reale e immaginaria dif(z) rispetto alle parti reale e immaginaria di z; vedi §10.5. Queste equazioni stabiliscono qualcosa di piuttosto notevole sull'integrazione complessa, qualcosa che ci permette di definire una nuova nozione di integrazione, chiamata integrazione lungo il contorno. Intermini di questa integrazione, può allora essere data una formula per l'ennesima derivata di/(z). In questo modo otteniamo gratuitamente tutte le derivate di ordine superiore, una volta che abbiamo la derivata prima. In seguito impieghiamo questa formula per ottenere i coefficienti di una proposta serie di Taylor per f(z), che dobbiamo dimostrare che converge effettivamente a/(z). Avendo ottenuto ciò, abbiamo un'espressione in serie di Taylor per f(z) che funziona all'interno di qualsiasi cerchio nel piano complesso z, in ogni punto del qualef(z) è definita e differenziabile. Nasce così il fatto magico per cui qualunque funzione complessa liscia è obbligatoriamente analitica! 122
Calcolo infinitesimale con numeri complessi
Non vi è così alcun problema, nell'analisi complessa, nel riconoscere le limitazioni dei «lavori d'incollatura» in certe funzioni di classe e= come la «h(x)» definita nel capitolo precedente. La potenza della liscezza complessa avrebbe sicuramente deliziato Euler. (Sfortunatamente per Leonhard Euler, la stupefacente potenza di questa liscezza complessa è stata capita troppo tardi, poiché è stata scoperta per la prima volta da Augustin Cauchy nel 1821, trentotto anni dopo la morte di Euler.) Vediamo che la liscezza complessa offre un modo molto più economico dell'esistenza di sviluppi in serie di potenze per esprimere quello che è richiesto per la nostra nozione «euleriana» di funzione. Ma vi è anche un altro vantaggio nell'osservare simili funzioni dal punto di vista complesso. Si ricordi la nostra fastidiosa «lix» che sembrava essere «proprio un'unica funzione», nonostante il fatto che la curva reale y = lix consistesse di due pezzi separati che non erano congiunti «analiticamente» tra loro attraverso valori reali di x. Dal punto di vista complesso, vediamo chiaramente che 1/z è davvero una singola funzione. L'unico punto dove la funzione «va male» nel piano complesso è l'origine z = O. Se rimuoviamo questo unico punto dal piano complesso, otteniamo ancora una regione connessa. La parte della retta reale per cui x < O è connessa alla parte per cui x > O attraverso il piano complesso. In questo modo, 1/z è davvero una funzione complessa connessa, il che è piuttosto differente dalla situazione nel caso reale. Le funzioni complesse che sono lisce (analitiche) in questo senso sono chiamate olomor.fè. Queste funzioni olomorfe giocheranno un ruolo fondamentale in molte delle nostre ulteriori considerazioni. Vedremo la loro importanza in relazione alle applicazioni conformi e alle superfici di Riemann nel capitolo 8, mentre nel capitolo 9 le vedremo in relazione alle serie di Fourier (fondamentali per la teoria delle vibrazioni). Svolgono anche un ruolo importante nella teoria dei quanti e nella teoria quantistica dei campi (come vedremo in §24.3 e §26.3). Sono anche fondamentali per alcuni approcci allo sviluppo di nuove teorie fisiche (in particolare la teoria dei twistor- vedi il capitolo 33 ma hanno anche una parte importante nella teoria delle stringhe; vedi §§31.5,11,12).
7.2 Integrazione lungo il contorno Sebbene questo non sia il posto per scendere nei dettagli degli argomenti matematici indicati in §7 .1, sarà comunque illuminante approfondire l' abbozzo di prima. In particolare sarà utile dare importanza all'integrazione lungo il contorno per cercare di far comprendere (almeno in parte) al lettore il modo in cui questa integrazione può essere impiegata per dimostrare quello che è necessario per le esigenze di §7.1. Per prima cosa ricordiamo la notazione per un integrale definito che è stata data, nel capitolo pre123
LA STRADA CHE PORTA ALLA REALTÀ
cedente, per una variabile reale x e pensiamo ora di applicarla a una variabile complessa z,
J: f(z)dz =g(b)-g(a),
doveg'(z) =f(z). Nel caso reale, l'integrale è preso da un punto a della retta reale fino a un altro punto b di quella retta. Lungo l'asse reale vi è un solo modo per andare da a ab. Pensiamo ora che questa sia una formula complessa; in questo caso, i due punti a e b sono punti del piano complesso, ma non vi è un unico percorso da a fino ab, in quanto potremmo tracciare un grandissimo numero di cammini connettenti a e b. Le equazioni di Cauchy-Riemann ci dicono che se eseguiamo l'integrazione lungo uno di questi cammini 3 otteniamo lo stesso risultato che può essere ottenuto lungo qualunque altro percorso mediante una deformazione continua entro il dominio della funzione. (Vedi fig. 7. I. Questa proprietà è una conseguenza di un caso semplice del «teorema fondamentale del calcolo differenziale esterno», descritto in§ 12.6.) Per alcune funzioni, come nel caso per 1/z, il dominio ha un «buco» (essendo il buco z = O, nel caso di 1/z) così che vi possono essere parecchi modi, sostanzialmente differenti, diandare da a a b. «Sostanzialmente differente» significa qui che un cammino non può essere continuamente deformato in qualunque altro cammino rimanendo nel dominio della funzione. In tali casi, il valore dell'integrale da a ab può dare un diverso risultato per i vari cammini. A questo punto dovrei fare un chiarimento (o meglio, una correzione): quando mi riferisco alla deformazione continua di un cammino in un altro, intendo ciò che i matematici chiamano deformazioni omologiche, non omotopiche. Nel caso di una deformazione omologica, è legittimo ~he parti di.èàmmiìiistcancellino l'uno con l'altro, purché queste parti siano percorse in direzioni opposte. (Vedi fig. 7.2 per un esempio di questo genere di deformazione ammissibile). Quando due cammini sono deformabili l'uno nell'altro in questo modo si dice che appartengono alla stessa classe di omologia. Le deformazioni omotopiche, al contrario, non consentono questo genere di cancellazione. I cammini defo1mabili l'uno nell'altro, senza che una simile cancellazione sia consentita,
Fig. 7.1- Cammini differenti da a a b. l;integrazione di una funzione olomorfa/lungo un certo cammino dà lo stesso risultato lungo qualunque altro cammino ottenibile da esso mediante una deformazione continua entro il dominio di f Per alcune funzioni il dominio ha un «buco» (per esempio, z = O per 1/z) che impedisce certe deformazioni, così che possono essere ottenuti risultati diversi. 124
Calcolo infinitesimale con numeri complessi
Fig. 7.2 - Con una deformazione omologica, parti dei cammini si cancellano l'uno con l'altro, se percorsi in direzioni opposte. Ciò dà origine qualche volta a loop separati.
appartengono alla stessa classe di omotopia. Le curve omotopiche sono sempre omologiche, ma non è necessariamente vero l'inverso. Sia l'omotopia che l'omologia hanno a che fare con l'equivalenza rispetto a movimenti continui; fanno così parte della topologia. Vedremo più avanti diversi aspetti della topologia che giocheranno ruoli importanti in altre aree. La funzione f(z) = 1/z è in effetti una funzione per cui risultati differenti sono ottenuti quando i cammini non sono omologici. Possiamo comprendere il motivo per cui questo avviene dalle nostre precedenti conoscenze sui logaritmi. Verso la fine del capitolo precedente è stato notato che log z è un integrale indefinito di 1/z. (In verità, questo è stato stabilito solo per una variabile reale x, ma lo stesso ragionamento che serve a ottenere il risultato nel caso reale serve anche nel caso complesso. Questo è fondamentalmente un principio generale, che si applica anche alle altre nostre formule esplicite.) Abbiamo quindi
bdz
fa
Z
= logb-loga.
Si ricordi però (vedi §5.3) che vi sono differenti «risultati» alternativi per un logaritmo complesso. E la questione è che possiamo passare con continuità da un risultato all'altro. Per illustrare questo punto, manteniamo a fisso e pennettiamo a b di variare. In effetti, facciamo fare a b un cerchio intorno all'origine in senso positivo (cioè antiormio ), prima di ritornare alla sua posizione originaria (vedi fig. 7 .3a). Si rammenti che (vedi sempre §5.3) la parte immaginaria di log b è semplicemente il suo argomento (cioè, l'angolo che b forma con l'asse reale positivo, misurato in senso positivo; vedi fig. 5.4b); questo argomento, nel corso di tale spostamento, aumenta esattamente di 2rc, così che troviamo che log b è aumentato di 2rci (vedi fig. 7.3b). In questo modo, il valore del nostro integrale è aumentato di 2rci ogni volta che il cammino su cui si integra si avvolge una volta di più (in senso positivo) intorno all'origine. Possiamo riformulare questo risultato in termini di contorni chiusi, la cui esistenza è una caratteristica particolare e potente dell'analisi complessa. 125
LA STRADA CHE PORTA ALLA REALTÀ
b
(a)
(e)
a
(b) a
(d)
•
Fig. 7.3 - (a) L'integrazione di z- 1dz da a ab dà log b- log a. (b) Mantenete a fisso e fate fare ab un giro intorno all'origine in senso antiorario, aumentando il risultato per log b di 2ni. (c) Ritornate poi indietro fino ad a lungo il cammino iniziale. (d) Quando la parte di cammino in comune da a è cancellata, ci rimane un integrale lungo un contorno chiuso antiormio pz~ 1 dz = 2ni.
Consideriamo la differenza tra il secondo e il primo di questi due cammini, ossia percorriamo dapprima il secondo e poi il primo nella direzione opposta (vedi fig. 7.3c). Consideriamo questa differenza in senso omologico, in modo da poter cancellare le porzioni «percorse due volte in sensi opposti» e sistemare il resto, in modo continuo. Il risultato è un cammino chiuso - o contorno-che fa proprio un giro attorno all'origine (vedi fig. 7.3d) e non si interessa della collocazione di a e b. Questo offre un esempio di integrale lungo un contorno (chiuso), che di solito viene scritto con il simbolo «g>», il cui valore è in questo esempiof7-1l
f ~ =2rci. Naturalmente, quando è usato questo simbolo, dobbiamo stare attenti aspecificare il percorso che viene seguito - o, piuttosto, quale classe di omologia di contorno venga impiegata. Se il nostro contorno si fosse avvolto due volte (in senso positivo), allora come risultato otterremmo 4rci. Se si fosse avvolto una volta attorno all'origine in senso opposto (cioè, in senso orario), allora come risultato avremmo - 2rci. È interessante che questa proprietà di ottenere un risultato non banale con un simile contorno chiuso dipenda in modo cruciale dalla molteplicità di valori del logaritmo complesso, una caratteristica che sarebbe potuta sembrare solo una [7.1] Spiegate perché pz"dz = O quando n è un intero diverso da - I. 126
Calcolo infinitesimale con numeri complessi
goffaggine nella definizione di logaritmo. Fra poco vedremo che questa non è solo una curiosità. In effetti, la potenza dell'analisi complessa dipende criticamente da ciò. Nei due paragrafi seguenti esporrò per sommi capi alcune delle sue implicazioni. Spero che i lettori non esperti di matematica possano ricavare concetti di valore dalla discussione, che credo possa trasmettere qualcosa di genuino e sorprendente nella natura del ragionamento matematico.
7.3 Serie di potenze dalla liscezza complessa I.;espressione sopra presentata è un caso particolare (per la funzione costante f(z) = 21ti) della famosaformula di Cauchy che esprime il valore di una funzione olomorfa all'origine in termini di un integrale lungo un contorno che circonda l'origine: 4
_1. ! f (z) dz = f (O). 2m1 z Qui,f(z) è olomorfa all'origine (in altre parole, è liscia in senso complesso in ogni parte di una regione qualsiasi racchiudente l'origine) e il contorno è un circuito qualsiasi che circonda l'origine, o potrebbe essere qualunque circuito omologo a quello, nel dominio della funzione con l'origine rimossa. In questo modo, notiamo che quello che la funzione fa all'origine è completamente fissato da quello che essa fa in un insieme di punti che circonda l'origine. (La formula di Cauchy è fondamentalmente una conseguenza delle equazioni di Cauchy-Riemann, assieme all'espressione precedente presa nel limite di piccoli circuiti; ma forse non è opportuno addentrarci nei dettagli.) Se invece di usare 1/z nella formula di Cauchy usiamo 1/z 11+1, dove n è un qualsiasi numero intero positivo, otteniamo una versione di «ordine maggiore» della formula di Cauchy, che genera in ultima analisi l'ennesima derivataj T'i;r6 è applicata a V induce una corrispondente trasformazione lineare sul prodotto tensoriale di sopra, data in forma esplicita da! 13 ·39l G:' T'f T" Q,J'. ...h' Q{.a.....hc I----,> ,._,-a···ù·c f'··· h' a'...c'· ('a'
Tutti questi indici richiedono buona vista e grande attenzione per controllare quello che viene sommato; per questo raccomando la notazione diagrammatica, che è più chiara, come è illustrato in fig. 13 .13. Vediamo che ciascun indice inferiore di Q::: si trasforma per mezzo della matrice inversa S = T- 1 (o piuttosto per mezzo di sr) come nel caso di Ya e ciascun indice superiore con T, come nel caso di .x". Ne consegue che anche lo spazio dei tensori di ordine su V è una rappresentazione di tJ, di dimensione np+q. È tuttavia probabile che queste rappresentazioni siano di tipo riducibile. Per illustrare questa situazione, esaminiamo il caso di un tensore Q"" di ordine Qualunque tensore di questo tipo può essere suddiviso nella sua parte simmetrica g.ab) e la sua parte antisimmetrica Q[abJ (vedi § 12. 7 e § 11.6):
m
rn.
Fig. 13.13 - La trasfo1mazione lineare x' ~ 1'117' applicata a x nello spazio vettoriale V (con Traffigurato da un triangolo bianco) si estende allo spazio duale V* con l'impiego della matrice inversa S = T- 1 (raffigurata da un triangolo nero) e poi agli spazi V*® ... ® V* ®V® ... ® V dei tensori Q di ordine[~]. È illustrato il caso p = 3 e q = 2, con Q mostrato come un ovale con tre braccia e due gambe Qa/de cx: sa' "Sh' hy,: c'T1 /Jl! e'Qa'b'c'd'e'_
[13.39] Dimostratelo. 272
Gruppi di simmetria
dove
La dimensione dello spazio simmetrico V+ è {n(n+l) mentre quella dello spazio antisimmetrico V_ è ½n(n-1) _[l 3AoJ Non è difficile vedere che, sotto l'azione della trasformazione x" ~ T"~, così che Q"b ~ T''JhdQcd, le parti simmetrica e antisimmetrica si trasformano in tensori che sono ancora, rispettivamente, simmetrici e antisimmetrici_l 13 AiJ Di conseguenza gli spazi V+ e V_ sono, ognuno per conto proprio, una rappresentazione di t;-. Scegliendo una base per V, in cui i primi ½n(n + 1) elementi base sono in V+ e i rimanenti ½n(n -1) sono in V_, la nostra rappresentazione può essere espressa in n2 x n 2 forma di matrice a blocchi
. l n(n-l)x l n( n-1), ' . l n(n+l)x I n( n+l) e B unamatnce dove A eunamatrìce 7 7 7 7 mentre le due O sono appropriati blocchi rettangolari di zeri. Una rappresentazione di questa forma è detta somma diretta delle rappresentazioni date dalla matrice A e dalla matrice B. Questa rappresentazione in termini di tensori di ordine [5] è quindi riducibile, in questo senso.C 13 A2J La nozione di «somma diretta» si estende anche a qualunque numero (forse infinito) di rappresentazioni più piccole. In effetti, per il termine «rappresentazione riducibile» vi è un significato più generale, vale a dire uno per cui vi è una scelta della base per la quale tutte le matrici della rappresentazione possono essere messe in una forma alquanto più complicata
dove A è p x p, B è q x q e C è p x q, con p, q 2 1 (per dati p e q). Si noti che, se tutte le matrici hanno questa forma, allora le matrici A e B sono ognuna una rappresentazione (più piccola) di t;-.l 13 A 3J Se le matrici C sono tutte zero, ritorniamo al caso precedente dove la rappresentazione è la somma diretta di due rappresentazioni più piccole. Una rappresentazione è detta irriducibile se non è riducibile ( con C pre[ 13 .40) Dimostratelo. [13.41] Spiegatelo. [13 .42) Mostrate che anche la rappresentazione con tensori di ordine [ \] è riducibile. Suggerimento: suddividete qualunque tensore di questo tipo in una parte «senza traccia» e in una parte «con traccia». [13.43] Confermatelo. 273
LA STRADA CHE PORTA ALLA REALTÀ
sente o non presente). Una rappresentazione è detta completamente riducibile se non otteniamo mai la situazione di sopra (con C diversa da zero), così che è una somma diretta di rappresentazioni irriducibili. Vi è un'importante classe di gruppi continui, noti come gruppi semisemplici. Questa classe, che è stata estensivamente studiata, include i gruppi semplici a cui. si è fatto riferimento in § 13 .2. I gruppi semisemplici compatti hanno la gradita proprietà che tutte le loro rappresentazioni sono completamente riducibili. (Vedi§ 12.6, fig. 12.13 per la definizione di «compatto».) È sufficiente studiare le rappresentazioni irriducibili di tali gruppi, poiché ogni rappresentazione è proprio una somma diretta di queste. In effetti, ogni rappresentazione irriducibile di un simile gruppo è di dimensione finita (questo non è vero per un gruppo semisemplice non compatto, dove possono esserci anche rappresentazioni non completamente riducibili). Che cos'è un gruppo semisemplice? Si ricordino le «costanti di struttura» Yip di § 13.6, che specificano le parentesi di Lie e definiscono la struttura locale del gruppo tJ.. Vi è una grandezza di considerevole importanza nota 16 come "' t d···' .f j... p·•· ,..
Quando applichiamo questa sostituzione a ò%, troviamo che le sue componenti rimangono completamente invariate,(1 3.461 mentre questo non avviene per gab· Inoltre, dopo una variazione generica delle coordinate di questo tipo le componenti gab saranno completamente differenti da gab (matrici inverse). Perciò, il motivo dei simboli addizionali gab e gab è semplicemente che essi possono soltanto rappresentare la stessa matrice di componenti come fa òb in tipi speciali di sistemi di coordinate (quelli «cartesiani») e, in generale, le componenti sono proprio diverse. Ciò ha un'importanza particolare per la relatività generale, dove normalmente i sistemi di coordinate non possono avere questa forma speciale (cartesiana). Dopo un generico cambiamento di coordinate, la matrice delle componenti gab può diventare più complicata, anche se non completamente generica. Mantiene la proprietà di simmetria tra a e b dando la cosiddetta matrice simmetrica. Ciò significa che la tabella quadrata delle componenti è simmetrica rispetto alla diagonale principale, cioè gT = g (usando la notazione di «trasposta» di §13.3). In termini della notazione con indici, questa simmetria è espressa in una di queste due forme equivalenti[I 3 A7J
gab = gba, gab = g6a, mentre la forma diagrammatica di queste relazioni è illustrata in fig. 13. l 5b. Che cosa si può dire sul procedimento inverso? Può qualsiasi matrice simmetrica n x n non singolare essere ridotta alla forma della matrice delle componenti della delta di Kronecker? Assolutamente no con una trasformazione lineare reale delle coordinate. Tutto quello che si può ottenere con una simile trasformazione è ridurre questa matrice in forma diagonale, con alcuni termini + 1 e alcuni termini - 1 lungo la diagonale principale. Il numero, p, di questi termini+ 1 e il numero, q, di termini- 1 formano un invariante, il che significa che non può essere cambiato con altre trasformazioni lineari reali. Questo invariante (p, q) è chiamato segnatura di g. (Qualche volta è p- q a prendere il nome di segnatura; altre volte si scrive semplicemente + ... + ... -, con il numero appropriato di ciascun segno.) In effetti, ciò funziona anche per una g singolare, ma allora abbiamo anche bisogno di qualche O lungo la diagonale principale e il numero di questi zeri entra a far parte della segnatura assieme a quelli di+ 1 e - 1. Se abbiamo soltanto valori+ 1, così che g non è singolare e q = O, diciamo che g è definita positiva. Una g non singolare per cui p = 1 e q -:f. O (o q = 1 e p ;f. O) è chiamata lorentziana, in onore del fisico olandese H. A. Lorentz ( 1853-1928), la cui opera è considerata una pietra miliare della teoria della relatività; vedi §§ 17.6-9 e §§ 18.1-3. [13.46] Perché? [13.47] Perché sono equivalenti? 277
LA STRADA CHE PORTA ALLA REALTÀ
Una caratterizzazione alternativa di una matrice A definita positiva, di notevole importanza in alcuni contesti (vedi §20:3, §24.3, §29.3), è che la matrice simmetrica reale A soddisfa la condizione xT Ax > O
per tutti gli x diversi da zero. Nella notazione con indici, questa diventa: è rimpiazzato da ~ (così che può essere xT Ax = O per qualche x diverso da zero). In circostanze appropriate, un tensore simmetrico non singolare di ordine [5] gab, è chiamato metrica, o anche pseudometrica, se non è definito positivo. Questa terminologia viene applicata se si utilizza la quantità ds, definita dal suo quadrato ds2 = gabdrdxh, quando ci fornisce una nozione di «distanza» lungo una curva. Vedremo in § 14. 7 come questa nozione si applica su varietà curve (vedi §10.2, §§12.1,2), mentre in §17.8 vedremo come essa, nel caso lorentziano, ci fornisca una misura di «distanza» che è realmente il tempo della teoria della relatività. Qualche volta facciamo riferimento alla grandezza I
jv/ =(gab vavb)2 come lunghezza del vettore v, nella notazione con indici di forma v". Ritorniamo alla definizione del gruppo ortogonale O(n). Questo è semplicemente il gruppo delle trasformazioni lineari a n dimensioni - chiamate trasformazioni ortogonali - che preservano una data metrica g definita positiva. Il fatto di «preservare» g significa che una trasformazione ortogonale T deve soddisfare la relazione
gabT"cJ1'd = gcd• Questo è un esempio della regola di trasformazione (attiva) di un tensore descritta in § 13. 7, applicata a gab (e vedi fig. 13 .17 per la forma diagrammatica di questa equazione). Un altro modo di esprimere ciò è affermare che la forma metrica ds2 del paragrafo precedente non è mutata dalle trasformazioni ortogonali. Potremmo, se volessimo, chiedere che il sistema di componenti gab sia effettivamente lo stesso di quello della delta di Kronecker (questo in effetti fornisce la definizione di 0(3) data in §§13.1,3), ma il gruppo risulta lo stesso 19 qualunque sia lagab (n x n) definita positiva che scegliamo_l 13 A9J
t
ortogonale s e f t =
n
Fig. 13.17 - Tè una trasformazione ortogonale se
gabJ11/Jl'd = gcd·
[13.48] Potete confermare questa caratterizzazione? [13.49] Spiegate perché.
278
Gruppi di simmetria
Con la particolare realizzazione delle componenti di gab come delta di Kronecker, le matrici che descrivono le trasformazioni ortogonali sono quelle che soddisfanol 13 ·50l
T- 1 = Tl, chiamate matrici ortogonali. Le matrici n x n ortogonali reali forniscono una realizzazione concreta del gruppo O(n). Per limitarci al gruppo SO(n), senza riflessioni, richiediamo che il determinante sia uguale all'unità:l 13 ·51 l det T= 1. Possiamo anche considerare i corrispondenti gruppi pseudo-ortogonali,
O(p, q) e SO(p, q), che sono ottenuti quando g, anche se non singolare, non è necessariamente definita positiva, avendo come segnatura (p,q). Il caso p
= 1, q = 3 (o l'equivalente p = 3 e q = 1), chiamato gruppo di Lorentz, gioca un ruolo fondamentale nella teoria della relatività, come già indicato in precedenza. Scopriremo anche (se ignoriamo le riflessioni temporali) che il gruppo di Lorentz è lo stesso del gruppo di simmetrie dello spazio iperbolico tridimensionale, descritto in §2. 7, e anche (se ignoriamo le riflessioni spaziali) del gruppo di simmetrie della sfera di Riemann, come viene realizzato dalle trasformazioni bilineari (Mobius) studiate in §8.2. Riprenderemo più avanti la spiegazione di questi fatti notevoli, che analizzeremo in dettaglio quando incontreremo la geometria di Minkowski dello spaziotempo della teoria della relatività speciale(§§ 18.4,5). In §33.2 vedremo che questi fatti hanno anche un importante significato per la teoria dei twistor. Quanto sono «differenti» i vari gruppi O(p, q), p + q = n, per un dato n? (I casi definiti positivo e lorentziano sono messi a confronto, per n = 2 e n = 3, in fig. 13.18.) Sono tutti strettamente collegati, poiché hanno tutti la stessa dimensione {n(n -1); rappresentano le forme reali del medesimo gruppo complesso O(n,C), la complessificazione di O(n). Questo gruppo complesso ha stessa definizione di O(n) (= O(n, IR)), ma sono ammesse anche trasformazioni lineari complesse. In effetti, anche se finora in questo capitolo ho formulato tutte le mie considerazioni in termini di trasformazioni lineari reali, vi è una teoria parallela dove «complesso» rimpiazza «reale» dappertutto. (In questo modo, le coordinate x" diventano complesse, così come gli elementi delle matrici.) La sola sostanziale differenza, rispetto a quello che è stato detto in precedenza, riguarda il concetto di segnatura. Vi sono trasformazioni lineari complesse delle coordinate che possono convertire un-1 in una realizzazione diagonale di gab in un+ 1 e viceversa,l 1352l co[13.50] Spiegatelo. Che cosa è r- 1 nei casi pseudo-ortogonali (definiti nel prossimo paragrafo)? [13.51] Spiegate perché questo è equivalente alla preservazione della forma di volume t:" .. ·"' cioè Ea ... c T; ... T~ = t:p ... r· Inoltre, perché è sufficiente la preservazione del suo segno? [13.52] Perché? 279
LA STRADA CHE PORTA ALLA REALTÀ
(a)
(b)
Fig. 13.18 - (a) Sono messi a confronto 0(2, O) e 0(1, 1). (b) Sono messi a confronto 0(3, O) e 0(1, 2), in ciascun caso è raffigurata la «sfera unitaria». Per 0(1, 2) (vedi §§2.4,5, §18.4) questa «sfera» è un piano iperbolico (o due sue copie).
sì che non possiamo avere una significativa nozione di segnatura. Il solo invariante20 di g, nel caso complesso, è quello che viene chiamato il suo rango, che è il numero di termini diversi da zero nella sua realizzazione diagonale. Per una g non singolare, il rango deve essere il massimo, cioè n. Quando è importante la differenza tra queste varie forme reali e quando non lo è? Questo può rappresentare un problema delicato, ma spesso i fisici sono piuttosto indifferenti alle distinzioni, anche se possono essere importanti. Il caso definito positivo possiede la virtù che il gruppo è compatto e gran parte della matematica è più facile in questa situazione (vedi §13.7). A volte vengono trasferiti avventatamente i risultati del caso compatto ai casi non compatti (p-:/:- O-:/:- q), ma spesso questo non è giustificato. (Per esempio, nel caso compatto ci si deve occupare solo di rappresentazioni che hanno dimensione finita, mentre nel caso non compatto si hanno rappresentazioni addizionali di dimensione infinita.) D'altra parte, vi sono altre situazioni in cui si possono ottenere notevoli risultati ignorando le distinzioni. (A tal proposito ricordiamo la scoperta di Lambert della formula, in termini di angoli, dell'area di un triangolo iperbolico, vedi §2.4. Lambert ottenne la sua formula permettendo alla sfera di avere un raggio immaginario: ciò è molto simile a un cambiamento di segnatura, che equivale a permettere ad alcune coordinate di avere valori immaginari. 280
Gruppi di simmetria
In §18.4, fig. 18.9, tenterò di dimostrare che l'approccio di Lambert alla geometria non euclidea è in realtà del tutto giustificabile.) Le differenti forme reali possibi~i di O(n, C) sono distinte da un certo insieme di disuguaglianze negli elementi di matrice (come det T> O). Una delle caratteristiche della teoria quantistica è che queste disuguaglianze sono spesso violate in processi fisici. Per esempio, in un certo senso grandezze immaginarie possono avere in meccanica quantistica un significato fisicamente reale, così che la distinzione tra segnature diverse può diventare sfuocata. Ma d'altra parte ho l'impressione che spesso i fisici siano poco attenti a questi argomenti, che per noi invece avranno notevole importanza quando prenderemo in esame molte teorie moderne (§28.9, §31.11, §32.3). Ne parleremo più avanti. Questo è il «problema spinoso» a cui ho accennato in § 11.2 !
13.9 Gruppi unitari Il gruppo O(n, C) ci fornisce un modo per generalizzare la nozione di «gruppo delle rotazioni» dai numeri reali a quelli complessi. Esiste però un altro modo che, in certi contesti, ha un'importanza persino maggiore: si tratta della nozione di gruppo unitario. Che cosa significa «unitario»? Il gruppo ortogonale si occupa della preservazione di una forma quadratica che possiamo scrivere, in modo equivalente, come ga,F'xh o xTgx. Per un gruppo unitario, usiamo trasformazioni lineari complesse che preservano invece la cosiddetta forma hermitiana (dal nome dell'importante matematico francese del diciannovesimo secolo Charles Hermite, 1822-1901 ). Che cos'è una forma hermitiana? Ritorniamo dapprima al caso ortogonale. Invece di una forma quadratica (in x), avremmo potuto egualmente usare la forma bilineare simmetrica (in x e y)
Questa nasce come caso particolare della definizione di «funzione multilineare» di un tensore data in § 12.8, quando viene applicata al tensore [61 g ( e ponendo y = x, ritroviamo la forma quadratica di sopra). La simmetria di g sarebbe allora espressa come g(x, y)
= g(y, x),
mentre la linearità rispetto alla seconda variabile y come g(x,y + w) = g(x,y)
+ g(x, w),
g(x, Ày)
= Àg(x,y).
Per la bilinearità, richiediamo anche la linearità rispetto alla prima variabile x, ma questa ora è una conseguenza della simmetria. 281
LA STRADA CHE PORTA ALLA REALTÀ
Una forma hermitiana h(x, y) soddisfa invece la simmetria hermitiana h(x,y) = h(y, x),
assieme alla linearità rispetto alla seconda variabile y: h(x,y + w)
= h(x,y) + h(x, w),
h(x, Ày)
= Àh(x,y).
La simmetria hermitiana implica ora la cosiddetta antilinearità rispetto alla prima variabile: h(x+ w,y) = h(x,y) + h(w,y),
h(Àx,y) = lh(x,y).
Mentre un gruppo ortogonale preserva una forma bilineare simmetrica (non singolare), le trasformazioni lineari complesse che preservano una forma unitaria non singolare ci danno un gruppo unitario. Che cosa fanno queste forme per noi? Una forma bilineare non singolare (non necessariamente simmetrica) g ci fornisce un mezzo per identificare lo spazio vettoriale V, a cui appartengono x e y, con lo spazio duale v•. In questo modo, se v appartiene a V, allora g(v, ) ci fornisce un'applicazione lineare su V, applicando l'elemento x di V sul numero g(v, x). In altre parole, g(v, ) è un elemento di V* (vedi §12.3). In notazione con indici, questo elemento di V* è il covettore v'1g b, che è scritto solitamente con la medesima lettera ma con l'indice abbassato (vedi anche §14.7) per mezzo di gab 0
Vb
= ifgab·
I:inversa di questa operazione è realizzata con l'innalzamento dell'indice di va con l'impiego del tensore metrico [~] inverso gab: v'1 = ~Vb.
Abbiamo bisogno dell'analogo di tutto questo nel caso hermitiano. Come prima, ciascun elemento v dello spazio vettoriale V ci fornisce un elemento h(v, ) dello spazio duale v•. Vi è però una differenza: h(v, ) dipende antilinearmente da v, invece che linearmente. Si ha quindi, h(Àv, ) = Xh(v, ). Si può esprimere tutto questo in modo equivalente affermando che h(v, ) è lineare rispetto a v, essendo questa quantità vettoriale il «complesso coniugato» di v. Riteniamo che questi vettori complessi coniugati costituiscano uno spazio vettoriale distinto v. Questo punto di vista è particolarmente utile per la notazione con indici (astratti), dove è impiegato un diverso «alfabeto» di indici, vale a dire a', b', e', ... , per questi elementi complessi coniugati e sono proibite le contrazioni tra indici normali e accentati. I:operazione di coniugazione complessa scambia questi due tipi di indici. Nella notazione con indici, una forma hermitiana è rappresentata come una schiera di quantità ha'b con un indice (inferiore) di ciascun tipo, così che
282
Gruppi di simmetria
(dove xa' è il complesso coniugato di xa), poiché l' «hermiticità» viene espressa come
l;insieme di quantità ha'hci permette di abbassare o innalzare un indice, ma adesso cambia gli indici accentati in indici normali, e viceversa, così che ci rinvia al duale dello spazio complesso coniugato:
Per le operazioni inverse di queste - quando la forma hermitiana è supposta non singolare (vale a dire che la matrice delle componenti hab' non è singolare) - abbiamo bisogno dell'inversa hab' di h,/h
da cuil 13 -531 Si noti che tutti gli indici accentati possono essere eliminati usando h ,h ( e la corrispondente inversa ha"'), grazie alle relazioni sopra menzionate che possono essere applicate indice per indice a qualunque grandezza tensoriale. Lo spazio complesso coniugato è in tal modo «identificato» allo spazio duale invece di essere uno spazio del tutto distinto. l; operazione di «coniugazione complessa» - di solito chiamata coniugazione hermitiana - che incorpora questa identificazione con il duale nella nozione di coniugazione complessa (anche se non comunemente scritta nella notazione con indici) è di fondamentale importanza in meccanica quantistica e in molte altre aree della matematica e della fisica (come nella teoria dei twistor, vedi §33.5). Nella letteratura quantistica è spesso denotata da una daga «t», ma qualche volta da un asterisco «*». Personalmente preferisco l'asterisco (lo scriverò in grassetto), dato che è molto più usato nella letteratura matematica. l;asterisco è appropriato in questo contesto perché scambia i ruoli dello spazio vettoriale V e del suo duale V*. Un tensore complesso di ordine [~] (tutti gli indici accentati sono stati eliminati, come in precedenza) è applicato da* su un tensore di ordine [;;]. In questo modo, sotto l'azione di *, gli indici superiori diventano inferiori e gli indici inferiori diventano superiori. Quando è applicata agli scalari, l'operazione* è semplicemente la coniugazione complessa. l;operazione * è una nozione equivalente alla forma hermitiana h. La più familiare operazione di coniugazione hermitiana (che avviene quando le componenti ha'h sono delta di Kronecker) prende semplicemente 0
[13.53] Verificate queste relazioni, spiegando la coerenza della notazione hab'. 283
LA STRADA CHE PORTA ALLA REALTÀ
il complesso coniugato di ciascuna componente, riorganizzandole in modo da leggere gli indici superiori come inferiori e gli indici inferiori come superiori. Di conseguenza, la matrice delle componenti di una trasformazione lineare diventa la trasposta della sua complessa coniugata (conosciuta anche come trasposta coniugata della matrice), così che nel caso 2 x 2 abbiamo
Una matrice hermitiana è una matrice che è uguale alla sua coniugata hermitiana in questo senso. Questo concetto, e il più generale e astratto operatore hermitiano, sono di grande importanza nella teoria quantistica. Facciamo notare che * è antilineare nel senso che
(T+ U)* = T* + U*, (z1)* =zT*, quando è applicata a tensori Te U dello stesso ordine, essendo z un qualunque numero complesso. L'azione di * deve anche preservare i prodotti di tensori, ma a causa dell'inversione della posizione degli indici inverte l'ordine delle contrazioni; in particolare, quando * è applicata alle trasformazioni lineari (considerate come tensori con un indice superiore e uno inferiore), l'ordine della moltiplicazione è rovesciato:
(LM)* =M*L*. È molto comodo, nella notazione diagrammatica, raffigurare questa operazio-, ne di coniugazione come una riflessione in un piano orizzontale. Ciò scambia tra loro gli indici superiori e inferiori, come richiesto; vedi fig. 13 .19.
"'
i::
"'
:~
,, ,, i:: o -~
..i::
00
.a § u
s-?, T-t, ~~. f,t ('r, t> ! s•~?, + t Ji ST
specchio
specchio
=
T*,....,....
'
=T*S* ~ ~T)
'
Fig.13.19 - L'operazione di coniugazione hermitiana (*) raffigurata come riflessione in un piano orizzontale. Questa scambia «braccia» con «gambe» e inverte l'ordine di moltiplicazione: (ST)* = T*S*. È data l'espressione diagrammatica per il prodotto scalare hermitiano (vJw) = v*w, in modo che prendendo il suo complesso coniugato rifletterebbe il diagramma all'estrema destra. 284
Gruppi di simmetria
I.: operazione * ci permette di definire un prodotto scalare hermitiano tra due elementi ve w di V, e precisamente il prodotto scalare del covettore v• con il vettore w (le notazioni differenti sono utili in vari contesti): (v I w)
= v* • w = h(v, w)
(vedi fig. 13.19), e abbiamo (v I w) =(w I v).
Nel caso particolare w = v otteniamo la norma div, rispetto a*:
Il v Il= (v Iv). Possiamo scegliere una base (e 1, e2 , ... , e") per V, e allora le componenti ha'b in questa base sono semplicemente gli n 2 numeri complessi
che costituiscono gli elementi di una matrice hermitiana. La base (e 1, è chiamata pseudo-ortonormale, rispetto a *, se
... ,
e")
quando tutti i segni± sono+, cioè quando ciascun± è solo 1, la base è ortonormale. Si può sempre trovare una base pseudo-ortonormale, ma vi sono molte possibili scelte. Rispetto a una di queste basi, la matrice ha'b è diagonale, con solo 1 o - 1 lungo di essa. Il numero totale di 1 è sempre p, per un dato*, indipendentemente dalla particolare scelta della base, allo stesso modo il numero di - 1 è sempre q. Questo ci permette di definire la nozione invariante di segnatura (p, q) per l'operazione*· Se q = O, diciamo che * è definita positiva. In questo caso, 21 la norma di qualsiasi vettore diverso da zero è sempre positiva:P 3·54 l vi= O
implica
Il v Il > O.
Si noti che questa nozione di «definito positivo» generalizza al caso complesso quella data in§ 13.8. Una trasformazione lineare Tla cui inversa è T, così che
r-
1
= T*, cioè T T* =I= T* T,
[13.54] Dimostratelo.
285
LA STRADA CHE PORTA ALLA REALTÀ
è chiamata unitaria quando * è definita positiva, e pseudounitaria negli altri casi.l 13 551 Il termine «matrice unitaria» fa riferimento a una matrice T che soddisfa le relazioni di sopra quando * sta al posto della usuale operazione di trasposizione coniugata, così che r- 1 = T. Il gruppo delle trasformazioni unitarie in n dimensioni, o delle matrici unitarie (n x n), è chiamato gruppo unitario U(n). Più in generale, quando* ha segnatura (p, q), 22 otteniamo il gruppo pseudounitario U(p, q). Se le trasformazioni hanno determinante unità, otteniamo SU(n) e SU(p, q), rispettivamente. Le trasformazioni unitarie giocano un ruolo essenziale in meccanica quantistica ( e hanno grande importanza anche in molti contesti puramente matematici).
13.10 Gruppi simplettici Nelle due sezioni precedenti, abbiamo incontrato i gruppi ortogonali e unitari. Questi sono esempi dei cosiddetti gruppi classici, vale a dire i gruppi di Lie semplici con l'esclusione di quelli eccezionali; vedi §13.2. L'elenco dei gruppi classici è completato dalla famiglia dei gruppi simplettici. Questi gruppi hanno grande importanza in fisica classica (come vedremo in particolare in §20.4) e anche in meccanica quantistica, in particolare nel caso infinito-dimensionale (§26.3). Che cos'è un gruppo simplettico? Ritorniamo di nuovo alla nozione di forma bilineare, ma questa volta, invece della simmetria (g(x, y) = g(y, x)) richiesta per definire il gruppo ortogonale, imponiamo l 'antisimmetria s(x,y) =-s(y,x),
assieme alla linearità s(x, y + w)
= s(x, y) + s(x, w),
s(x, Ày)
= Às(x, y),
dove la linearità rispetto alla prima variabile x segue ora dall' antisimmetria. Possiamo scrivere la nostra forma antisimmetrica in vari modi, come s(x,y) =rsaw!' = xT Sy,
proprio come nel caso simmetrico, solo che sab è antisimmetrico:
Sba=-sab
cioè
ST=-S,
essendo S la matrice delle componenti di sab· Poiché chiediamo che S sia non singolare, sab ha un'inversa sab che soddisfa23
[13.55] Dimostrate che queste trasformazioni sono proprio quelle che preservano la corrispondenza hermitiana tra vettori v e covettori v*, e sono quelle che preservano hab'·
286
Gruppi di simmetria
dove sab = - sba_ Facciamo notare che, per analogia con una matrice simmetrica, una matrice antisimmetrica S è uguale al negativo della sua trasposta. È importante osservare che una matrice antisimmetrica n x n S può essere non singolare soltanto se n è pari.l 13 ·56l Qui n è la dimensione dello spazio V, a cui appartengono x e y, che noi assumiamo pari. Gli elementi T di GL(n) che preservano un'antisimmetrica s b non singolare (o in modo equivalente la forma bilineare s), nel senso che 0
sono chiamati simplettici, e il gruppo di questi elementi è chiamato gruppo simplettico (un gruppo di grandissima importanza in meccanica classica, come vedremo in §20.4). Vi è tuttavia nella letteratura un po' di confusione su questa terminologia. Dal punto di vista matematico è più corretto definire un gruppo simplettico (reale) come una forma reale del gruppo simplettico complesso Sp(}n, C) che è il gruppo dei complessi T'b (o T) che soddisfano le relazioni precedenti. La paiticolare forma reale appena definita non è compatta, ma secondo le osservazioni alla fine di§ 13.7 -poiché Sp(}n, C) è semi semplice - esiste un'altra forma reale di questo gruppo complesso che è compatta; di solito è a questa che si fa riferimento come gruppo simpletti1 co (reale) Sp(-2 n). In che modo troviamo queste diverse forme reali? In effetti, come nel caso dei gruppi ortogonali, vi è una nozione di segnatura che non è così nota come nei casi dei gruppi ortogonali e unitari. Il gruppo simplettico delle trasformazioni reali che preservano s b sarebbe il caso di «segnatura suddivisa» (}n, }n). Nel caso compatto, il gruppo simplettico ha segnatura (n, O) o (O, n). Com'è definita questa segnatura? Per ciascuna coppia di numeri naturali p e q tali che p + q = n, possiamo definire una «forma reale» del gruppo complesso Sp(}n, C) prendendo solo quegli elementi che sono anche pseudounitari per la segnatura (p, q), ossia che appartengono a U(p, q) (vedi§ 13.9). Questo ci dà24 il gruppo (pseudo)simplettico Sp(p, q). (Si può dire analogamente che Sp(p, q) è l'intersezione di Sp(}n, C) con U(p, q).) In termini della notazione con indici, possiamo definire Sp(p, q) come il gruppo di trasformazioni lineari complesse T'!, che preservano sia l'antisimmetrica s01,, come in precedenza, sia una matrice hermitiana H di componenti h ,b, nel senso che 0
0
[13.56] Dimostratelo. 287
LA STRADA CHE PORTA ALLA REALTÀ
dove H ha segnatura (p, q) (in modo che possiamo trovare una base pseudoortonormale per cui H è diagonale con p termini 1 e q termini - 1; vedi §13.9). 25 Il gruppo simplettico classico compatto Sp(½n) è il mio Sp(n, O) (o Sp(0, n)), ma la forma di maggiore importanza in fisica classica è Sp(½n, ½n).[1357J Come con i gruppi ortogonali e unitari, possiamo trovare basi per le quali le componenti sab hanno una forma particolarmente semplice. Tuttavia non possiamo ritenere che questa forma sia diagonale, perché la sola matrice antisimmetrica diagonale è zero! Possiamo invece assumere che la matrice di sah consista di blocchi 2 x 2 lungo la diagonale principale, della forma
(~1 ~). Nel caso familiare di segnatura suddivisa Sp({n, }n), possiamo prendere la trasformazione lineare reale che preserva questa forma. Il caso generale Sp(p, q) è evidenziato prendendo, invece di trasformazioni reali, trasformazioni pseudounitarie di segnatura (p, q)Y 3-58 l Per vari (piccoli) valori di p e q, alcuni dei gruppi ortogonali, unitari e simplettici sono gli stessi («isomorfi») o almeno localmente gli stessi ( «localmente isomorfi»), nel senso di avere le medesime algebre di Lie (vedi § 13.6). L'esempio più elementare è il gruppo SO(2), che descrive il gruppo di simmetrie senza riflessione di una circonferenza, poiché è lo stesso del gruppo unitario U(l), il gruppo moltiplicativo dei numeri complessi di modulo unità ei 0 ( 0 reale)P 59 l Di particolare importanza per la fisica è che SU(2) e Sp(l) siano gli stessi, e siano localmente lo stesso di S0(3) (poiché è il rivestimento di ordine 2 di questo ultimo gruppo, in accordo con la duplice natura della rappresentazione quatemionica delle rotazioni nello spazio tridimensionale, come è stato descritto in §11.3). Ciò è molto importante per la fisica quantistica dello spin (vedi §22.8). Nella teoria della relatività è significativo il fatto che SL(2, IC), essendo lo stesso che Sp(l, C), è localmente lo stesso che la parte senza riflessione del gruppo di Lorentz 0(1, 3) (di nuovo un rivestimento di ordine 2 di esso). Troviamo anche che SU(l,1), Sp(l, 1) e SO(2, 1) sono gli stessi, e vi sono parecchi altri esempi. Particolarmente degna di nota per la teoria dei twistor è l'identità locale tra SU(2, 2) e la parte senza riflessione del gruppo 0(2, 4) (vedi §33.3). L'algebra di Lie di un gruppo simplettico è ottenuta cercando soluzioni X dell'equazione matriciale
XTS + S X= O,
cioè S X= (S X)T,
[13.57] Trovate descrizioni esplicite di Sp(l) e Sp(l, 1) usando questa prescrizione. Siete capaci di vedere perché i gruppi Sp(n, O) sono compatti? [ 13 .58) Dimostrate perché queste due diverse descrizioni per il caso p =q = _1_2 n sono equivalenti. [13.59] Perché sono gli stessi? 288
Gruppi di simmetria
così che la trasformazione infinitesima (elemento dell'algebra di Lie) X è semplicemente s- 1 moltiplicato per una matrice simmetrica n x n. Ciò permette di vedere direttamente che la dimensione del gruppo simplettico è }n(n + 1). Si noti che X deve avere traccia nulla (ossia traccia X = O; vedi § 13.4)) 13 -601 Si ottengono facilmente anche le algebre di Lie per i gruppi ortogonali e unitari, rispettivamente in termini di matrici antisimmetriche e multipli immaginari puri di matrici hermitiane, poiché le rispettive dimensioni sono n(n - 1)/2 e n2 .l 13 -61 J Come abbiamo visto in § 13.4, affinché le trasformazioni abbiano determinante unità, la traccia dell'elemento infinitesimo X deve ridursi a zero. Ciò è automatico nel caso simplettico (come osservato sopra), e nel caso ortogonale tutti gli elementi infinitesimi hanno determinante unità.P 3-621 Nel caso unitario la restrizione a SU(n) è un 'ulteriore condizione (traccia X= O), così che la dimensione del gruppo si riduce a n 2 - I . I gruppi classici, a cui si è fatto riferimento in § 13 .2, spesso indicati con A,,,, B111 , C,,,, D111 (per m = 1, 2, 3, ... ), sono semplicemente i rispettivi gruppi SU(m + 1), S0(2m + I), Sp(m), SO(2m) che abbiamo esaminato in §§13.810; dalle considerazioni precedenti vediamo che hanno infatti rispettive dimensioni m(m + 2), m(2m + 1), m(2m + 1), m(2m - 1), come affermato in § 13.2. Il lettore ha avuto così l'opportunità di dare una occhiata significativa a tutti i gruppi classici semplici. Come abbiamo visto, questi gruppi e alcune delle varie altre «forme reali» (delle loro complessificazioni) giocano ruoli importanti in fisica: nel prossimo capitolo acquisteremo maggiore familiarità con questi concetti. Secondo la fisica moderna, come menzionato all'inizio di questo capitolo, tutte le interazioni fisiche sono governate da «connessioni di gauge» che, dal punto di vista tecnico, dipendono fondamentalmente da spazi aventi simmetrie esatte. Tuttavia, abbiamo ancora bisogno di sapere cosa sia effettivamente una «teoria di gauge». Questo sarà rivelato nel capitolo 15.
Note l.
Abel nacque nel 1802 e morì di consunzione (tubercolosi) nel 1829, all'età di 26 anni. La teoria più generale dei gruppi non abeliani (ab -:ft ba) è stata introdotta dal matematico francese Evariste Galois (1811-1832), la cui vita fu ancora più breve poiché venne ucciso in un duello prima di compiere 21 anni, che passò l'ultima notte prima di morire scrivendo febbrilmente le sue idee rivolu-
[13.60] Spiegate da dove proviene l'equazione xrs + SX = O e perché SX = (SX)r. Perché la traccia di X è nulla? Date esplicitamente l'algebra di Lie. Perché ha questa dimensione? [13.61] Descrivete queste algebre di Lie e ricavate queste dimensioni. [13.62] Perché? Qual è il suo significato geometrico? 289
LA STRADA CHE PORTA ALLA REALTÀ
2. 3.
4.
5. 6. 7. 8. 9.
10.
11. 12.
13.
14. 290
zionarie riguardo all'uso di questi gruppi per investigare la risolubilità di equazioni algebriche. Questa teoria viene ora chiamata teoria di Galois. Dovremmo anche prendere nota che «- C» significa «prendere il complesso coniugato, poi moltiplicare per-I», vale a dire, -C = (- l)C. La «S» sta per «speciale» (cioè che ha determinante uguale a 1) che, nel presente contesto, ci dice che sono esclusi movimenti che invertono l'orientazione. La «O» sta per «ortogonale» che significa che questi movimenti conservano la «ortogonalità» (cioè la natura di angoli retti) degli assi coordinati. Il 3 sta per il fatto che stiamo considerando rotazioni in tre dimensioni. Vi è un notevole teorema che ci dice che non solo ogni gruppo continuo è liscio (vale a dire che C0 implica C 1, nella notazione di §§6.3-6, e persino che C0 implica C00), ma che è anche analitico (vale a dire che C0 implica C'"). Questo famoso risultato, che ha rappresentato la soluzione di quello che era diventato noto come «quinto problema di Hilbert», è stato ottenuto da Andrew Mattei Gleason, Deane Montgomery, Leo Zippin e Hidehiko Yamabe nel 1953; vedi Montgomery e Zippin (1955). Ciò giustifica l'uso di serie di potenze in§ 13.6. Vedi van der Waerden ( 1985). Vedi Devlin (1988). Vedi Conway e Norton (1972); Dolan (1966). Vedremo in § 14.1 che uno spazio euclideo è un esempio di spazio affine. Se selezioniamo un punto particolare (origine) O, diventa uno spazio vettoriale. In molti punti di questo libro sarà opportuno- e qualche volta essenziale- sfalsare gli indici su un simbolo di tipo tensore. Nel caso di una trasformazione lineare, questo è necessario per esprimere l'ordinamento di una moltiplicazione matriciale. Questa regione è uno spazio vettoriale di dimensione r (dover< n). Chiamiamo r il rango della matrice o trasformazione lineare T. Una matrice n x n non singolare ha rango n. (Il concetto di «rango» viene applicato anche a matrici rettangolari.) Confronta nota 18 del capitolo 12. Per una storia della teoria delle matrici, vedi Mac Duffee (1933). In quelle situazioni degeneri in cui gli autovettori non sottendono l'intero spazio (vale a dire che qualche d è minore del corrispondente r), possiamo ancora trovare una forma canonica, dove però permettiamo che gli 1 compaiano proprio sopra la diagonale principale, essendo presenti in blocchi quadrati i cui termini diagonali sono autovalori uguali (forma normale di Jordan ), vedi Anton e Busby (2003). Sembra che Weierstrass avesse (veramente) trovato questa forma normale nel 1868, due anni prima di Jordan; vedi Hawkins (1977). Per illustrare questo punto, prendiamo in considerazione SL(n, IR) (vale a dire gli elementi con determinante unità di GL(n, IR). Questo gruppo ha un «rivestimento di ordine 2» SL(n, IR) (purché sian;:,: 3) che è ottenuto da SL(n, IR) sostanzialmente nello stesso modo con cui abbiamo effettivamente trovato il rivestimento di ordine SO(3) di SO(3), quando abbiamo esaminato le rotazioni di un libro, attaccato a una cintura, in §11.3. Perciò, SO(3) è il gruppo di rotazioni (senza riflessione) di un oggetto spinoriale nell'ordinario spazio tridimensionale. Allo stesso modo, possiamo prendere in esame «oggetti spinoriali» che sono soggetti a trasformazioni lineari più generali che consentono «compressioni» e «dilatazioni», come è stato discusso in §13.3. In questo modo arriviamo al gruppo SL(n, IR), che localmente è lo stesso di SL(n, IR), ma che non può, in effetti, essere fedelmente rappresentato in qualunque GL(m) Vedi nota 9 del capitolo 15. Questa nozione è ben definita; confronta la nota 4.
Gruppi di simmetria
15. Thirring (1983). 16. Qui abbiamo di nuovo un esempio dell'incorreggibile bizzarria dell'imposizione di un nome ai concetti matematici. Mentre molte nozioni di grande importanza in questa materia, a cui è attribuito convenzionalmente il nome di Cartan ( cioè, «sottoalgebra di Cartan, intero di Cartan») sono originariamente dovute a Killing (vedi § 13.2), quella che chiamiamo «forma di Killing» è effettivamente dovuta a Cartan (e Hermann Weyl); vedi Hawkins (2000), §6.2. Tuttavia, il «vettore di Killing» che incontreremo in §30.6 è effettivamente dovuto a Killing (Hawkins 2000). 17. Trascuro intenzionalmente, dal punto di vista matematico, l'uso di «lo stesso» in questo contesto. Il termine matematico esatto è «isomorfo». 18. Non sono stato molto esplicito finora circa questa procedura. Una base e= (e 1, ... , e") per V è associata a una base duale che è una base e•= (e 1, ••• , e") per v· con la proprietà che é • e1 = oj. Le componenti di un tensore Q di ordine sono ottenute applicando la funzione multilineare di § 12.8 alle varie collezioni di p elementi base duali e q elementi base: Q{:'.i = Q(ef, ... , e"; e"' ... , eJ. 19. Vedinota3. 20. Vedi nota 10. Il lettore può essere disorientato dal fatto che T'i, di §13.5 può avere molti invarianti, vale a dire tutti i suoi autovalori À- 1, Ai, À-3 , ••• , À,,, mentre non è così per gah· La risposta sta semplicemente nella differenza nel comportamento rispetto alle trasformazioni che è implicito nel diverso posizionamento degli indici. 21. Si noti che, nel caso definito positivo, (e;, e;, ... , e~) è una base duale di (e;, e;, ... , e:,), nel senso della nota 18 22. I gruppi U(p, q), per un dato n = p + q, come anche GL(n, IR), hanno tutti la stessa complessificazione, vale a dire GL(n, C); possono quindi essere ritenuti tutti forme reali diverse di questo gruppo complesso. 23. Possiamo allora usare sab e sah per innalzare e abbassare indici, proprio come con gab e g"Ò, così che Va = sab vh, v" = sab vb (vedi § 13. 8); ma, a causa dell' antisimmetria, dobbiamo essere un po' cauti per rendere coerente l'ordinamento degli indici. I lettori che conoscono il calcolo 2-spinoriale (vedi Penrose e Rindler, vol. 1, 1984) possono notare una leggera discrepanza di notazione tra ' il nostro sab e lo t:AB di quel calcolo. 24. Non sono al corrente di una notazione o terminologia standard per queste varie forme reali, così che la notazione Sp(p, q) è stata escogitata per i presenti scopi. 25. In effetti, ogni elemento di Sp(½n, C) ha determinante unità, così che non abbiamo bisogno di un «SSp(}n)» per analogia con SO(n) e SU(n). Il motivo è che vi è un'espressione (il «pfaffiano») per t: di Levi-Civita ... in termini della sab, che deve essere preservata ogni volta che sono preservate le sab· 26. Vedi nota 17.
m
CAPITOLO
14
CALCOLO INFINITESIMALE SULLE VARIETÀ
14.1 Differenziazione su una varietà? Nel capitolo precedente (in §13.3, 6-10), abbiamo visto come i gruppi di simmetria possono agire su spazi vettoriali, quando il gruppo è rappresentato da trasformazioni lineari di questi spazi. Per un gruppo specifico, possiamo pensare che lo spazio vettoriale possieda qualche struttura particolare che è preservata dalle trasformazioni. La nozione di «struttura» è importante: potrebbe essere, per esempio, una struttura metrica, come nel caso del gruppo ortogonale (§ 13.8), o una struttura hermitiana, come nel caso di un gruppo unitario (§ 13.9). Come osservato in precedenza, la teoria della rappresentazione dei gruppi come azioni su spazi vettoriali ha generalmente grande importanza in molte aree della matematica e della fisica, specialmente nella teoria quantistica, il cui bagaglio essenziale, come vedremo (in particolare in §22.2), è formato da spazi vettoriali con una struttura hermitiana (prodotto scalare). Tuttavia, uno spazio vettoriale è esso stesso un tipo molto speciale di spazio, e per la matematica di gran parte della fisica moderna occorre qualcosa di molto più generale. Persino l'antica geometria di Euclide non è uno spazio vettoriale, perché uno spazio vettoriale deve avere un punto privilegiato, e precisamente l'origine (data dal vettore zero), mentre nella geometria euclidea tutti i punti sono sullo stesso piano. Lo spazio euclideo è in realtà un esempio del cosiddetto spazio affine. Uno spazio affine è simile a uno spazio vettoriale quando «dimentichiamo» l'origine; in effetti, è uno spazio in cui vi è un concetto coerente di pa~allelogrammaY 4-1H14 •2lAppena [14.1] Supponete che [a, b; e, d] rappresenti l'affermazione «abdc forma un parallelogramma» (dove a, b, de e sono presi in ordine ciclico, come in §5.1 ). Assumete come assiomi: (i) per a, b, e qualsiasi esiste un d tale che [a, b; e, d]; (ii) se [a, b; e, d], allora [b, a; d, e] e [a, e; b, d]; (iii) se [a, b; e, d] e [a, b; e,f], allora [e, d; e,f]. Dimostrate che, quando un punto qualsiasi è scelto e indicato come origine, questa struttura algebrica si riduce a quella di uno «spazio vettoriale», ma senza l'operazione di «moltiplicazione scalare» come è stata data in § 11.1 - vale a dire che otteniamo le regole di un gruppo abeliano additivo; vedi esercizio [13.2). [14.2]Potete vedere come generalizzare questo al caso non abeliano? 292
Calcolo infinitesimale sulle varietà
specifichiamo un punto particolare come origine, possiamo definire l'addizione vettoriale per mezzo della «legge del parallelogramma» (vedi § 13.3, fig. 13.4). Lo spaziotempo curvo della notevole teoria della relatività generale di Einstein è certamente più generale di uno spazio vettoriale; è una 4-varietà. La sua geometria dello spaziotempo richiede però qualche struttura (locale), oltre a quella propria di una varietà liscia (come è stata studiata nel capitolo 12). Anche gli spazi delle configurazioni o gli spazi delle fasi dei sistemi fisici (brevemente esaminati in § 12.1) tendono a possedere, in modo analogo, strutture locali. Come assegniamo questa necessaria struttura? Una simile struttura locale dovrebbe fornire una misura di «distanza» tra punti (nel caso di una struttura metrica) o di «area» di una superficie (com'è specificato nel caso di una struttura simplettica, vedi §13.10) o di «angolo» tra curve (come nel caso della struttura conforme di una superficie di Riemann; vedi §8.2), eccetera. In tutti gli esempi a cui si è appena fatto riferimento, il concetto di spazio vettoriale è proprio quello necessario per dirci che cos'è questa geometria locale, essendo lo spazio vettoriale in questione lo spazio tangente n-dimensionale, 7P di un tipico punto p della varietà 'lit (dove possiamo pensare che~, sia l'immediato intorno di p in 'lit «infinitamente dilatato»; vedi fig. 12.6). Perciò le varie strutture di gruppo ed entità tensoriali che abbiamo incontrato nel capitolo 13 possono avere rilevanza locale nei singoli punti di una varietà. Vedremo che lo spaziotempo curvo di Einstein ha una struttura locale che è data da una (pseudo)metrica lorentziana (§13.8) in ciascuno spazio tangente, mentre gli spazi delle fasi ( cfr. § 12.1) della meccanica classica hanno strutture locali simplettiche (§13.10). Entrambi questi esempi di varietà con struttura giocano un ruolo vitale nella teoria fisica moderna; ma quale forma di calcolo infinitesimale può essere applicata in simili spazi? Come abbiamo appena fatto notare, le varietà n-dimensionali che abbiamo studiato nel capitolo 12 devono soltanto essere lisce, senza che sia specificata alcuna altra struttura locale. In una simile varietà liscia senza struttura, 'lit, vi sono relativamente poche operazioni ragionevoli basate sul calcolo differenziale. Cosa ancora più importante, non abbiamo neppure un concetto generale di differenziazione che possa essere generalmente applicato in 'lit. Dovrei chiarire questo punto. In qualsiasi singola carta, potremmo certamente e semplicemente differenziare le varie quantità d'interesse rispetto a ciascuna delle coordinate x 1, x2, ••• , x" di quella carta, per mezzo degli operatori di derivata parziale a1ax 1, a1ax2, ••• , a1ax11 (vedi § 10.2). Ma nella maggior parte dei casi, le risposte sarebbero senza significato geometrico, perché dipenderebbero dalla specifica (arbitraria) scelta delle coordinate fatta e perché, in generale, non si raccorderebbero in modo coerente nel passaggio da una carta a un'altra (vedi fig. 10.7). In § 12.6 abbiamo però preso nota di un importante concetto di differen293
LA STRADA CHE PORTA ALLA REALTÀ
ziazione, che si applica effettivamente in una generale n-varietà liscia (non strutturata) che si raccorda da caria a carta: si tratta della derivata esterna di una forma differenziale. Tuttavia, questa operazione ha un ambito alquanto limitato, poiché si applica soltanto a p-forme, e inoltre non dà molte informazioni su come sta variando questa p-forma. Possiamo definire più completamente il concetto di «derivata» di qualche grandezza su una generale varietà liscia, per esempio di un campo vettoriale o tensoriale? Un tale concetto dovrebbe essere definito in modo indipendente da qualsiasi particolare scelta delle coordinate che contrassegnerebbero i punti in qualche carta. Sarebbe veramente una bella cosa avere qualche specie di calcolo infinitesimale, indipendente dalle coordinate, che potesse essere applicato a strutture su varietà e che ci consentisse di esprimere come un campo vettoriale o tensoriale varia da punto a punto. Ma come può essere ottenuto tutto ciò?
14.2 Trasporto parallelo Si ricordi, da§ 10.3 e § 12.3, che nel caso di un campo scalare su una generale n-varietà liscia 't1t siamo davvero riusciti a fornire una misura appropriata del suo «tasso di cambiamento», vale a dire la I-forma d(f>, dove d(f> = O è la condizione affinché (f> sia costante (in regioni connesse di 'tlt). Tuttavia questa idea non funziona per una quantità tensoriale generale, e nemmeno per un campo vettoriale i;. Perché? Il problema è che in una varietà generale non esiste alcun appropriato concetto di ç intesa come costante (come vedremo tra poco), mentre qualunque rispettabile operazione di differenziazione («gradiente») applicata a ç dovrebbe avere la proprietà che il suo annullamento segnali la costanza di ç (proprio come d (f> = O segnala la costanza di un campo scalare (!>). Più in generale, ci aspetteremmo che una simile operazione di derivazione debba, nel caso che i; non sia costante, misurare il suo scostamento dalla costanza. Perché esiste un problema con questa nozione di «costanza» di un vettore su una generale n-varietà 't1t? Un campo vettoriale ç costante, nel caso di un comune spazio euclideo, dovrebbe avere la proprietà che tutte le «frecce» della sua descrizione geometrica siano parallele tra loro. In questo modo, una nozione di «parallelismo» dovrebbe far parte della struttura di 'Jlt. Ciò potrebbe mettere in allarme, ricordando il problema del quinto postulato di Euclide esaminato nel capitolo 2. La geometria iperbolica, per esempio, non ammette campi di vettori che potrebbero essere considerati ovunque «paralleli» senza alcuna ambiguità. In qualunque caso, 'ti( non possederebbe una nozione di «parallelismo» solo per il fatto di essere una varietà liscia. In fig. 14.1, questa difficoltà è illustrata per il caso di una 2-varietà messa insieme con due pezzi di piano euclideo. La normale nozione euclidea di «parallelismo» non è coerente nel passaggio da un pezzo all'altro. 294
Calcolo infìnitesimale sulle varietà
\ ~
__ . \
•
'.
j>_ ... --
Parallelismo incoerente
-~----.
-
-
Fig. 14.1 - La nozione euclidea di «pa-
rallela» è probabilmente incoerente nella sovrapposizione di due carte.
(a)
(b)
Fig. 14.2 - Il parallelismo sulla sfera S2. Scegliamo p al polo Nord, con vettore tangente v,
che punta lungo il meridiano di Greenwich. Quali altri vettori tangenti, in altri punti di S2, possono essere ritenuti «paralleli» a v? (a) La nozione diretta di «parallela» euclidea, ereditata dall'immersione di S2 in IP, non funziona perché (eccetto lungo il meridiano perpendicolare al meridiano di Greenwich) i v paralleli non rimangono tangenti a S2 . (b) Si rimedi a ciò, muovendo v, parallelamente lungo una data curva r, proiettandolo continuamente affinché rimanga tangente alla sfera. (Pensate che ysia costituito da un gran numero di minuscoli segmentip0p 1,p 1p 2,p2p 3, ••• , proiettando a ogni stadio. Prendete poi il limite quando i segmenti sono resi sempre più piccoli.) Questa nozione di trasporto parallelo è indicata per il meridiano di Greenwich, ma anche per una generica curva y.
Per comprendere meglio quale genere di nozione di parallelismo sarebbe appropriata, ci sarà utile esaminare dapprima la geometria intrinseca di una comune sfera 2-dimensionale S2 • Scegliamo un punto particolare p di S2 (per esempio, al polo Nord, per essere precisi) e un particolare vettore tangente v nel punto p ( che punta, per esempio, lungo il meridiano di Greenwich; vedi fig. 14.2a). Quali altri vettori tangenti, in altri punti di S 2 , si possono ritenere «paralleli» a v? Se usiamo soltanto la nozione euclidea di «parallela» ereditata dall'immersione standard di S 2 nello spazio euclideo 3-dimensionale, scopriamo che nella maggior parte dei punti q 295
LA STRADA CHE PORTA ALLA REALTÀ
di S2 non vi sono affatto vettori tangenti, che siano «paralleli» a v in questo senso, perché il piano tangente nel punto q non contiene di solito la direzione di v. (Soltanto il cerchio massimo per p che è perpendicolare al meridiano di Greenwich in p contiene punti in cui vi sono vettori tangenti a S2 che sarebbero «paralleli» a v, in questo senso.) L'appropriata nozione di parallelismo su S2 dovrebbe fare riferimento solo ai vettori tangenti, così che dobbiamo fare del nostro meglio per riportare la direzione div, nel piano tangente di q, quando gradualmente allontaniamo q da p. In effetti questa idea funziona, e funziona magnificamente, ma vi è ora una nuova caratteristica in base alla quale la nozione di parallelismo ottenuta dipende dal cammino lungo cui allontaniamo q da p. 1 Questa dipendenza dal cammino nel concetto di parallelismo è il nuovo ingrediente essenziale, e le sue diverse versioni stanno alla base di tutte le più apprezzate teorie moderne delle interazioni tra particelle, oltre che della relatività generale di Einstein. Tentiamo di capire un po' meglio tutto questo. Consideriamo un cammino r su S2, che parte dal punto p e finisce in qualche altro punto q di S2• Immaginiamo che ysia costituito da un gran numero, N, di minuscoli segmentip0p 1, P1P2, pzP3, ... , PN -1 PN, dove il punto di partenza è Po = p e il segmento finale termina inpN = q. Supponiamo di muovere v, lungo r, mantenendo v parallelo a se stesso lungo ciascuno di questi segmenti p,._ 1p,. - nel senso di impiegare come ambiente lo spazio euclideo tridimensionale, con la sua nozione di parallelismo - e poi di proiettare v sullo spazio tangente in p,.. Vedi fig. 14.2b. Con questo procedimento finiamo con un vettore tangente in q che possiamo pensare che sia stato, in senso grossolano, fatto scorrere parallelamente a se stesso lungo yda p a q, mantenendolo, per quanto possibile, sulla superficie stessa. In realtà, questo procedimento dipende leggermente da come r è approssimato dalla successione di segmenti, ma si può dimostrare che al limite, quando i segmenti diventano sempre più piccoli, otteniamo un risultato ben definito che non dipende dal modo esatto con cui suddividiamo rin segmenti. Questo procedimento è chiamato trasporto parallelo div, lungo y. In fig. 14.3, ho indicato il risultato di questo trasporto parallelo lungo cinque cammini differenti (tutti cerchi massimi) che partono dal punto p. Che cos'è allora questa dipendenza dal cammino, a cui si è fatto riferimento sopra? In fig. 14.4, ho segnato due puntip, q su S2 e due cammini da p a q, uno dei quali è l'arco di cerchio massimo diretto e l'altro è formato da due archi di cerchio massimo uniti nel punto intermedio r. Dalla geometria di fig. 14.3, vediamo che il trasporto parallelo lungo questi due cammini (uno dei quali presenta un angolo, ma questo non è importante) dà due risultati abbastanza diversi, che differiscono, in questo caso, per una rotazione di un angolo retto. Si noti che la discrepanza è soltanto una rotazione della direzione del vettore; vi sono motivi generali pér cui una nozione di trasporto parallelo, definita in questo modo particolare, preserva sempre la lun296
Calcolo infinitesimale sulle varietà
Fig. 14.3 - Il trasporto parallelo div, lungo cinque cammini diversi (tutti cerchi massimi).
Fig. 14.4 - La dipendenza dal cammino del trasporto parallelo. Viene qui illustrata usando due cammini diversi da p a q, uno dei quali è un arco del cerchio massimo diretto, mentre l'altro è formato da due archi di cerchio massimo uniti in un punto intermedio r. Il trasporto parallelo lungo questi due cammini dà risultati in q che differiscono per una rotazione di un angolo retto.
ghezza del vettore. (Vi sono, tuttavia, altri tipi di «trasporto parallelo» per cui questo non avviene. Questo argomento sarà importante per noi in altre sezioni; § 14.8, §§ 15.7,8, § 19.4.) Possiamo vedere questa discrepanza in forma estrema, quando il cammino yè un circuito chiuso (così che p = q), nel qual caso vi è probabilmente una discrepanza tra le direzioni iniziale e finale del vettore tangente, trasportato parallelamente. In effetti, per una sfera geometrica di raggio unitario, questa discrepanza è un angolo di rotazione che, quando viene misurato in radianti, è esattamente uguale all'area totale del circuito (quando le regioni percorse in senso negativo vengono conteggiate col segno meno).l 143l [14.3) Cercate di confermare questa asserzione nel caso di un triangolo sferico (triangolo su S2 formato da archi di cerchio massimo), dove potete assumere la formula di Hariot ( 1603) per l'area di un triangolo sferico data in §2.6. 297
LA STRADA CHE PORTA ALLA REALTÀ
14.3 Derivata covariante In che modo possiamo impiegare una nozione di «trasporto parallelo» come questa per definire un concetto appropriato di differenziazione di campi vettoriali (e quindi di campi tensoriali in generale)? L'idea essenziale è che possiamo mettere a confronto il modo in cui un campo vettoriale (o tensoriale) si comporta realmente in qualche direzione d'allontanamento da p con il trasporto parallelo del medesimo vettore preso nella stessa direzione da p, sottraendo quest'ultimo dal primo. Potremmo applicare ciò a uno spostamento finito lungo qualche curvar, ma per definire una derivata (prima) di un campo vettoriale abbiamo bisogno soltanto di uno spostamento infinitesimo da p e questo dipende solo dal modo con cui la curva «si avvia» da p, cioè dipende solo dal vettore tangente w di ynel punto p (fig. 14.5). È consuetudine usare il simbolo V per indicare la nozione di differenziazione che nasce in questo modo, nota come operatore di derivata covariante o semplicemente connessione. Una richiesta fondamentale per un simile operatore (richiesta che è soddisfatta nel caso della nozione sopra definita per S2) è che dipenda linearmente dal vettore w. In questo modo, scrivendo Y, per la derivata covariante lungo la direzione di w, per due diversi vettori di spostamento, w e u, dobbiamo avere
V =V+V w u'
w+u
e per un moltiplicatore scalare À. dobbiamo avere
Fig. 14.5 - La nozione di derivata covariante può essere compresa in relazione al trasporto parallelo. li modo in cui un campo vettoriale ,; su ?lt varia da punto a punto (frecce con punta nera) è misurato dal suo scostamento da quello standard, fornito dal trasporto parallelo (frecce con punta bianca). Questo confronto può essere fatto lungo tutta una curva r, (che parte da p ), ma per la derivata covariante prima v' abbiamo bisogno di conoscere s;ltanto il vettore tangente w a ynel punto p, che determina la derivata covariante f di ,; in p in direzione w.
298
Calcolo i1ifinitesimale sulle varietà
;.,V= ;.,v. w )V
Mettere il simbolo di vettore sotto il simbolo V può sembrare una notazione goffa, come infatti è! Tuttavia, vi è un'autentica confusione tra la notazione del matematico e la notazione del fisico nell'uso di un'espressione come «Vw». Per il matematico, questa indicherebbe probabilmente l'operazione per cui uso «y» mentre il fisico potrebbe interpretare il w come un indice e non come un campo vettoriale. Nella notazione del fisico, esprimeremmo l'operatore come
y
e la linearità di prima rifletterebbe semplicemente la coerenza della notazione: (w" + ua)Va = wa'ila + ua'ila
e
(Àwa)Va = À(wa'il0 ).
Mettere un indice inferiore a V è coerente con il suo essere un'entità duale a un campo vettoriale (come viene riflesso nella linearità di sopra; vedi §12.3), cioè V è un operatore covettoriale (che significa un operatore di ordine [?]). In questo modo, quando V agisce su un campo vettoriale e;, il cui ordine è [6], la grandezza risultante V e; è un tensore di ordine [ l]. Ciò è evidente nella notazione con indici dall'uso della notazione Vaç" per l'espressione in termini di componenti (o indici astratti) per il tensore V e;. In effetti, vi è un modo naturale di estendere il campo d'azione dell'operatore V dai vettori ai tensori di tipo generale, poiché l'azione di V su un tensore T di ordine [ ~] produce un tensore VT di ordine [q~ 1]. Le regole per ottenere ciò possono essere comodamente espresse nella notazione con indici; tuttavia, vi è una goffaggine nella notazione del matematico a cui arriveremo tra un istante. Nella sua azione sui campi vettoriali, V soddisfa il genere di regole soddisfatto dall'operatore differenziale d di §12.3:
V(ç+ 17)=Vç+V17 e la legge di Leibniz
V(Àç) =}.,Ve;+ çV À, dove e; e 17 sono campi vettoriali e }., è un campo scalare. Come parte delle normali richieste per una connessione, l'azione di V su uno scalare deve essere identica all'azione del gradiente (derivata esterna) d su quello scalare:
V
> di quell'osservatore. Per un altro osservatore che incontra lo stesso evento O, ma che potrebbe viaggiare a una velocità più elevata di quella del primo, vi potrebbe essere qualche distorsione tra la mappa della sfera celeste rilevata dall'uno e quella rilevata dall'altro. Vi è davvero un tipo di distorsione, a causa dell'effetto noto come aberrazione stellare, osservato nel 1725 da James Bradley. Secondo questo effetto, la posizione apparente di una stella sulla sfera celeste si sposta leggermente con la sta428
La geometria di Minkowski
gione, per il fatto che la velocità della Terra cambia con la sua posizione sull'orbita attorno al Sole. Questo effetto è simile a quello comunemente osservato dagli automobilisti quando viaggiano a grande velocità sotto la pioggia. A quelli che sono nell'automobile sembra che la pioggia cada direttamente contro di loro, mentre per un osservatore fermo sulla strada la pioggia cade sostanzialmente lungo la verticale. Questo effetto proviene dal fatto che la velocità finita della pioggia deve essere composta, in modo appropriato, con la velocità dell'automobile per poter avere l'osservato effetto relativo. In effetti, in questa situazione, si suppone che la velocità dell'automobile sia molto maggiore di quella della pioggia, così che l'effetto apparente è sostanzialmente dovuto al movimento della macchina. D'altra parte, nel caso della stella, la variazione della velocità orbitale terrestre è molto più piccola della velocità della luce della stella; di conseguenza, la variazione stagionale della posizione apparente della stella sulla sfera celeste è molto piccola (circa mezzo secondo di arco, in effetti, per stelle vicine). Ciononostante, l'effetto è presente e riproduce una distorsione, dipendente dalla velocità, della sfera celeste, che ci dice che non possiamo ritenere che questa sfera abbia una struttura metrica naturale, indipendente dalla velocità dell'osservatore. La domanda che sto ponendo è se vi è qualche attraente struttura matematica su S, più debole di una struttura metrica, che sia preservata nel passaggio dalla mappa celeste dlevata da un osservatore che considera quella identificata da un altro, quando entrambi passano l'uno assieme all'altro per l'evento O, con una elevata velocità relativa. In effetti vi è una simile struttura; e, cosa notevole, è proprio quella struttura che abbiamo studiato in precedenza in §§8.2, 3, quando abbiamo preso in esame la sfera di Riemann. Ricordate che la sfera di Riemann possiede una struttura conforme, così che vi è una nozione assoluta di angolo definita tra curve sulla sfera, pur non avendo essa una metrica particolare, per cui non vi è alcuna nozione di distanza tra punti vicini o di lunghezza per le curve. Qualunque trasformazione ammissibile, vale a dire conforme, della sfera di Riemann in se stessa deve preservare questa nozione di angolo; di conseguenza, le piccole forme (infinitesimali) sono preservate da queste trasformazioni, anche se la loro grandezza può mutare. Inoltre, cerchi di qualunque grandezza sulla sfera sono trasfonnati ancora in cerchi. Questa è proprio la stessa struttura che è posseduta dalla sfera celeste S; quindi, qualsiasi disposizione circolare di stelle, quando è percepita da un osservatore, deve essere percepita come tale da qualunque altro osservatore.[ 18· 101 Questa cosa suggerisce [18.10] Cercate di ricostruire un ingegnoso ragionamento per questo fatto, dovuto al teorico irlandese della relatività John L. Synge, uno scienziato molto originale e autorevole; questo ragionamento non richiede alcun calcolo ed è grosso modo il seguente. Considerate la configurazione geometrica consistente nel cono di luce passato e di un evento O e un 3-piano (di genere tempo) P passante per O. Sia I: l'intersezione di e e P. Descrivete la «storia», col progredire del tempo, delle rispettive descrizioni spaziali di e, P e I:, secondo qualche particolare sistema di riferimento di Minkowski. Spiegate perché qualsiasi osservatore in O vede I: come un cerchio e, inoltre, che questa costruzione geometrica caratte1izza, in modo indipendente dal sistema di riferimento, quei fasci di raggi che a un osservatore appaiono come un cerchio. 429
LA STRADA CHE i'ORTA ALLA REALTA
,. ,..
.....
~.,, ......~::.•: . ....
.
Fig. 18.14 - «):;effetto di appiattimento» di Fitzgerald-Lorentz. Un pianeta sferico si muove verso destra a una velocità v (prossima a quella della luce) rispetto a un sistema di riferimento fisso. In questo riferimento sarebbe descritto come appiattito, per un fattore (I -v2/c2) 112 , nella sua direzione di moto.
che una conveniente etichettatura delle stelle nel cielo potrebbe essere quella di assegnare a ciascuna un numero complesso (non escludendo neppure )! Non sono a conoscenza del fatto che una tale proposta sia stata messa allo studio in astronomia, ma l'uso di un tale parametro complesso, noto come «coordinata stereografica», collegato alle coordinate angolari polari standard dalla formula ç=èP cot½ 0, [18·111è comune nella teoria della relatività generale. 7 Questa proprietà può sembrare sorprendente, specialmente a chi conosce la contrazione di Fitzgerald-Lorentz, in base alla quale una sfera, che si muove velocemente con velocità v, è ritenuta appiattita nella direzione del moto per un fattore y = ✓(1 - v 2/c 2), vedi fig. 18.14. (Non ho qui discusso esplicitamente questo effetto di appiattimento; esso nasce quando consideriamo la descrizione spaziale di un oggetto in movimento, che si può trovare nella maggior parte delle spiegazioni standard della teoria della relatività.).8[18·121 Immaginiamo che la sfera passi orizzontalmente in alto a una velocità prossima a quella della luce; è facile immaginare che questo appiattimento debba essere sicuramente percepibile a un osservatore fermo sul suolo. Per il principio di relatività, l'effetto dovrebbe essere identico a quello che l'osservatore percepisce, se è l'osservatore a muoversi con velocità v nella direzione opposta, mentre la sfera rimane ferma. Ma per un osservatore a riposo che osserva una sfera a riposo, questa sfera è certamente percepita come qualcosa con un profilo circolare; ciò sembrerebbe contraddire l'asserzione «cerchi percepiti vanno in cerchi percepiti» del paragrafo precedente. In realtà, non vi è alcuna contraddizione, perché questo «effetto d'appiattimento» di Fitzgerald-Lorentz non è in effetti direttamente osser00
[18.11] Ricavate questa formula. [18.12] Cercate di ottenere questa formula impiegando le idee sulla geometria dello spaziotempo date sopra. 430
La geometria di Minkowski
Fig. 18.15 - L'appiattimento di Fitzgerald-Lorentz non è osservabile direttamente perché · quello che a un osservatore appare essere il retro della sfera implica una lunghezza di cammino maggiore di quella che appare essere il davanti della sfera (il retro muovendosi fuori dal cammino della luce, mentre il davanti si muove entro di esso). Di conseguenza, l'apparente orlo posteriore si riferisce a una posizione della sfera precedente a quella dell'orlo anteriore, per cui l'immagine è stirata nella direzione di moto in modo da compensare l'effetto di appiattimento.
vabile. Ciò segue dalla dettagliata considerazione delle lunghezze dei cammini che la luce appare percorrere andando verso un osservatore, rispetto al quale la sfera è in moto. Vedi fig. 18.15. La luce che appare venire dal retro della sfera raggiunge l'osservatore da un punto più distante di quello da cui appare venire la luce dal davanti della sfera. 9• [ 18 -131
18.6 Energia, quantità di moto e momento angolare in meccanica newtoniana Vi è un ultimo aspetto della geometria di Minkowski che desidero discutere in questo capitolo: riguarda l'energia, la quantità di moto e il momento angolare nella teoria della relatività. Affronteremo tra poco l'argomento (§18.7); prima è però necessario.fare alcune osservazioni su questi concetti essenziali nella teoria di Newton, dato che non li ho ancora introdotti nel corso del libro. I.:importanza vitale di queste grandezze sta nel fatto che hanno un significato ben definito nella teoria di Newton: sono conservate - per un sistema su .cui non agiscono forze esterne - nel senso che l'energia totale, la quantità di moto e il momento angolare sono costanti nel tempo. Si può ritenere che l'energia di un sistema sia composta da due parti, e [18.13] Sviluppate questo argomento in dettaglio per mostrare perché l'appiattimento di Fitzgerald-Lorentz compensa esattamente l'effetto proveniente dalla diversità di lunghezza del cammino. Mostrate che per piccoli diametri angolari l'effetto apparente è una rotazione della sfera, invece di un appiattimento. 431
LA STRADA CHE PORTA ALLA REALTÀ
precisamente dall'energia cinetica (cioè l'energia del moto) e dall'energia potenziale (l'energia immagazzinata nelle forze tra particelle). I.:energia cinetica di una particella (senza alcuna struttura) è data, nella teoria di Newton, dall'espressione
dove m è la massa della particella e v la sua velocità. Per ottenere l'energia cinetica totale, addizioniamo semplicemente le energie cinetiche di tutte le singole particelle (anche se, quando vi sono molte particelle che si muovono a caso, possiamo fare riferimento alla loro energia come energia termica; vedi §27.3). Per ottenere l'energia potenziale totale, abbiamo bisogno di conoscere qualcosa della natura dettagliata di tutte le forze implicate. Né l'energia cinetica totale, né l'energia potenziale totale devono essere conservate individualmente, ma la loro somma sì. (Il primo accenno a questo fatto si può fare risalire allo studio di Galilei del moto di corpi sotto l'azione della gravità. Quando il piombo di un pendolo oscilla, pmiendo da una posizione elevata, la sua energia potenziale gravitazionale, misurata dalla sua altezza rispetto al suolo, è convertita in energia cinetica, che poi è di nuovo convertita in energia potenziale, che poi è convertita in energia cinetica, e così via.) La quantità di moto p della nostra particella è una grandezza vettoriale, data dall'espressione p=mv, dove v è il vettore che descrive la sua velocità. Per ottenere la quantità di moto totale, prendiamo la somma vettoriale di tutte le singole quantità di moto. Anche questa quantità totale è conservata nel tempo.l 18 · 14l Ricordiamo ora, da § 17 .3, che nella teoria di Newton esiste un principio di relatività (la relatività galileiana). Come possono sopravvivere le nostre leggi di conservazione, quando né l'energia né la quantità di moto restano invariate nel passaggio da un sistema di riferimento inerziale a un altro? Se il secondo sistema di riferimento si muove uniformemente, rispetto al primo, con una velocità data dal vettore u, allora una particella la cui velocità è v, nel primo sistema di riferimento, ha nel secondo la velocità v - u. Accade che la conservazione dell'energia e della quantità di moto nel primo sistema di riferimento si converte nella conservazione dell'energia e della quantità di moto nel secondo sistema di riferimento, purché teniamo conto del fatto che anche la massa è conservata (e dobbiamo anche fare uso della terza legge di Newton; vedi fig. 17.4b, § 17.3)Y 8· 15 l [18. 14] Usate la conservazione dell'energia e della quantità di moto per dimostrare che, se una palla da biliardo ferma è urtata da un'altra palla con la stessa massa, allora esse si allontanano ad angolo retto (ipotizzando un urto elastico, così che non vi è conversione di energia cinetica in calore). [18.15] Dimostrate tutto ciò. 432
La geometria di Minkowski
Dovrebbe essere menzionato che nella meccanica newtoniana vi sono anche altre grandezze conservate, la più importante delle quali è il momento angolare (o momento della quantità di moto), preso rispetto a un certo punto O. Supponiamo che il vettore posizione di qualche particella relativamente a O sia
x = (x 1, x 2, x 3) ' essendo x 1, x 2, x 3 le sue coordinate cartesiane e p la sua quantità di moto; allora il momento angolare è dato dalla quantità
M=2x Ap (vedi § 11.6 per il significato di A). 10 Per ottenere il momento angolare del1'intero sistema, sommiamo semplicemente le quantità M per le singole particelle.l18·161 Vi è anche un'altra quantità che è conservata nel tempo, in meccanica newtoniana, in assenza di forze esterne, che è spesso molto meno discussa del momento angolare. Per una singola particella, questa è
N= tp-mx, dove tè il tempo; il valore totale di N è ottenuto sommando i valori delle singole particelle. Questo totale ha la stessa forma precedente, ma adesso x è il vettore posizione del centro di massa e p è la quantità di moto totale. La costanza di questo N totale esprime il fatto che il centro di massa si muove uniformemente lungo una linea retta; vedi fig. 18.16) 18·171 Dobbiamo ora porci la seguente domanda: in che modo tutto questo è influenzato dagli sconvolgimenti del passaggio alla relatività speciale? Abbiamo ancora i concetti di conservazione dell'energia, quantità di moto, momento angolare e moto del centro di massa? E per quanto riguarda la conservazione della massa? La risposta alle prime quattro domande è «sì», anche se dobbiamo stare attenti a definire correttamente queste grandezze. Quanto alla conserva-
Fig. 18.16 - Moto uniforme del centro di massa. La grandezza N = tp - mx, dove t è il tempo e x è il vettore posizione del centro di massa, è conservata. Ciò esprime il fatto che il centro di massa si muove di moto rettilineo uniforme con velocità p/m. [ 18 .16] Perché un pattinatore in rotazione porta le sue braccia verso di sé per aumentare la sua velocità di rotazione? [18.17] Dimostratelo. (N.B. Il vettore posizione del centro di massa è la somma delle quantità mx divisa per la somma delle masse m.) 433
LA STRADA CHE PORTA ALLA REALTÀ
zione della massa, avviene qualcosa di molto strano: le due leggi distinte di Newton sulla conservazione di massa e energia devono essere incluse in un'unica legge. In un senso ben definito, massa e energia diventano completamente equivalenti l'una all'altra, secondo la più famosa delle equazioni di Einstein
E=Mc7-, dove E è l'energia totale del sistema e M la sua massa totale, mentre e è, come prima, la velocità della luce. Nella sezione finale di questo capitolo, vedremo come funziona tutto ciò.
18. 7 Energia, quantità di moto e momento angolare in meccanica relativistica Si rammenti il modo con cui spazio e tempo vengono uniti nella teoria della relatività per diventare una singola entità, lo «spaziotempo», così che la coordinata temporale t viene unita al vettore posizione x = (x 1, x 2 , x 3) dello spazio tridimensionale per dare il 4-vettore
(x0 , x', x 2 , x 3 ) = (t, x). Scopriremo che quantità di moto ed energia divengono unite in modo simile. Qualsiasi sistema finito, nella relatività speciale, avrà un'energia totale, E, e un 3-vettore, p, per la quantità di moto totale; questi si uniscono nel cosiddetto 4-vettore energia-quantità di moto, le cui componenti spaziali sono
(p1,p2,p3) = c2p e la cui componente temporale p 0 misura non solo l'energia totale, ma anche, in modo equivalente, la massa totale m del sistema secondo la relazione
p 0 =E= mc 2, che incorpora la famosa relazione di Einstein tra massa e energia. Con le unità più naturali per cui e = 1, l'energia e la massa sono semplicemente uguali. Tuttavia, ho fatto comparire esplicitamente la velocità della luce e (cioè non ho scelto le unità in cui e = 1) per facilitare la traduzione a descrizioni non relativistiche. Sto impiegando convenzioni per assumere che le componenti gab del tensore metrico siano la matrice diagonale ( 1, - e- 2 , - e 2, - e- 2) e quelle del suo inverso g'h siano la matrice diagonale (1, - c 2, - c 2 , - c 2). Anche se all'inizio si può pensare che energia e quantità di moto siano un vettore dello spaziotempo, è più appropriato (vedi §20.2 e §21.2) considerarlo come un covettore, descritto dalla quantità con indice abbassato Pa con componenti
(po,P1,P2,P3) = (E, -p). Questo ha un irritante segno meno (sebbene ora sia sparita la velocità della luce). Qualunque sia la versione impiegata (p 0 o p 0 ), la 4-quantità di moto 434
La geometria di Minkowski
soddisfa una legge di conservazione. Quindi, in un incontro tra due o più particelle (o sistemi), o nel decadimento di una singola particella (o sistema) in due o più particelle (o sistemi), la somma di tutte le 4-quantità di moto prima dell'incontro è uguale alla somma di tutte le 4-quantità di moto dopo l'incontro. Così, la legge di conservazione dell'energia, quella di conservazione della quantità di moto e anche quella di conservazione della massa sono tutte incluse in questa unica legge. Il motivo per riunirle tutte insieme in questo modo è che, in un cambiamento di sistema di riferimento, queste quantità si trasformano tra di loro nel modo corretto per la teoria della relatività, come è richiesto dalla notazione con indici (vedi § 12.8). Si noti che la massa totale di un sistema non è una grandezza scalare nella teoria della relatività, così che il suo valore dipende dal sistema di riferimento rispetto a cui è misurata. Per esempio, una particella la cui massa è m, quando è misurata nel suo sistema di riposo, sembrerà avere una massa più grande, se questa verrà misurata in un secondo sistema di riferimento rispetto al quale la particella è in movimento. Tuttavia, affinché vi sia un effetto significativo, occorre che la velocità relativa dei due sistemi di riferimento sia paragonabile alla velocità della luce.[ 18 · 18 l Questi commenti. si applicano comunque solo al genere di massa che è conservata nel senso additivo appena descritto (per un sistema su cui non agiscono forze esterne). Ma in relatività vi è un altro concetto di massa, e precisamente la massa di riposo µ (~ O), che non dipende dal sistema di riferimento; è la massa misurata nel sistema di riposo del sistema - nel sistema di riferimento, cioè in cui la quantità di moto è nulla. La massa di riposo è c- 2 volte l'energia di riposo (papa) 112 , così che (c2 µ)2
=
Palf = E2-c2p2,
e abbiamoµ= c- 2(E 2 cp2) 112 . Qui adotto la notazione vettoriale del 3-spazio, con cui, per un arbitrario 3-vettore a, definiamo a2 = a • a = a? + a i + a { Il «punto» sta per il «prodotto scalare» (come nella notazione di § 12.3): a• b = a 1b 1 + a2b2 + a3b3,
con a= (a 1, a2 , a3 ) e b = (b 1, b2 , b3). (Questa notazione sarà comoda in seguito.) Per una singola particella che è massiva nel senso che µ > O, possiamo ritenere che la 4-quantità di moto sia la 4-velocità scalata per la massa di riposoµ. La 4-velocità va è il vettore di genere tempo (futuro) tangente alla linea d'universo della particella, la cui lunghezza (di Minkowski) è c (è, cioè, un vettore unitario se c = 1): pa =µva dove vava = c2 ;
[18.18] Fate vedere che la formula per l'aumento di massa è m(l - v 2/c 2) 112, dove v è la velocità della particella nel secondo sistema di riferimento; vedi sotto. 435
LA STRADA CHE PORTA ALLA REALTÀ
4-momento pa
Fig. 18.17 - Per una particella massiva, la 4-quantità di moto p" è la 4-velocità v" scalata per la massa di riposoµ(> O), dove va è un vettore unitario di genere tempo (futuro) tangente alla linec.1 d'universo della particella (assumendo e= 1).
vedi fig. 18.17. Come è stato fatto notare prima, la massa di riposo di una particella massiva è la massa (massa/energia) di quella particella quando viene misurata nel suo sistema di riposo. Assumendo che l'ordinaria 3-velocità della particella sia v, così che v = (dx 1/dt, dx2/dt, dx3/dt), dove t = xO, otteniamor1s.191r1s.201 va= y(_c, v), p=mv, m=yµ, dove
y = (1 _ v2/c2)~ 112_ Ci possono essere anche particelle prive di massa (vale a dire, con massa di riposoµ nulla): il fotone è il primo esempio. Allora la 4-quantità di moto è un vettore nullo. Poiché la massa di riposo non è conservata, non vi è nulla che· impedisca a una particella massiva di decadere in particelle prive di massa, o a particelle prive di massa di riunirsi per produrre particelle massive. In effetti, una particella massiva nota come «pione neutro» (indicata da n°) decade normalmente in due fotoni in circa 1o- 16 secondi. [18.19] Perché? [ I 8.20] Usate la serie di Taylor di §6 .4 per derivare (1 + x )11 2 = 1+ ½x - ½x2 + i\;- x 3 - ... Ottenete poi uno sviluppo in serie di potenze per l'energia E= [(c2µ) 2 + c2p 2] 112 di una particella di massa di riposo µ e 3-quantità di moto p. Fate vedere che il primo termine è proprio la relazione di Einstein E= mc 2 applicata alla massa di riposoµ e che il tem1ine successivo è l'espressione di Newton per l'energia cinetica. Scrivete ancora i due termini successivi, così da dare approssimazioni migliori all'".satta energia relativistica. 436
La geometria di Minkowski
Fig. 18.18 - Il decadimento di un «pione neutro» massivo n° in due fotoni (senza massa). Il 4-vettore di massa/energia è additivamente conservato (anche se non lo è la massa di riposo).
In qualsiasi particolare sistema di riferimento, tuttavia, la massa/energia totale è additivamente conservata, poiché la massa/energia di ciascun singolo fotone è diversa da zero. Il modo in cui le 4-quantità di moto si addizionano è illustrato in fig. 18 .18. Vediamo infine come deve essere trattato nella teoria speciale della relatività il momento angolare. È descritto da una grandezza tensoriale M h, antisimmetrica rispetto ai suoi due indici: 0
Mab=-M'a. (Vedi §22.12 per l'importanza M in meccanica quantistica.) Per una singola particella puntiforme senza struttura, abbiamo 11 0
"
dove .x" è il 4-vettore posizione (nella forma con indici) del punto sulla linea d'universo della particella nel momento in cui è preso in considerazione il suo momento angolare. Se la particella è in moto inerziale, allora M è il medesimo per tutti i punti sulla sua linea d'universoP 8·21 l Per ottenere il momento angolare relativistico totale, sommiamo semplicemente i tensori del momento angolare di ciascuna particella. Per una singola particella (non ruotante), le tre componenti indipendenti puramente spaziali M 23, M 31 , M 12 sono le componenti (x c2) del comune momento angolare M = 2x /\ p esa0
"
[18.21] Perché? 437
LA STRADA CHE PORTA ALLA REALTÀ
minato in §18 .6, mentre le rimanenti componenti indipendenti M 01 , M 02 , M 03 costituiscono la grandezza N = tp - mx (x c2 ). (La conservazione di N totale esprime il moto uniforme del centro di massa; vedi fig. 18.16.)[ 18·221 Si rammenti da §18.2 che il 1O-dimensionale gruppo di Poincaré delle simmetrie dello spazio di Minkowski ha 4 dimensioni che si riferiscono alle traslazioni dello spaziotempo, mentre le rimanenti 6 si riferiscono alle rotazioni (Lorentz). Vedremo in §20.6 come un principio importante della meccanica classica, noto come teorema di Nother, collega simmetrie a leggi di conservazione, e in §§21.1-5 e §22.8 come la stessa cosa avviene in teoria quantistica. Tutto questo fornisce un profondo motivo per le leggi di conservazione per la 4-quantità di moto Pa e il 6-momento angolare M"b, poiché provengono rispettivamente dalle 4 simmetrie traslazionali e dalle 6 simmetrie rotazionali (Lorentz) dello spazio di Minkowski. La conservazione di Pa e Mah avrà grande importanza nel capitolo 21 e in §§22.8, 12, 13.
Note 1.
Tom Banchoff, dell'Università Brown, ha sviluppato per molti anni sistemi interattivi su computer indirizzati allo sviluppo della intuizione 4-dimensionale, e in particolare alla visualizzazione di funzioni complesse in termini di superfici di Riemann in IC 2 • Vedi Banchoff (1990, 1996). Le quantità «ds» in questa espressione dovrebbero essere semplicemente lette come «quantità infinitesimali» (come Io E di § 13.6). Confrontate nota 8 del capitolo 12. Per una particolare discussione dettagliata dei ruoli di Lorentz, Poincaré ed Einstein nello sviluppo della relatività speciale, vedi Stachel (1995). A mio parere, persino Einstein nel 1905 non aveva completamente la relatività speciale; per completarne il quadro occorse la prospettiva 4-dimensionale di Minkowski nel 1908; vedi §17.8. Nelgruppo di Poincaré vi sono anche elementi che invertono il tempo, inviando le direzioni di genere tempo nel futuro in quelle di genere tempo nel passato. Dovrei porre in rilievo, specialmente per quei lettori che già conoscono la meccanica quantistica, che la nozione complessa di «ortogonalità» che qui impiego è necessariamente quella olomorfa (poiché questo è tutto quello di cui si occupa la «complessificazione»), e non quella hermitiana di § 13.9 che introduce la coniugazione complessa e che è usata in molte altre aree della matematica e della fisica. Vedi, per esempio, Rindler (1982, 2001); Synge (1956); Taylor e Wheeler (1963); Hartle (2002). Vedi, in particolare, Newman e Penrose (1966); Penrose e Rindler (1984, §§1.2-4, §4.15; 1986, §9.8). Vedi, per esempio, Rindler (I 982, 2001).
2.
3.
4.
5.
6. 7. 8.
[18.22] Spiegatelo in dettaglio, nel ~aso relativistico. 438
La geometria di Minkowski
9. Vedi, per esempio, Terrell (1959); Penrose (1959). 1O. Alcuni lettori potrebbero essere confusi dalla presenza di un «2» in questa espressione, ma dovrebbero riesaminare la definizione di «/\» che ho dato in §11.6. Le componenti di x /\ p sono xfi p 11 = ¾(x; pì -xipi ). M ha quindi componenti xi pi - xi pi. 11. Vedremo in §22.8 che la maggior parte delle particelle (quantistiche) possiede anche uno spin intrinseco che fornisce un contributo (costante) di spin a M•h (vedi §22.12), che è sommato al «M•b orbitale» qui dato.
CAPITOLO 19
I
CAMPI CLASSICI DI MAXWELL ED EINSTEIN
19.1 L'evoluzione dalla dinamica newtoniana Nel periodo tra l'introduzione del superbo schema dinamico di Newton, che possiamo datare con la pubblicazione dei suoi Principia nel 1687, e la comparsa della teoria della relatività speciale, che non sarebbe irragionevole datare con la prima pubblicazione di Einstein sul soggetto, nel 1905, hanno avuto luogo molti importanti sviluppi nella nostra rappresentazione della fisica fondamentale. Il più grande cambiamento avvenuto in questo periodo fu la percezione, soprattutto a opera di Faraday e Maxwell, che la nozione di campo fisico, permeante lo spazio, deve coesistere con la precedente «realtà newtoniana» di singole particelle interagenti tramite forze istantanee. 1 Più tardi, nel 1915, questa nozione di «campo» è divenuta un ingrediente fondamentale anche della teoria della gravità di Einstein dello spaziotempo curvo. Quelli che adesso sono chiamati i campi classici sono proprio il campo elettromagnetico di Maxwell e il campo gravitazionale di Einstein. Ma ora sappiamo che, per descrivere la natura del mondo fisico, occorre molto di più della sola fisica classica. Già nel 1900 Max Planck aveva rivelato i primi indizi della necessità di una «teoria quantistica», anche se fu necessario più di un quarto di secolo prima di ottenere una teoria ben formulata e completa. Ma oltre a tutti questi profondi cambiamenti alle basi «newtoniane» della fisica, vi erano stati altri importanti sviluppi, sia prima di questi cambiamenti che in coesistenza con alcuni di essi, nella forma di poderosi progressi matematici, all'interno della stessa teoria newtoniana. Questi progressi matematici saranno il soggetto del prossimo capitolo. Essi hanno importanti interrelazioni con la teoria dei campi classici e, cosa ancora più significativa, costituiscono una premessa essenziale alla corretta comprensione della meccanica quantistica, come verrà descritto in capitoli successivi. Come ulteriore e importante area di progresso, bisogna sicuramente considerare la termodinamica (e il suo perfezionamento, noto come meccanica statistica). Questa disciplina concerne il comportamento di sistemi formati da un grande numero di corpi, dove i dettagli dei singoli movimenti non so440
I campi classici di Maxwel/ e Einstein
no stimati importanti, in quanto il comportamento viene descritto in termini di valori medi di opportune quantità. Ciò rappresenta una conquista iniziata tra la metà del diciannovesimo e l'inizio del ventesimo secolo, tra i cui realizzatori figurano in primo piano Carnot, Clausius, Maxwell, Boltzmann, Gibbs e Einstein. Nel capitolo 27 tratterò alcuni dei più fondamentali e sconcertanti problemi sollevati dalla termodinamica. In questo capitolo descriverò le teorie di campo di Maxwell e Einstein, che abbracciano quella che ora chiamiamo la «fisica classica» dell'elettromagnetismo e della gravitazione. La teoria dell'elettromagnetismo svolge anche un ruolo importante nella teoria quantistica, fornendo il «campo» prototipo per l'ulteriore sviluppo della teoria quantistica dei campi che incontreremo nel capitolo 26. D'altra parte, l'appropriato approccio quantistico al campo gravitazionale rimane enigmatico e controverso. La trattazione di questi problemi quantistici/gravitazionali sarà una parte importante degli ultimi capitoli di questo libro ( dal capitolo 28 in avanti). Per la fisica che qui esaminiamo ci limiteremo comunque ai campi fisici nel loro aspetto classico. Ho evidenziato, all'inizio di questo capitolo, il fatto che un profondo mutamento nelle fondamenta newtoniane sia già cominciato nel diciannovesimo secolo, prima delle rivoluzioni dovute alla relatività e alla teoria quantistica nel ventesimo secolo. Le meravigliose scoperte sperimentali di Michael Faraday, intorno al 1833, e le rappresentazioni della realtà che aveva trovato necessarie per la loro sistemazione rappresentarono le prime indicazioni della necessità di un simile mutamento. Sostanzialmente il cambiamento fondamentale fu ritenere che le «particelle newtoniane» e le «forze» che agiscono tra di loro non fossero i soli abitanti del nostro universo. Uidea di un «campo» con un'esistenza incorporea doveva invece essere presa sul serio. Fu il grande fisico scozzese James Clark Maxwell, nel 1864, a formulare le equazioni che questo «campo incorporeo» deve soddisfare e a dimostrare che questi campi possono trasportare energia da un posto all'altro. Queste equazioni unificarono il comportamento dei campi elettrici, dei campi magnetici e persino della luce: ora sono conosciute semplicemente come le equazioni di Maxwell, le prime equazioni di campo relativistiche. Dall'osservatorio privilegiato del ventesimo secolo, grazie ai notevoli progressi nelle tecniche matematiche (qui faccio riferimento in particolare al calcolo sulle varietà che abbiamo visto nei capitoli 12-15), sembra che le equazioni di Maxwell abbiano una così convincente naturalezza e semplicità da farci quasi meravigliare del fatto che il campo elettromagnetico potesse obbedire a un differente tipo di leggi. Ma una prospettiva simile ignora il fatto che sono state le equazioni stesse di Maxwell a condurre a moltissimi di questi sviluppi matematici. È stata la forma di queste equazioni a guidare Lorentz, Poincaré ed Einstein alle trasformazioni spaziotemporali 441
LA STRADA CHE PORTA ALLA REALTÀ
della relatività speciale che, a loro volta, hanno condotto alla concezione di spaziotempo di Minkowski. Nella struttura dello spaziotempo, queste equazioni hanno trovato una forma che si è naturalmente sviluppata nella teoria di Cartan delle forme differenziali (§12.6); e le leggi della teoria di Maxwell sulla conservazione della carica e del flusso magnetico hanno condotto all'insieme di espressioni integrali che sono ora compendiate in quella meravigliosa formula, a cui si è fatto riferimento, in§§ 12.5,6, come teorema fondamentale del calcolo esterno. Forse sono stato un po' troppo estremo nelle mie valutazioni, attribuendo tutti questi progressi all'influenza delle equazioni di Maxwell. In realtà, nonostante le equazioni di Maxwell abbiano avuto indubbiamente un ruolo determinante, molti dei precursori di queste equazioni, come Laplace, D'Alambert, Gauss, Green, Ostrogradski, Coulomb, Ampère e altri, hanno avuto anch'essi un'influenza importante. Tuttavia, è sempre stato il bisogno di comprendere il campo elettrico e quello magnetico che ha fornito, in larga misura, la forza propulsiva alla base di questi sviluppi - e anche il campo gravitazionale. Il resto di questo capitolo è dedicato alla comprensione del campo elettromagnetico e di quello gravitazionale e al modo in cui s'accordano con la moderna struttura matematica.
19.2 La teoria elettromagnetica di Maxwell Che cosa sono dunque le equazioni di Maxwell? Sono equazioni differenziali alle derivate parziali (vedi §10.2) che descrivono l'evoluzione temporale delle tre componenti E 1, E 2 , E 3 del campo elettrico e delle tre componenti B 1, B 2 , B 3 del campo magnetico, quando la densità di carica elettrica p e le tre componentij1,j2 ,j3 della densità di corrente elettrica sono considerate quantità date. Possono essere incluse anche altre quantità di campo che hanno a che fare con l'ambiente materiale entro cui si ritiene che i campi si propaghino. Nelle discussioni di fisicafondamentale si usa trascurare quegli aspetti delle equazioni che si ricollegano a un simile ambiente, poiché questo consisterebbe, in realtà, di molti minuscoli costituenti, ciascuno dei quali dovrebbe essere trattato in linea di principio al livello più fondamentale. Sarà anche conveniente scegliere le cosiddette unità «gaussiane» e anche le coordinate standard di Minkowski (di §18.1 ), e precisamente x 0 = t, x 1 = x, x 2 = y, x 3 = z (segnatura+ - - -) con unità di spazio e tempo tali che la velocità della luce sia unitaria (c = I). Il campo elettromagnetico e la densità di carica-corrente sono riuniti rispettivamente (secondo una prescrizione originariamente dovuta, in effetti, a Minkowski) in una 2-forma F dello spaziotempo, nota come tensore di campo di Maxwell e in un vettore J dello spaziotempo, detto vettore di carica-corrente, con componenti mostrate in forma matriciale come 442
I campi classici di Maxwe/1 e Einstein
Foo
Fo1
Fo2
Fo3
o
E,
Fio
F;3 F23
-El
o
F20
F; 1 F'i2 F21 F22
-E2
F;o
F31
F;2
F33
-E3
B3 -B2
JO
p
JI
i1
J2 J3
i2 ]3
E2 -B3
E3
o
B2 -B,
B,
o
Si noti che vale l'antisimmetria Fba = Fab, come è richiesto per una 2-forma. Farò anche uso dei cosiddetti duali di Hodge di F e J, che sono rispettivamente la 2-forma 'F e la 3-forma *J, definite da
*Foo •p;o
*Fo, •F; I
*F20 •p;o
*F21
*Fo2 *F;2 *F22
'Fo3 *F;3 *F23
*F;l
*F32
*f;3
=
-BI
-B2
-B3
B,
o
-E3
E3 -E2
o
E2 -E,
E,
o
B2 B3
-p
*J,23 *J023
o
*J013
i, -J2
*Jo,2
}~
=
Si noti che valgono le richieste proprietà di antisimmetria 'Fab = *F[ab], *Jahc = *J[abcJ· In termini del tensore di Levi-Civita f (vedi § 12.7) con componenti totalmente antisimmetriche fabcd (= f[abcdJ) e normalizzato in modo che c0123 = 1, questi duali possono essere scritti come 1 •ppcd e *Jabc -ab - 2 8 abcd
8 abcd Jd ,
dove pab è semplicemente gac ghd Feci, in accordo con § 14. 7. Si noti che la versione «con indici innalzati» fabcd = gap ghq gcr g1sfpqrs soddisfa c0123 = - 1, da cui lo e di §12.7 è dato da[ 19 •1l fahcd = - rahcd. Vedi fig. 19.1 per la forma diagrammatica di queste operazioni di «passaggio al duale» (e anche delle stesse equazioni di Maxwell). Scopriremo che la nozione di «duale» in questo senso (e altri sensi a questo collegati) sarà importante per noi più avanti, in vari differenti contesti. Bisognerebbe fare un'osservazione sul significato geometrico del duale di Hodge. Si rammenti da § 12. 7 che l'operazione di passare da un bivettore H, co[19.1] Verificate entrambe queste affermazioni. 443
LA STRADA CHE PORTA ALLA REALTÀ
fì ½Tm ' =
ITTI
a
•pub
~
g =w
p, ]]]
Wf~·
a24
• ==-¾ l.ffi ffi == lTij
Fig. 19.1 - I diagrammi per i duali di Hodge e le equazioni di Maxwell. Le quantità €abcd (= c[abcdJ) e ebcd (= efabcdJ), normalizzate così che e 0123 = e 0123 = I in uno standard sistema di riferimento di Minkowski, sono collegate alle loro versioni innalzate/abbassate (per mezzo di g"b e gab) da Cahcd = - eabcd e eabcd = - cabcd_ Nei diagrammi (ultime due righe a sinistra) il cambiamento di segno è assorbito da una effettiva inversione di indici. Separate nel box in alto a destra ci sono le equazioni di Maxwell, la prima che usa il tensore F (con la sua forma innalzata p,b = g"c gbd Fcd; vedi fig. 14.21) così che le equazioni sono Va p,b = 47tl1', v[a FbcJ = O, e sotto quella che usa il duale 'F (dove 'P,b = ½Cabcd P"', '.!,,be Td) . . SOnO ..,, F - 4 4,r 'Jabc, ..,, ,:;,ab - O - tabcd" COSI' Che 1e eqUaZIOill V [a be) V a' . 3
me descritto dalla quantità antisimmetrica Bah, alla sua 2-forma «duale» IP, come data da ½f,abcd ncd, non fa molta differenza per la sua interpretazione geometrica. Se H, per esempio, fosse un bivettore semplice, così che anche la 2forma IP sarebbe semplice (vedi la fine di §12. 7), l'elemento di 2-piano determinato da IP sarebbe precisamente il medesimo elemento di 2-piano determinato da H (poiché la sola differenza è che, a rigor di termini, IP ha la qualità di una densità, come fatto notare in §12.7). D'altra parte, l'innalzamento di indici che ci porta da una 2-forma H 0 b a un bivettore Hab ( = Hcdgcagdh) ha un effetto geometrico più significativo. Nel caso di un bivettore semplice, l'elemento di 2-piano determinato da H 0 b è il complemento ortogonale dell'elemento di 2piano determinato da H0 h ( vedi §18 .3 ). Il duale di Hodge applicato alla 2-forma H 0 b, portandoci a ½cabcd fied ( vale a dire, a H#), impiega l'innalzamento di indici H 0 1, ~ H 0 h e quindi implica il passaggio al complemento ortogonale. Vedi fig. 19.2. Di conseguenza, anche il duale di Hodge che ci porta da Fa *F implica un complemento ortogonale. Dopo aver preparato questa notazione, le equazioni di Maxwell possono essere scritte molto semplicemente comer 19 .21 [19.2] Scrivetele in dettaglio, in termini delle componenti dei campi elettrico e magnetico, mostrando come queste equazioni forniscano un'evoluzione spaziotemporale dei campi elettrico e magnetico, in termini dell'operatore èJlèJt.
444
I campi classici di Maxwell e Einstein
Fig. 19.2 - Nel 4-spazio un bivettore semplice H (H"b) rappresenta il medesimo elemento di 2-piano della sua forma duale H# ½EaJ,cd Hc,1)- Ma la versione con indici abbassati di
H, la 2-forma semplice Hab, che è equivalente al suo bivettore «duale» ½ebcd Hcd, rappresenta l'elemento di 2-piano complemento ortogonale (vedi fig. 18.4). Quindi, è l'innalzamento/abbassamento degli indici nel duale di Hodge che porta al passaggio al complemento ortogonale.
dF=O,
d *F= 4n*J.
Possiamo anche scrivere le equazioni di Maxwell nella forma con indici come[l9.3J
Si noti che, se applichiamo l'operatore «d» di derivata esterna a entrambi i lati della seconda equazione di Maxwell d*F = 4n*J e usiamo il fatto che d2 = O (vedi § 12. 6), deduciamo che il vettore J di carica-corrente soddisfa la condizione di «divergenza nulla»[ 19 AJ d*J= O
o in modo equivalente
A questo punto, come leggera digressione che avrà considerevole importanza per noi più tardi (§32.2 e §§33.6,8,11 -vedi §18.3), vale la pena di mettere in evidenza la parti autoduale e antiautoduale del tensore di Maxwell, date rispettivamente da +p
= i (F -
i*F)
e
-p = ½(F + i*F)
[19.3] Dimostratene l'equivalenza al precedente paio di equazioni. [ 19.4] Mostrate che queste due versioni dell'annullamento della divergenza sono equivalenti. 445
LA STRADA CHE PORTA ALLA REALTÀ
(che sono complesse coniugate l'una dell'altra). Nella teoria quantistica queste quantità complesse descrivono, rispettivamente, i fotoni (quanti del campo elettromagnetico) destrogiri e levogiri; vedi §§22.7,12, fig. 22.7. Le proprietà autoduali e antiautoduali sono espresse inf 19-5l
Tenendo a mente che *J è reale, possiamo combinare le due equazioni di Maxwell nella forma
d +p = - 2rci*J. I fotoni forniscono la descrizione della luce in termini di particelle, e noi vedremo nel capitolo 21 come la teoria quantistica consenta la coesistenza di una descrizione della luce in termini di particelle con quella in termini di onde. Uno dei supremi risultati di Maxwell è stato quello di dimostrare, per mezzo delle sue equazioni, che vi sono onde elettromagnetiche che viaggiano con la velocità della luce e hanno tutte le note proprietà di polarizzazione che la luce possiede (e che noi esamineremo in §22.7). In accordo con questi notevoli fatti, Maxwell propose che la luce fosse davvero un fenomeno elettromagnetico. Nel 1888, circa un quarto di secolo dopo che Maxwell aveva pubblicato le sue equazioni, Heinrich Hertz confermò sperimentalmente il meraviglioso risultato teorico di Maxwell. Nelle descrizioni esplicite espresse in precedenza, ho supposto che lo spaziotempo soggiacente sia lo spazio piatto M di Minkowski e così continuerò a fare anche in §§19 .3 ,4 e nella prima parte di §19 .5. Tuttavia, ciò non è realmente necessario e tutte le conclusioni sono ancora valide, anche in presenza di uno spaziotempo curvo. A questo scopo, basta che le componenti sopra date siano considerate prese rispetto a un sistema di riferimento locale minkowskiano e la notazione con indici farà il resto.f 19-61
19.3 Leggi di conservazione e di flusso nella teoria di Maxwell I:annullamento della divergenza del vettore di carica-corrente ci fornisce l'equazione di conservazione della carica elettrica. II motivo per cui questa
[19.5] Fate vedere questo, dimostrando per prima cosa che il passare due volte al duale dà la quantità iniziale col segno meno. Questo segno si Jicollega alla segnatura lorentziana dello spaziotempo? Spiegate. '[I 9.6] Potete spiegarlo in dettaglio? Cosa avviene.alle componenti di F e 'Fin un sistema generale di coordinate curvilinee? Perché le equazioni•di Maxwell Jimangono inalterate se espresse correttamente?
446
I campi classici di Maxwell e Einstein
viene chiamata «equazione di conservazione» è che, per il teorema fondamentale del calcolo esterno (vedi§ 12.6), abbiamo f~d*J = fa/J, così che
quando integrata su qualunque 3-superficie chiusa Q nello spazio di Minkowski M. (Qualunque 3-superficie chiusa in M è la frontiera a;e di qualche regione 4-dimensionale compatta ie in M.) Vedi fig. 19.3. La quantità *J può essere interpretata come il «flusso di carica» (o la «portata» di carica) attraverso Q = a;e. In questo modo, quello che l'equazione precedente ci dice è che il flusso netto di carica elettrica attraverso questa
.t
Time
I
Fig.19.3 - La conservazione della carica elettrica nello spaziotempo. La 3-superficie chiusa Q è la frontiera Q = i)if;? di un 4-volume compatto il:?, nello spaziotempo di Minkowski Ml, così il teorema fondamentale del calcolo esterno ci dice JQd*J = f;ed'J = O, poiché d*J = O. La grandezza *J descrive il «flusso» di carica attraverso Q, così che la carica totale che entra attraverso Q è eguale a quella che esce, esprimendo la conservazione della carica.
447
LA STRADA CHE PORTA ALLA REALTÀ
frontiera deve essere zero, cioè la carica totale che entra in ~ deve essere esattamente uguale alla carica totale che ne esce: la carica elettrica è conservata. [I 9.71 Possiamo anche usare la seconda equazione di Maxwell d*F = 4n*J per derivare la cosiddetta «legge di Gauss». Questa legge si applica a un istante particolare t = t0 , così che ora impieghiamo la versione tridimensionale del teorema fondamentale del calcolo esterno. Questa ci dà il valore della carica totale che si trova al tempo t0 entro qualche 2-superficie chiusa S (vedi fig. 19.4), esprimendola come integrale su S del duale del tensore di Maxwell *F, il che significa che possiamo ottenere la carica totale abbracciata da S, se integriamo il flusso totale del campo elettrico E attraverso sJ19,sJ
Più in generale, ciò vale persino se S non si trova in un certo istante fissato t = t0 • Supponiamo che S sia la 2-frontiera di genere spazio di qualche regione 3-spaziale compatta A; allora la carica totale X nella regione A, circondata da S (o, in termini di spaziotempo, «infilata in» S - vedi fig. 19 .4), è data da
fs'F = 41tX
dove X =
'I
J./J.
Fig. 19.4 - Dentro la 3-superficie di tempo costante t = t0 , l'equazione di Maxwell d'F = 41t'J ci dà la legge di Gauss, per mezzo della quale l'integrale del flusso elettrico (I 'integrale di 'F) su una 2-superficie spaziale chiusa misura la carica totale racchiusa (per il teorema fondamentale del calcolo esterno). In effetti, questo non è ristretto a 2-superfici a tempo costante, e la legge di Gauss è così generalizzata.
[19.7] Questo ragionamento, anche se corretto, è stato dato in modo alquanto disinvolto. Esponete i dettagli più completamente nel caso in cui 'R è un cilindro dello spaziotempo che consiste di una regione spaziale limitata costante nel tempo, durante un fissato intervallo finito della coordinata temporale t. Spiegate le diverse nozioni di "flusso di carica" implicate, mettendo a confronto quella per la "base" e la "cima" di genere spazio del cilindro con quella per i "lati" di genere tempo. [19.8] Spiegate in dettaglio perché questo è proprio il flusso elettrico. 448
I campi classici di Maxwell e Einstein
Possiamo anche ottenere una legge affine di conservazione dalla prima equazione di Maxwell, dF =O.Questa ha proprio la stessa forma della seconda equazione di Maxwell, solo che F sostituisce *F e la «sorgente» corrispondente a *J è zero. In questo modo, per qualsiasi 2-superficie chiusa nello spazio di Minkowski, 2 abbiamo sempre la legge di flusso
fsF= O. Si noti che nel passaggio da *F a F ( o da F a *F) scambiamo semplicemente tra loro i vettori del campo elettrico e del campo magnetico (con un cambiamento di segno per uno di essi). l?assenza di una sorgente per F è un'espressione del fatto che (per quanto se ne sa) non vi sono monopoli magnetici in Natura. Un monopolo magnetico sarebbe un polo magnetico nord o sud da solo, invece di comparire in coppia con il polo opposto come avviene in una comune calamita. (Questi poli non sono entità fisiche indipendenti, ma sono dovuti alla circolazione di cariche elettriche.) Sembra che in Natura non vi sia mai una «carica magnetica» netta («forza del polo» diversa da zero) su un oggetto fisico. Dal solo punto di vista delle equazioni di Maxwell, non sembra esserci nessun valido motivo per l'assenza di monopoli magnetici, poiché potremmo semplicemente aggiungere un lato destro alla prima equazione di Maxwell, dF = O, senza alcuna perdita di coerenza. In effetti, di quando in quando, i fisici hanno contemplato la possibilità che possano realmente esistere monopoli magnetici e hanno tentato di scoprirli. La loro esistenza avrebbe importanti conseguenze per la fisica delle particelle (vedi §28.2), ma non vi è nessuna indicazione, fino a ora, che nell'universo reale vi siano simili monopoli.
19.4 Il campo di Maxwell come curvatura di gauge La prima equazione di Maxwell, dF = O, implica anche che F= 2dA,
per qualche I -forma A. (Questo viene ottenuto sfruttando il «lemma di Poincaré», che stabilisce che se la r-forma a soddisfa da= O, allora localmente vi è sempre una (r - I)-forma p per la quale a= d~; vedi§ 12.6.) Inoltre, in una regione con topologia euclidea, questo risultato locale diventa globale.3 La quantità A è chiamata potenziale elettromagnetico; non è determinata in modo unico dal campo F, ma l'indeterminazione consiste nell'addizione di una quantità d0,l 19 •9l dove 0 è un qualsiasi campo scalare reale:
A~ A+ d0. [19.9] Perché possiamo aggiungere una simile quantità? 449
LA STRADA CHE PORTA ALLA REALTÀ
Nella forma con indici, queste relazioni sono
con la libertà
Questa «libertà di gauge» del potenziale elettromagnetico ci dice che A non è una quantità localmente misurabile. Non vi può essere nessun esperimento per misurare «il valore di A» in qualche punto, perché A + d0 serve esattamente allo stesso scopo fisico a cui serve A. Il potenziale, tuttavia, fornisce la chiave matematica alla procedura con cui il campo di Maxwell interagisce con qualche altra entità fisica 'P. Come funziona questa cosa? Il ruolo specifico di Aa è che ci fornisce una connessione di gauge (o connessione di fibrato, vedi §15.8)
dove e è un particolare numero reale che quantifica la carica elettrica dell'entità descritta da 'P. In realtà, questa «entità» sarà solitamente qualche particella quantica carica, come un elettrone o un protone, e 'P sarà allora la sua funzione d'onda quantistica. Nel capitolo 21 approfondiremo il significato di questi termini, quando verrà spiegata la nozione di funzione d'onda; tutto quello che ci occorre conoscere al momento è che 'P deve essere pensata come una sezione di un fibrato ( § 15 .3 ), un fibrato che descrive campi con carica, ed è su questo fibrato che V agisce come una connessione. Le quantità F e A del campo elettromagnetico non hanno carica (e= O), così che tutte le equazioni di Maxwell, eccetera, non sono disturbate da questa nuova definizione per Va (cioè, in quelle equazioni abbiamo ancora Va = èJ!èJxa, nelle coordinate di uno spazio piatto di Minkowski - o nella generalizzazione appropriata, vedi §14.3, se consideriamo uno spaziotempo curvo). Quale è la natura geometrica del fibrato su cui agisce questa connessione? Si potrebbe pensare che questo fibrato abbia fibre che sono cerchi (S 1) sullo spaziotempo M, dove questo cerchio descrive un moltiplicatore difase ei8 per 'P. (Analogamente a quanto avviene nella rappresentazione «Kaluza-Klein» a cui abbiamo fatto riferimento in §15.1, ma in cui l'intero fibrato è pensato come «spaziotempo».) È più opportuno pensare che il fibrato sia il fibrato vettoriale dei possibili valori di 'P in ciascun punto, dove la libertà di moltiplicazioni di fase rende il fibrato un U(l) fibrato sullo spaziotempo M. (Questo tipo di problema è stato considerato alla fine di §15.8.) Affinché questa cosa abbia un senso, 'P deve essere un campo complesso la cui interpretazione fisica sia, in un certo senso appropriato, insensibile alla sostituzione 'P ~ ei 8'P (dove 0 è un qualche campo a valori reali sulla varietà 450
I campi classici di Maxwell e Einstein
?lt). Questa sostituzione viene chiamata trasformazione di gauge elettromagnetica, e il fatto che l'interpretazione fisica non dipenda da questa sostituzione è noto come invarianza di gauge. Così, la curvatura della nostra connessione di fibrato è il tensore di campo di Maxwell F b.l1 9·10l Prima di proseguire con queste idee, è opportuno fare alcune brevi osservazioni storiche. Tre anni dopo l'introduzione da parte di Einstein della sua teoria della relatività generale del 1915, Hermann Weyl suggerì una generalizzazione in cui la stessa nozione di lunghezza diventava dipendente dal cammino. (Hermann Weyl, 1885-1955, è stato un importante matematico del ventesimo secolo. Anzi, a mio parere è stato il più autorevole, e non solo come matematico puro, ma anche come fisico.) Nella teoria di Weyl i coni nulli mantengono il ruolo fondamentale che hanno nella teoria di Einstein (per esempio, per definire le velocità limiti per particelle massive e per fornirci il «gruppo di Lorentz» locale che deve agire in prossimità di ciascun punto), così che una metrica lorentziana (per esempio,+ - -) g è ancora localmente richiesta allo scopo di definire questi coni. Non vi è, tuttavia, nessuna scala assoluta per le misure di tempo e di spazio, nello schema di Weyl, così che la metrica è data solo fino a un fattore di proporzionalità. In questo modo, sono permesse trasformazioni di forma 0
gl-?Àg
per qualche (per esempio, positiva) funzione scalare 'A sullo spaziotempo 'ìlt, poiché queste non mutano i coni nulli di 'ìlt. (Queste trasformazioni vengono chiamate cambiamenti conformi di scala della metrica g; nella teoria di Weyl ciascuna scelta di g ci fornisce una possibile gauge - calibrazione-, in termini della quale possono essere misurati tempi e distanze.) Sebbene Weyl possa aver avuto in mente soprattutto le distanze spaziali, sarà opportuno per noi pensare in termini di misurazioni di tempo (in accordo con il punto di vista del capitolo 17). In questo modo, nella geometria di Weyl, non vi sono «orologi ideali» assoluti: il ritmo con cui qualunque orologio misura il tempo dipenderebbe dalla sua storia. La situazione è «peggiore» di quella presentata nel «paradosso dell' orologio», da me descritto in § 18.3 (fig. 18.6d). Nella geometria di Weyl, possiamo concepire un viaggiatore spaziale che va su una stella lontana e poi ritorna sulla Terra trovando non solo che gli abitanti della Terra sono invecchiati molto più di lui, ma anche che gli orologi sulla Terra viaggiano ora a un ritmo diverso da quelli sulla nave spaziale! Vedi fig. 19.5a. Impiegando questa idea sensazionale, Weyl fu in grado d'incorporare le equazioni della teoria elettromagnetica di Maxwell nella geometria dello spaziotempo. [19.10] Dimostratelo. Suggerimento: date un'occhiata a §15.8. 451
LA STRADA CHE PORTA ALLA REALTÀ
I I
(b)
Fig.19.5 - Nell'originale teoria di gauge dell'elettromagnetismo di Weyl, la nozione di intervallo temporale (o di intervallo spaziale) non è assoluta ma dipende dal cammino intrapreso. (a) Un confronto con il «paradosso dell'orologio» illustrato in fig. 18.6: nella teoria di Weyl vediamo che il viaggiatore spaziale arrivando a casa (linea d'universo ABC) trova differenze non solo tra gli orologi sulla Terra (strada diretta AB) e quelli sulla nave spaziale, ma anche differenze di ritmo tra loro! (b) La curvatura del gauge di Weyl (che dà il campo F di Maxwell) proviene da questa variazione (conforme) della scala temporale quando percorriamo un loop infinitesimo (la differenza tra due cammini da p a un punto p' prossimo).
Essenzialmente, fece ciò codificando il potenziale elettromagnetico in una connessione di fibrato, proprio come ho fatto io prima, ma senza l'unità immaginaria «i» nell'espressione per Va. Possiamo pensare che l'appropriato fibrato sopra i1t sia dato dalle metriche lorentziane g che hanno gli stessi coni nulli. In questo modo, la fibra sopra qualche punto x di i1t consiste di una famiglia di metriche proporzionali (dove possiamo, se lo desideriamo, scegliere un fattore di proporzionalità positivo). Questi fattori sono i possibili «'A» in g ~ Àg. Per qualsiasi scelta particolare della metrica, abbiamo una gauge con cui sono definite distanze o intervalli di tempo lungo curve; ma non vi è nessuna scelta assoluta di gauge, e quindi nessuna scelta privilegiata di metrica tra la classe di equivalenza di quelle proporzionali. Vi è, tuttavia, qualche struttura addizionale a questa struttura di cono nullo (vale a dire alla struttura conforme), e precisamente una connessione di fibrato - o connessione di gauge - che Weyl introdusse affinché la sua curvatura fosse il tensore F (cioè Fab) di Maxwell. Questa curvatura misura la discrepanza tra i ritmi degli orologi, come viene illustrato in fig. 19.5a quando le linee d'universo sono soltanto infinitesimamente separate; vedi fig. 19.5b). (Questo può essere confrontato con il «fibrato stirato» g,c, sopra C, considerato in §15.8, fig. 15.16 e fig. 15.21; il concetto fondamentale di fibrato è molto simile.) Quando Einstein venne a conoscenza di questa teoria, informò Weyl che aveva una obiezione fondamentale dal punto di vistafisico, nonostante l'eleganza 452
I campi classici di Maxwell e Einstein
matematica delle sue idee. Le frequenze spettrali, per esempio, non sono affatto influenzate dalla storia di un atomo, come predetto dalla teoria di Weyl. E, ancora più fondamentale, sebbene non tutte le regole quantistiche importanti (che discuteremo più avanti, in §21.4, §§23.7,8) fossero state completamente formulate fino a quel momento, la teoria di Weyl è in conflitto con l'identità, necessariamente esatta, tra particelle dello stesso tipo (vedi §21.4). Vi è, in particolare, una relazione diretta tra ritmi degli orologi e masse delle particelle. Come vedremo più avanti, una particella con massa di riposo m ha una frequenza naturale mc2h- 1, dove h è la costante di Planck e c è la velocità della luce. In questo modo, nella geometria di Weyl, non solo i ritmi degli orologi ma anche la massa di una particella verrebbe a dipendere dalla sua storia. Di conseguenza, due protoni con storie differenti avrebbero quasi certamente masse diverse, secondo la teoria di Weyl. Ciò violerebbe un altro principio quantistico, e precisamente quello per cui tutte le particelle dello stesso tipo devono essere esattamente identiche (vedi §§23.7,8). Anche se questa fu un'osservazione estremamente sfavorevole per la versione originaria della teoria di Weyl, si comprese più tardi4 che la stessa idea avrebbe funzionato se la «gauge» di Weyl non si fosse riferita a una legge di scala reale (tramite À), ma a una legge di scala tramite un numero complesso di modulo unitario (ei8). Questa può sembrare un'idea strana, ma come vedremo nel capitolo 21 e successivi (vedi §§21.6,9 in particolare), le regole della meccanica quantistica ci forzano all'impiego di numeri complessi nella descrizione dello stato di un sistema. Vi è, in particolare, un numero complesso di modulo unitario e;e che può moltiplicare questo «stato quantico» - lo stato a cui si fa spesso riferimento come \J' - senza conseguenze osservabili, localmente. Questa «non osservabile» trasformazione di tipo 'I' ~ ei8\J' ancora oggi viene chiamata «trasformazione di gauge», anche se ora non vi è nessuna variazione della scala delle lunghezze, poiché la variazione è una rotazione nel piano complesso (un piano complesso senza un collegamento diretto con dimensioni spaziali o temporali). In questa forma stranamente contorta, l'idea di Weyl ha fornito l'opportuna collocazione fisica per una connessione U(l) del tipo che ho illustrato alla fine del capitolo 15, e ora è alle fondamenta della moderna rappresentazione del modo con cui il campo elettromagnetico effettivamente interagisce. L:operatore V, definito in precedenza per mezzo del potenziale elettromagnetico (cioè, V"= èJ!èJx" - ieAa), fornisce una connessione di U(l)-fibrato sul fibrato delle funzioni d'onda quantistiche con carica \j/ (vedi §21.9). È interessante osservare che la dipendenza dal cammino della connessione (che possiamo confrontare con la dipendenza dal cammino illustrata in fig. 19.5) si manifesta in modo sensazionale in certi tipi di situazione sperimentale, che illustrano quello che è noto come effettoAharonov-Bohm. 5 Poiché la nostra connessione V opera solo a livello di fenomeni quantistici, negli esperimenti classici non vediamo questa dipendenza dal cammino; l'effetto AharonovBohm dipende, invece, dall'inte1ferenza quantistica (vedi §21.4 e fig. 21.4). 453
LA STRADA CHE PORTA ALLA REALTÀ
Nella versione più nota (vedi fig. 19.6a), gli elettroni sono indirizzati verso uno schenno che li rivela, passando per due regioni in cui non vi è nessun campo elettromagnetico (F = O), ma che sono separate tra loro da un lungo solenoide cilindrico (che non contiene linee di forza magnetiche). In nessun momento gli elettroni incontrano un campo F che non sia nullo; tuttavia, la regione pertinente R, libera dal campo, (che parte dalla sorgente, si biforca per passare dai due lati del solenoide e poi si riunisce sullo schermo) non è semplicemente connessa e il campo F all'esterno di R è tale che non vi è nessuna scelta di gauge per cui il potenziale A si annulli ovunque all'interno di R. La presenza di questo potenziale non nullo nella regione R non semplicemente connessa - o, più correttamente, la dipendenza dal cammino di V in R- porta a uno spostamento nelle frange d'interferenza sullo schermo. I.: effetto di spostamento delle frange non dipende infatti dai particolari valori locali che A potrebbe avere (cosa che non potrebbe avvenire, perché A non è localmente osservabile, come detto prima), ma da un certo integrale non locale di A:Questo è la quantità pA, presa lungo un circuito chiuso, non banale dal punto di vista topologico, entro R. Vedi fig. 19.6b. Poiché dA si annulla entro R (perché F = O in R), l'integrale pA non cambia se muoviamo con continuità il nostro circuito chiuso entro R.[ 19· 11 1Da ciò segue che il non annullamento di pA, entro una regione in cui non c'è campo, e quindi lo stesso effetto Aharonov-Bohm, dipende dal fatto che questa regione in cui non c'è campo è non banale dal punto di vista topologico. A causa delle sue origini storiche nella notevole idea di Weyl - che inizialmente svolse davvero un ruolo come «gauging» (calibrazione) dipendente dal cammino -, chiamiamo questa connessione elettromagnetica V
specchio
(a)
(b)
Fig.19.6 - I.;effetto Aharonov-Bohm. (a) Un fascio di elettrnni è diviso in due cammini che passano ai due lati di una collezione di linee di flusso magnetico (ottenuto per mezzo di un lungo solenoide). I fasci sono riw1iti su uno schermo e la risultante strnttura d'interferenza quantistica (confronta con fig. 21.4) dipende dall'intensità del flusso magnetico - nonostante gli elettroni viaggino sempre in un campo nullo (F= O). (b) I.;effetto dipende dal valore di g>A, che può essere diverso da zero sul rilevante cammino chiuso, non banale dal punto di vista topologico, nonostante F sia nullo su questo cammino. La grandezza pA non cambia per defom1azioni continue del cammino nella regione senza campo elettromagnetico. [19.11] Spiegatelo. 454
I campi classici di Maxwell e Einstein
connessione di gauge: questo nome è anche adottato per le generalizzazioni dell'elettromagnetismo, a cui si fa riferimento come «teoria di Yang-Mills», che sono impiegate nella descrizione delle interazioni deboli e forti nella moderna fisica delle particelle. Si noti che l'idea di «connessione di gauge» dipende realmente, parlando in termini rigorosi, dall'esistenza di una simmetria (che per l'elettromagnetismo è la simmetria 'I' H> ei 8'l') che viene supposta esatta e non direttamente osservabile. Ricordiamo l'obiezione di Einstein all'originaria idea di gauge di Weyl, che si basava in effetti sul fatto che la massa di una particella, e perciò la sua frequenza naturale, è direttamente misurabile, in modo che non può essere usata come un «campo di gauge» nel senso richiesto. Scopriremo più avanti che tale questione viene «infangata» in alcuni impieghi moderni dell'idea di «gauge».
19.5 Il tensore energia-quantità di moto Come requisito preliminare, prima rivolgere la nostra attenzione all'altro campo classico fondamentale con i suoi aspetti di «teoria di gauge», vale a dire il campo gravitazionale, sarà importante prendere in esame la questione della densità di energia di un campo, poiché questa densità è la sorgente della gravità. Infatti la famosa equazione di Einstein E = mc 2 ci dice che la massa e l'energia sono fondamentalmente la stessa cosa (vedi §18.6) ed è la massa, come ci aveva già spiegato Newton, a essere la sorgente della gravitazione. Perciò abbiamo bisogno di comprendere come descrivere la densità di energia di un campo, come quello di Maxwell, e in che modo questa possa agire come sorgente della gravità. Einstein ci dice che lo fa tramite una grandezza tensoriale nota come il tensore energia-quantità di moto; questo è un tensore simmetrico T di tipo [g] (la cui forma con indici è Tah = T1,a) che soddisfa una «equazione di conservazione»
(Per il resto di questo capitolo, usiamo l'operatore di derivata covariante Va al posto di a1ax1. Poiché i nostri campi qui sono tutti senza carica, possiamo trasferire le nostre precedenti espressioni, senza mutamenti; vedi anche il paragrafo finale di §19.2, la nota 19.2 e l'esercizio [19.6].) Possiamo confrontare questa espressione con l'equazione di conservazione VaJa = Oper la carica elettrica; il motivo per l'indice in più di Tab è che la cosa che viene conservata, e precisamente l'energia-quantità di moto, è una grandezza 4-(co)vettoriale (il 4-(co)vettore energia-quantità di moto p a, considerato in § 18. 7) e non una quantità scalare come la carica elettrica. Per descrivere il contenuto fisico di Tab un po' più completamente, conviene passare alla grandezza equivalente T 11, = gac 1;;1,, dove uno degli indici è stato innalzato con l'impiego del tensore metrico 455
LA STRADA CHE PORTA ALLA REALTÀ
La quantità T\ riunisce assieme tutte le diverse densità e flussi dell'energia e della quantità di moto dei campi e delle particelle. In tennini più specifici, in un sistema standard di coordinate di Minkowski, il covettore T°6 definisce la densità della 4-quantità di moto e i tre covettori T 1b, T2i,, T 36, danno il flusso della 4-quantità di moto nelle tre direzioni spaziali indipendenti. Questo è direttamente analogo al caso di J", poiché J 0 è la densità di carica e le tre quantità J1, J2, P, danno il flusso di carica (cioè la corrente) nelle tre direzioni spaziali indipendenti. È l'indice in più «b» che ci dice che adesso la nostra legge di conservazione si riferisce a una grandezza (co)vettoriale. In particolare, avviene che la quantità T00 misura la densità di energia e T 11 , T2z, T33 , misurano la pressione, nelle tre direzioni delle coordinate spaziali. Si rammenti che Maxwell ci ha insegnato che i campi elettromagnetici in sé e per sé trasportano energia. Nella notazione con indici, il tensore energiaquantità di moto del campo elettromagnetico è dato dall'espressione[ 19· 13l g"b.f
19 12 · l
1 Sn
(Fac Fc b + *Fac *Fc b) ·
Anche altri campi fisici hanno i loro tensori energia-quantità di moto, e diversi contributi di questo tipo dovrebbero essere sommati assieme per produrre il completo tensore energia-quantità di moto T, che soddisfa l'equazione di conservazione varab = O. Tuttavia, avviene qualcosa di molto diverso con l'energia-quantità di moto del campo gravitazionale, come vedremo tra poco. Quando la gravità è assente, lo spaziotempo è piatto (cioè è uno spazio di Minkowski) e possiamo usare coordinate piatte (minkowskiane). Allora ciascuno dei quattro vettori ra0, ra,, ra2e T'\ soddisfa individualmente la stessa equazione di conservazione di J" ( e precisamente 'ilaT"0 = O, eccetera in analogia a 'ilaT" = O), con la conseguenza che vi è una legge integrale di conservazione esattamente analoga a quella della carica (cioè, analoga a fQ*J= O), separatamente per ciascuna componente dell'energia-quantità di moto. In questo modo, è conservata la massa totale e anche le tre componenti della quantità di moto totale; ma ricordate la discussione del principio di equivalenza di Einstein del capitolo 17 e del perché questo ci conduce a uno spaziotempo curvo. Così, quando è presente la gravità, dobbiamo tenere conto del fatto che «Va» non è più semplicemente «òlèJxa», ma (in accordo con §14.3) vi sono termini extra rbac che confondono il significato stesso di «'ilaPo» e che certamente ci impediscono di derivare una legge integrale di conservazione per l'energia e la quantità di moto solo dalla nostra «equazione di conservazione» 'il"Tah =O.Il pro[ 19 .12] Come si collegano a T,,1> le singole componenti T"1,, in un sistema di riferimento di Minkowski, in cui le componenti gah hanno la forma diagonale (I, - 1, - 1, - 1)? [19.13] Fate vedere che questa espressione soddisfa l'equazione di conservazione v''T,b = O se J = O. Ottenete la 00-componente di questo tensore e ritrovate 1'espressione originale di Maxwell (E2 + B 2)/8rc per la densità di energia del campo elettromagnetico in termini delle componenti del campo elettrico (E 1, E 2, E 3) e di quello magnetico (B1, B 2 , B 3). 456
I campi classici di Maxwe/1 e Einstein
blema può essere formulato come il fatto che l'indice extra «b» in Tab gli impedisce di essere il duale di una 3-forma e non possiamo scrivere una formulazione, indipendente dalle coordinate, della «equazione di conservazione» (come l'annullamento della derivata esterna della 3-forma *Jin «d*J= O»). Sembra che abbiamo perso le più fondamentali leggi di conservazione della fisica, le leggi di conservazione dell'energia e della quantità di moto! In realtà, vi è una prospettiva più soddisfacente per la conservazione di energia-quantità di moto, che riguarda non solo lo spazio di Minkowski ma anche certi spazitempo curvi 'lit, e si applica anche alla conservazione del momento angolare (vedi§ 18.6 e §§22.8, 11 ). Per questa prospettiva supponiamo di avere un vettore di Killing K per 'lit (questo soddisfa l'equazione Vd = O, ùL/ù\J!c = O, ùL/ù Vc\J!d = cpc O
(
(che sono tutte immediate nel caso dell'integrale per una particella dato sopra).r22.4l Queste equazioni implicano anche ( + X I o/) = ( I o/) + (x Io/), (a I'I') = a ( I'!').l22 •5l Inoltre, una volta che la norma è nota, il prodotto scalare può essere definito mediante essa,[2 2 •6l così che le trasformazioni lineari che preservano la norma devono preservare anche il prodotto scalare. In aggiunta, uno spazio di Hilbert dovrebbe soddisfare certe proprietà molto fondamentali di continuità. 5 La notazione precedente fa parte dello schema di notazioni (molto utile e largamente impiegato) per la meccanica quantistica introdotto dal grande fisico del ventesimo secolo Paul Dirac. Come ingrediente di questo sche_ma generale, si 'dimostra utile ritenere che espressioni come
I\Jf), 11' ), I ➔), I..,,), Io), I1), I+), Ix), IMoRm) o IF1N1rn) rappresentino vari vettori di stato appartenenti allo spazio di Hilbert H, dove il simbolo entro I ... ) è un'etichetta appropriata (e forse indimenticabile) che indica lo stato in questione. A volte vengono chiamati anche vettori «ket». In corrispondenza di ciascuno di questi ket vi è un particolare vettore [22.2] Provate a vedere il motivo per cui l'integrale ( Oper tutti i I w) diversi da zero, da cui segue che tutti gli autovalori di -;?I (i valori dell'energia) sono positivi, sebbene questo non sia necessario per la natura unitaria dell'evoluzione. Otteniamo immediatamente (usando la proprietà di Leibniz per la derivata di un prodotto, vedi §6.5, e le proprietà descritte sopra) 535
LA STRADA CHE PORTA ALLA REALTÀ
:t($1'1') =(:t$1'J1)+($1:t 'I') =(-iJi-1~,'\jl) + ($j-iJi-l~lf/) =in-1($1~1'1')-in-1( $1~1'1') =0, mostrando che i prodotti scalari sono davvero preservati, cioè 1' evoluzione di Schrodinger è unitaria.r2 2·71Lo stesso argomento è valido anche per altri operatori hermitiani, come i generatori delle traslazioni spaziali o delle rotazioni, mostrando che anche questi corrispondono a trasformazioni unitarie di H. L'equazione precedente indica che il tasso di variazione di un prodotto scalare($ I 'V) è zero; da ciò segue che ($1 'I') rimane invariato per tutto il tempo, quando I$) e I 'Jf) subiscono individualmente l'evoluzione di Schrodinger secondo il medesimo ~- Supponiamo di avere ali 'istante t = Ogli stati quantici I $) e I 'I') e di farli evolvere, secondo la prescrizione di Schrodinger, fino al tempo T, quando gli stati diventano rispettivamente I$r) e I 'l'r): I$)--1 $r) e i 'I'),_ I'lfr), (usaqpo la notazione "di §22.2). _Allora " . ($I 'V)= ($r1 'l'r), Questo ci dice che l'azione lineare dell'evoluzione di Schrodinger sullo spazio di Hilbert H, presa da t = O fino a un certo tempo t = T, è unitaria, nel senso che vi è un operatore Ur che effettua questa trasformazione I$r) =Uri$),
1'l'r) = Uri 'Jf), eccetera,
dove questo operatore Urè unitario nel senso di §13.9, vale a dire che il suo inverso è uguale al suo aggiunto: Uj 1 = u;
cioè
Ur u; = u;ur=I.
Qui I è l'operatore identità di H. (Vedi § 13 .9 per la dimostrazione di questa proprietà di Ur,) Come si è accennato in §22.1, vi sono altri modi di rappresentare l' evoluzione di uno stato quantico, e il più conosciuto di questi è chiamato rappresentazione di Heisenberg. In questa rappresentazione si considera che lo «stato» del sistema rim;mga costante nel tempo, mentre sono le variabili dinamiche a subire l'evoluzione temporale. Il lettore potrebbe domandarsi come sia possibile ritenere che lo stato «non muti» se qualche effettivo cambiamento fisico potrebbe aver luogo nel sistema quantico! Ma il passaggio [22.7] Chiarite un po' più completamente questo argomento. Sapete spiegare perché ci dovremmo aspettare che la proprietà di Leibniz valga per il prodotto scalare di uno spazio di Hilbert? 536
Algebra, geometria e spin quantistici
dalla rappresentazione di Schrodinger a quella di Heisenberg è proprio soltanto una questione di ridefinire i nostri simboli. Consideriamo dapprima la comune rappresentazione di Schrodinger che abbiamo adottato finora. Abbiamo uno stato quantico hv) all'istante t = O, che supponiamo evolva secondo la prescrizione di Schrodinger, come è definita da una data hamiltoniana quantistica 'rii, così che dopo qualche tempo T lo stato è I\jf r ): ' i 'I'),__,,. 1 'l'r) = Ur I \jf). Si rammenti che l'azione di Ur si applica, in realtà, linearmente all'intero spazio di Hilbert H, così che qualsiasi altro stato I ) subirebbe una corrispondente evoluzione I) ⇒ I r/ = Uri !, con il medesimo Ur usato per I\jf). Nella rappresentazione di Heisenberg, ridefiniamo semplicemente lo «stato» al tempo T come È evidente che lo «stato di Heisenberg» i 'l'JH non cambia (fondamentalmente per definizione!) col passare del tempo. D'altra parte, affinché tutte le procedure algebriche•si susseguano come prima, in modo che gli autovalori (i parametri fisici misurati) siano gli stessi della rappresentazione di Schrodinger, richiediamo che le variabili dinamiche evolvano in modo compensatorio. Perciò qualunque operatore lineare Q (agente su H) deve essere rimpiazzato dalla sua versione di Heisenberg
QH= U; 1 Q Ut=
u; Q Ut.
Da questo segue direttamente che la versione di Heisenberg di qualunque autovalore o di qualunque prodotto scalare è la stessa di quella di Schrodinger. l22•8l L'evoluzione di Heisenberg si applica ora agli operatori Q (supposti costanti nella rappresentazione di Schrodinger) e in particolare alle variabili dinamiche. Troviamo chel22 •9l . d lfl dt QH
= 'ri'QH - QH 'rii'
che sono le equazioni di moto di Heisenberg. (Si noti che un'ovvia conseguenza di ciò è la conservazione dell'energia, quando Q11 = 'rii.) lettore potrebbe domandarsi che cosa abbiamo guadagnato col riscrivere le cose in questo modo; in alcuni contesti vi possono essere vantaggi tecnici nella rappresentazione di Heisenberg, ma non vi sono certamente vantaggi per quanto riguarda i misteri interpretativi della meccanica quantistica. Il problema dei «salti quantici» non è scomparso, ma possiamo scegliere di incolpare lo stato, che concede a i 'l'/H di «saltare» in qualcosa d'altro in se-
n
[22.8] Spiegate in dettaglio tutto questo. [22.9] Vedete se sapete confermare questo. 537
LA STRADA CHE PORTA ALLA REALTÀ
guito all'operazione di R, o supporre invece che siano le variabili dinamiche di Heisenberg a fare il «salto»! A mio parere, trovo che tali questioni di «salti» diventano ancora più oscure nella rappresentazione di Heisenberg, senza che si arrivi ad alcuna soluzione. Nella rappresentazione di Schrodinger abbiamo almeno un vettore di stato che evolve e che ha la possibilità di fornirci qualche vaga percezione di quella che potrebbe essere la «realtà quantistica»! Non sembra che la rappresentazione di Heisenberg abbia molte probabilità di fare ciò, poiché il suo vettore di stato rimane là immobile anche se ha luogo qualche azione fisica. Inoltre, l'evoluzione delle variabili dinamiche non può rappresentare il cambiamento di qualsiasi specifico sistema fisico, perché non descrivono affatto sistemi specifici, ma invece domande che possono essere chieste per un sistema, come «quale è la tua posizione», eccetera. Il motivo di avere queste due diverse rappresentazioni è in gran parte storico. Heisenberg fu il primo, proponendo il suo schema nel luglio 1925, mentre Schrodinger avanzò la sua proposta sei mesi dopo, nel gennaio 1926, rendendosi conto poco più tardi dell'equivalenza dei due schemi. Fu Max Bom ad avanzare per primo l'interpretazione probabilistica del quadrato del modulo I\jn 2 della funzione d'onda (§21.9) nel giugno 1926, mentre lo stesso Schrodinger aveva tentato di attenersi a un'interpretazione «più classica» di '1'· La struttura operatoriale generale nacque dall'opera di Heisenberg, Bom e Pascual Jordan, e fu completamente formulata e descritta in dettaglio da Dirne nel suo autorevole libro The Principles ofQuantum Mechanics, pubblicato nel 1930. 7 Naturalmente potrà succedere che, quando verrà introdotto un cambiamento nella teoria quantistica, vi potranno essere buoni motivi per preferire un formalismo a un altro, e l'equivalenza tra i due sarà rotta. Questo è, moderatamente, il caso persino della teoria quantistica dei campi (vedi capitolo 26), che tenta di riunire in uno schema coerente la teoria quantistica e la relatività speciale. Dirac ha presentato alcuni argomenti per preferire 8 la rappresentazione di Heisenberg in questo caso. Tuttavia, né la rappresentazione di Heisenberg né quella di Schrodinger sono relativisticamente invarianti, e qualche volta in questo contesto9 viene preferita un'ibrida «rappresentazione di interazione».
22.5 «Osservabili» quantistiche Esaminiamo ora come deve essere rappresentata nel formalismo una misurazione di un sistema quantistico. Come rimarcato in §22.1, gli esempi delle misurazioni di posizione e momento proposti nel capitolo 21 sono illustrativi di ciò che avviene nel caso generale di una misurazione quantistica. Una qualità «misurabile» di un sistema quantico sarebbe rappresentata da un certo tipo di operatore Q, chiamato osservabile, che potrebbe essere applicato allo stato quantico. Le variabili dinamiche (per esempio, posizione e 538
Algebra, geometria e spin quantistici
momento) sarebbero esempi di osservabili. 10 La teoria richiede che un' osservabile Q sia rappresentata da un operatore lineare (come gli operatori di posizione o momento), così che la sua azione sullo spazio H sarebbe quella di effettuare una trasformazione lineare di H, sebbene probabilmente singolare ( § 13. 3). Diciamo che lo stato 'I' ha un valore definito per l'osservabile Q se 'I' è un autostato di Q, e il relativo autovalore q è quel valore definito. 11 Questa è proprio la terminologia che abbiamo già incontrato in §§21.5, 10, 11 per la posizione e il momento. Nella meccanica quantistica convenzionale, si richiede normalmente che tutti gli autovalori debbano essere numeri reali; ciò è garantito dalla richiesta che Q sia hermitiano nel senso che Q sia uguale al suo aggiunto Q*:[22-101
Q*=Q. A mio parere, questa richiesta per un'osservabile Q è irragionevolmente forte, poiché numeri complessi sono spesso impiegati nella fisica classica, come per la rappresentazione sulla sfera di Riemann della sfera celeste(§ 18.5), e in molte discussioni standard dell'oscillatore armonico (§20.3), eccetera. 12 Una richiesta essenziale per un'osservabile è che i suoi autovettori, corrispondenti a autovalori distinti, siano ortogonali l'uno all'altro. Questa è una proprietà caratteristica di quegli operatori che vengono chiamati «normali». Un operatore normale Q è un operatore che commuta col suo aggiunto
Q* Q=QQ*, e qualsiasi coppia di suoi autovettori, corrispondenti ad autovalori distinti, devono davvero essere ortogonali tra loroP 2 -11 1 Poiché sono felice per il fatto che i risultati di misurazioni (autovalori) siano numeri complessi, anche se insisto sulla richiesta standard di ortogonalità tra gli stati alternativi che possono risultare da una misurazione, richiederò che le mie «osservabili» quantistiche siano solo operatori lineari normali, e non i meno generali operatori lineari hermitiani. A questo punto, dovrei fare un commento su un'ulteriore richiesta per le osservabili quantistiche, ossia sul fatto che i loro autovettori abbraccino l'intero spazio di Hilbert H (così che qualsiasi elemento di H possa essere espresso linearmente in termini di questi autovettori). Nel caso di dimensione finita, questa proprietà è una conseguenza matematica della natura hermitiana (o normale) di Q; ma quando H è infinito-dimensionale, abbiamo bisogno che questa sia una assunzione separata per qualunque Q che debba
[22.1 O] Dimostrate che qualunque autovalore di un operatore hermitiano Q è proprio un numero reale. [22.11] Vedete se sapete dimostrarlo. Sugf;erimento: considerando l'e~ressione ('Vi (Q* -ÌJ) (Q - ì..l)I '!f), dimostrate dapprima che se QI '!f) = ì..l '!f), allora Q*l 'l') = ì..l
\j//.
539
LA STRADA CHE PORTA ALLA REALTÀ
svolgere il ruolo di osservabile quantistica. Un operatore hermitiano Q con questa proprietà viene chiamato autoaggiunto. Questa richiesta di ortogonalità è importante per i processi di misurazione quantistica. Secondo le regole della meccanica quantistica, il risultato di una misurazione, relativa a un operatore Q, sarà sempre uno dei suoi autostati: questo è il «salto» dello stato quantico che avviene con il processo R (vedi §22.1 ). Qualunque sia lo stato in cui il sistema si trova prima della misurazione, esso salta in uno degli autostati di Q non appena lo stato è misurato, in accordo con R. Dopo la misurazione lo stato acquisisce un valore definito per l'osservabile Q, e precisamente il relativo autovalore q. In questo modo, per ciascuno dei diversi possibili risultati della misurazione dell'osservabile Q - cioè, per ciascuno dei diversi autovalori q 1, q2 , q 3 , ••• - otteniamo uno di un insieme di stati alternativi risultanti, che sono tutti mutuamente ortogonali. Perché è importante questo? Vedremo tra poco quali sono le regole quantistiche per calcolare la probabilità di ciascuno di questi risultati alternativi. Una conseguenza di queste regole è che la probabilità per uno stato di saltare, come risultato di una misurazione, in uno stato ortogonale è sempre nulla; quindi, se la misurazione definita da un'osservabile Q è ripetuta, questa seconda misurazione darà il medesimo autovalore - vale a dire il medesimo risultato-prima ottenuto. Infatti l'ottenimento di un risultato diverso implicherebbe un salto da uno stato a uno stato ortogonale, che come detto prima ha probabilità zero. Ma questa felice conclusione dipende dall'ortogonalità degli autostati di Q, relativi ad autovalori differenti, il che è il motivo della nostra richiesta che Q sia un operatore normale. Passiamo ora all'assegnazione di probabilità per i differenti autostati alternativi dell'osservabile Q, quando questa viene «misurata» sullo stato I'Jf); una caratteristica notevole del processo quantistico R è che la probabilità quantistica dipende soltanto dagli stati quantici prima e dopo la misurazione, e non da qualsiasi altro aspetto dell'osservabile Q (come per esempio l'autovalore misurato). La regola è che la probabilità che lo stato salti da i'-!') all'autostato I ) di Q è data da
assumendo che I'-!') e I ) siano normalizzati (11'-l'II = I = Il Il). Altrimenti dovremmo dividere l'espressione precedente per li '-I' Il e Il Il prima di ottenere la probabilità. Potremmo preferire di . scrivere questa probabilità, per stati non normalizzati, nella forma elegante
(1>l1/f)(lffl1>) (lffilff)(1>l1>). 540
Algebra, geometria e spin quantistici
Questo è sempre un numero reale tra O e 1, che prende il valore 1 solo se gli stati sono proporzionali.[ 22 -121 Si rammenti, dalla discussione di prima, che l'evoluzione di Schrodinger preserva i prodotti scalari \q> i 'lf); questa è un 'importante relazione di coerenza tra i processi U e R ed esprime il fatto che, nonostante la loro reciproca incoerenza, essi sono nettamente «incastrati» l'uno con l'altro. Vediamo che davvero uno stato non salta mai direttamente, in una misurazione, su uno stato ortogonale, perché ( i 'I')= O implica che la probabilità che questo avvenga è nulla. In una sovrapposizione quantistica tra stati 'I' e q>, ortogonali e normalizzati, per esempio vv'lf + z, i fattori di peso complessi, w e z, a volte vengono chiamati ampiezze, o «ampiezze di probabilità». In questo caso, un esperimento preparato per distinguere 'I' da q> nello stato W\lf + z otterrebbe 'I' con probabilità ww = Iw J 2 e q> con probabilità zz = Iz I2, cioè per ottenere le probabilità prendiamo i moduli al quadrato delle ampiezze. La medesima cosa vale anche per sovrapposizioni di più di due stati. Un'utile proprietà di un operatore normale Q (assumendo che i suoi autovettori abbraccino l'intero spazio H) è che possiede sempre una famiglia di autostati che formano una base ortonom1ale dello spazio di Hilbert. Una base ortonormale (confronta§ 13.9) è un insieme di elementi ei, e2 , e3 , ••• di H tale che
(eJ e)= òu (òu essendo la delta di Kronecker) e ogni elemento 'I' di H possa essere espresso come (z 1, z 2 , z3 , •.• essendo «coordinate cartesiane» complesse per 'lf). Qualcosa di simile a questo è l'espressione di una funzione d'onda generale, per una singola particella senza struttura, come una combinazione lineare continua di stati di momento (come viene realizzata con l'impiego della trasformazione di Fourier) o di stati di posizione (usando 'l'(x) = f 'lf(X)ò(x - X)d3X) (§21.11), poiché gli stati di momento sono gli autostati dell'operatore p della quantità di moto, mentre gli stati di posizione sono gli autostati dell'operatore di posizione x. Il passaggio dalla rappresentazione di posizione a quella di momento equivale a un cambiamento di base nello spazio di Hilbert H (vedi fig. 22.3). Tuttavia, né gli stati di momento né gli stati di posizione formano effettivamente una base, in senso tecnico, perché non sono normalizzabili e certamente non appartengono realmente, in sé e per sé, a H ! (La meccanica quantistica è piena di problemi irritanti di questo genere. Allo stato attuale, si può «glissare» su simili sottigliezze matematiche e persino fare finta che gli stati di posizione e di momento siano realmente stati, o altrimenti si può passare tutto il tempo a mettere a posto la matematica, nel qual [22.12] Dimostratelo dalle proprietà algebriche di (
I )con i metodi usati nell'esercizio [22.2]. 541
LA STRADA CHE PORTA ALLA REALTÀ
H
Fig. 22.3 - Il passaggio da una rappresentazione di posizione a una di momento è solo un cambiamento di base nello spazio di Hilbert H (anche se, dal punto di vista tecnico, né gli stati di posizione né quelli di momento appartengono realmente a H, poiché non sono normalizzabili).
caso vi è il pericolo di rimanere bloccati in un «rigor mortis». Io faccio del mio meglio per mantenere una posizione intermedia, ma non sono del tutto sicuro di quale sia la risposta corretta per progredire!)
22.6 Misurazioni sì/No; proiettori Nel caso di operatori come la posizione o il momento, in cui gli autostati non sono normalizzabili, otteniamo zero per la probabilità di trovare una particella in un simile stato. Questa è effettivamente la risposta «corretta», perché la probabilità che la posizione o il momento abbiano un qualsiasi particolare valore deve essere davvero zero (poiché posizione e momento sono parametri continui). Questo non ci aiuta molto, così potremmo preferire l'impiego di altri generi di osservabili, come quella che pone la domanda: «La posizione è dentro una certa gamma di valori?». Una domanda analoga potrebbe essere posta per il momento ( o per qualunque altra osservabile continua). Domande del tipo sì/NO come questa possono essere incluse nel formalismo quantistico, assegnando, per esempio, l'autovalore 1 alla risposta sì e l'autovalore Oalla risposta.NO. Un'osservabile di questo tipo è descritta da quello che viene chiamato proiettore. Un proiettore E ha la proprietà di essere autoaggiunto e di essere uguale al suo quadrato[ 22 · 131
E2=E=E*. Simili cose forniscono il tipo di misurazione più primitiva e per molti scopi le questioni sollevate dalla «misurazione» in meccanica quantistica vengono svolte meglio in termini di simili operatori. Vi è, tuttavia, un problema particolare che diventa importante specialmente quando viene effettuata una di queste misurazioni sì/No, per il fatto che questi operatori (in più di due dimensioni) sono (completamente) degeneri. Diciamo che Q è degenere, rispet[22.13] Dimostrate che se un'osservabile Q soddisfa un'equazione polinomiale, allora ciascuno dei suoi autovalori soddisfa la medesima equazione. 542
Algebra, geometria e spin quantistici
to a qualche autovalore q, se lo spazio di autovettori relativo a q ha più di una dimensione, cioè se vi sono autovettori non proporzionali di Q che corrispondono al medesimo autovalore q (§13.5). l;intero sottospazio lineare di H costituito da tutti gli autovettori corrispondenti al medesimo autovalore q viene chiamato autospazio di Q relativo a q. In simili casi, l'ottenimento del «risultato» della misurazione (cioè la determinazione dell'autovalore) non ci dice, in sé e per sé, in quale stato si suppone «salti» il vettore di stato. Il problema è risolto se adottiamo il postulato di proiezione che afferma che lo stato I\j/) che viene assoggettato alla misurazione è proiettato ortogonalmente all'autospazio13 di Q corrispondente a q. In effetti, il termine «postulato di proiezione» viene spesso semplicemente usato per la procedura quantistica standard di §22.1 (come è stato fatto esplicitamente da von Neumann), 14 in cui, come risultato della misurazione di un'osservabile Q, lo stato salta in un autostato di Q, corrispondente all'autovalore che la misurazione fornisce. In questa sezione e in quella successiva, sottolineerò l'importanza dell'aspetto di proiezione di questo postulato nel caso di autovalori degene1i. 15 Uno dei modi migliori di esprimere questa proiezione è utilizzare un appropriato proiettore E, e precisamente quello il cui autospazio corrispondente all'autovalore 1 (risposta «sì») è identico all'autospazio di Q corrispondente a q. (Questo può sempre essere fatto; E è semplicemente porre una domanda più fondamentale di quella posta da Q, e precisamente: «È q il risultato della misurazione di Q?») Allora ciò che il postulato di proiezione afferma è che il risultato della misurazione (o Q con il risultato q, o E con il risultato 1) è che
l'V)
salta in
El\j/).
In questo caso, non mi sono preoccupato di.normalizzazioni (e non vi è alcun bisogno di preoccuparsene se non lo desideriamo). Se chiediamo che lo stato risultante sia normalizzato, possiamo ritenere che I'V) salti nello stato dall'aspetto più ingarbugliato El '11)('111 El 'V)- v2• Nelle mie descrizioni troverò comunque più comodo non dover normalizzare gli stati; questo fa sì che molte formule abbiano un aspetto più semplice. In fig. 22.4 ho indicato la natura geometrica, entro lo spazio di Hilbert H, del postulato di proiezione. Si osservi che se sostituiamo il proiettore E con I -E (anch'esso un proiettore), troviamo che gli autospazi SÌ e NO sono semplicemente scambiati. (Qui I è l'operatore identità di H.) In questo modo, se la misurazione di E ottiene O come risultato, allora I'V) salta invece in(/ - E )I 'V) (= I'11)-E I'V)). Si noti che I'V) è la somma dei due stati E I'V) e (I -E )I 'V), che sono tra loro ortogonaW22 · 14l, e la misurazione E decide tra i due, SÌ per il primo e NO per il secondo:
I'V) = E I'V) + (/ - E )I \j/). [22.14] Dimostratelo. 543
LA STRADA CHE PORTA ALLA REALTÀ
Fig. 22.4 - La natura geometrica, entro H, del postulato di proiezione. Sono indicati gli autospazi del proiettore E, il piano orizzontale rappresentando l'autovalore 1 (sì) e quello verticale l'autovalore O (No). Il disegno illustra la decomposizione hv) = Ehv) + (I -E)I \Jf) di I\j/) in due parti ortogonali, in cui El \Jf) è la proiezione di /o/) entro lo spazio sì (il risultato della misurazione che produce sì) e (I - E)I \Jf) è la proiezione entro lo spazio NO (dal risultato NO). In ciascun caso la probabilità è data dal fattore di proporzionalità con cui la lunghezza quadrata (hermitiana) Ilo/li di /\Jf) è ridotta nella proiezione (vettori di stato non normalizzati).
Vi è un modo geometrico diretto per esprimere le prob O; elicità positiva) o (b) sinistrorso (s < O; elicità negativa). Per un fotone, abbiamo !si = 1 (in unità di li) che dà i due casi s = 1, per la polarizzazione circolare destrorsa, es= - 1, per la polarizzazione circolare sinistrorsa. Grazie al principio di sovrapposizione quantistica, possiamo formare combinazioni lineari complesse di queste, producendo così gli altri stati possibili di polarizzazione, come mostrato in fig. 21.12 e fig. 21.13.
fondamentale, ma soltanto per il caso di una particella senza massa. I fotoni sono davvero particelle con spin, ma essendo prive di massa il loro spin ha un comportamento leggermente differente da quello dello spin di una particella massiva (per esempio un elettrone o un protone), che tratteremo in §§22.8-10. Dobbiamo pensare che un fotone (o qualunque altra particella senza massa) ruoti necessariamente attorno alla sua direzione di moto; vedi fig. 22.7. La grandezza Is I di questo spin è sempre la stessa, per un dato tipo di particella senza massa, ma lo spin può essere o destrorso (s > O) o sinistrorso (s < O) rispetto alla direzione di moto. Inoltre, in accordo con i principi generali della meccanica quantistica, lo stato di spin può essere qualunque combinazione lineare (quantistica) dei due. La quantità s è chiamata elicità della particella senza massa (§22.12), e il suo valore deve essere sempre un numero intero o semintero (o, introducendo le unità appropriate, dovremmo dire che l' elicità è un multiplo intero di ½n). Si dice che una particella senza massa ha spin j se lsl =j (o, con l'introduzione delle unità, lsl = jn). Un fotone ha spin 1 (così la sua elicità è ± 1); un gravitone ha spin 2 (elicità ± 2). I neutrini hanno spin ½ e, se vi sono neutrini senza massa, 18 un simile neutrino avrebbe elicità mentre il relativo antineutrino avrebbe elicità + ½. Nel caso di un fotone gli stati di elicità (stati di elicità definita) sono gli stati di polarizzazione circolare, rispettivamente destrorsa per s = 1 e sinistrorsa per s = - 1. Vi sono altri stati di polarizzazione possibili per un fotone, come la polarizzazione lineare, ma questi sono semplicemente combinazioni lineari dei due stati circolari. Arriverò tra poco alla geometria di tutto questo, alla fine di §22.9, ma per il momento non è necessaria. Tutto quello di cui abbiamo bisogno per ora è un particolare fatto riguardo il comportamento della polarizzazione circolare rispetto alla riflessione. Suppongo che un fotone in uno stato di
- ½,
547
LA STRADA CHE PORTA ALLA REALTÀ
polarizzazione circolare incida ortogonalmente sul separatore di fascio (o su qualunque altro genere di specchio che potremmo usare), così che il fascio riflesso torna direttamente indietro nella direzione da cui è arrivato. Il fatto particolare di cui abbiamo bisogno è che lo stato di polarizzazione del fotone riflesso sia opposto a quello del fotone emesso dalla sorgente, mentre la parte trasmessa abbia una polarizzazione che sia la stessa di quella del fotone emessoY2·16l Se lo si desidera, possiamo supporre che vi sia una piccolissima inclinazione nella direzione iniziale del fascio, così che il fascio riflesso non rientri semplicemente nella sorgente·. Questo non influenzerà in modo significativo le nostre considerazioni. Ritorniamo al nostro originario esperimento di «misurazione nulla» di fig. 22 .5, ma adesso con il fotone che incide ortogonalmente, come in fig. 22.8. Supponiamo che la nostra sorgente possa essere regolata in modo da emettere fotoni o in uno stato di polarizzazione circolare destrorsa o in uno stato di polarizzazione circolare sinistrorsa. In una particolare occasione emette un fotone destrorso ( e ne prende nota); dopo che il fotone ha incontrato il separatore di fascio, il suo stato è una combinazione lineare (una somma con opportune convenzioni circa i fattori di fase, come prima):
I o/+)= 1-r +)+IP-), dove il «+» o il «-» all'interno del ket si riferiscono al segno dell' elicità. Poniamo il nostro rivelatore nel fascio trasmesso, come prima (e supponiamo che sia insensibile alla polarizzazione); se, come prima, la sorgente registra di aver emesso il fotone destrorso ma il rivelatore non lo registra, così che non ha ricevuto il fotone, si deve allora concludere che lo stato è saltato (subito dopo la «non rivelazione» dalla sorgente) nello stato riflesso sinistrorso
Fig. 22.8 - Un ritorno all'esperimento di fig. 22.5, ma adesso il fotone ha un'incidenza quasi perpendicolare. La sorgente emette un fotone destrorso. DoJ?O l'incontro del fotone col separatore di fascio, il suo stato diventa I\Jf +) = 11: +) + IP-), dove il segno«+» o «-» nel ket si riferisce all'elicità. Se il rivelatore (non sensibile alla polarizzazione) registra di non ricevere il fotone, concludiamo che lo stato è saltato (subito dopo la non rivelazione) nello stato riflesso sinistrorso IP-). Questo richiede il completo postulato di proiezione (al punto di Liiders; vedi fig. 22.9), poiché vi è degenerazione sia nel caso NO il 2-spazio abbracciato da IP+) e lp-)) sia nel caso sì (quello abbracciato da 1-t +) e !1:-)). Il reale stato iniziale 11: +) + IP-) è necessario per determinare dove salta lo stato subito dopo la misurazione (qui una non rivelazione). [22.16] Siete in grado di suggerire un motivo semplice per questa cosa? 548
Algebra, geometria e spin quantistici
Fig. 22.9 - Una descrizione nello spazio proiettivo di Hilbei1 IP'H 4 (vedi fig. 15.15) del postulato di proiezione di fig. 22.4, per gli stati di polarizzazione del fotone in fig. 22.8. Lo stato iniziale è 1-c +) + IP -) indicato entro IJJ>H2, poiché lo spazio completo è abbracciato da 1-c +), l'C -), \p +) e IP-). Le frecce triangolari bianche mostrano la proiezione (al punto di Liiders) su \p -), trovandosi questo lungo la retta che è l'unica trasversale alle rette sì e NO dal punto iniziale (\-e+)+ lp-)). La (non) rivelazione, in sé e per sé, ci direbbe soltanto che lo stato risultante giace sulla retta NO, ma la scelta dello stato iniziale rompe questa degenerazione, in accordo col completo postulato di proiezione.
Ip -).
Sto quindi evidenziando che è necessario il completo postulato di proiezione per accertare la natura di questo stato risultante; vedi fig. 22.9. La misurazione è di carattere puramente sì/No, perché il risultato è o «non rivelazione» (No) o «rivelazione» (sì). Vi è degenerazione per entrambe queste alternative, perché l'autospazio della risposta NO è il 2-spazio abbracciato da I p +) e I p -) el'autospazio della risposta sì è quello abbracciato da I-e+) e I -e-). Poiché lo stato iniziale, in questo caso, è I -e+)+ I p -), il postulato di proiezione 19 ci porta giustamente a I p -) invece che a I p +) o a IP +) + IP-) (o a qualsiasi altra combinazione lineare di I p +) e I p -)) per il risultato della non rivelazione. 20 • l22 •171
22.8 Spin e spinori Indubbiamente, questo non è un esperimento molto eccitante, ma illustra un punto. Vedremo alcune cose molto più notevoli nel capitolo 23. Per prepararci, sarà opportuno però dire qualcosa di più sullo spin. Lo spin fa riferimento, nel caso di una particella massiva, al momento angolare (momento della quantità di moto) attorno al suo centro di massa. 21 Abbiamo incontrato, in §§21.1-5, la conservazione della massa/energia e la conservazione della quantità di moto, rispettivamente come caratteristiche della simmetria di traslazione temporale e di quella di traslazione spaziale delle leggi quantistiche. La simmetria rotazionale, in modo analogo, dà origine alla conservazione del momento angolare (vedi anche §18.7 e §20.6). Per una particella massiva, possiamo immaginare di essere nel sistema di riposo della parti[22.17] Spiegate con maggiore completezza perché la risposta corretta è data dalla «proiezione». 549
LA STRADA CHE PORTA ALLA REALTÀ
cella: le rotazioni pertinenti sono allora quelle che costituiscono il gruppo di rotazioni 0(3) attorno alla posizione della particella in quel sistema di riferimento. Come una componente della quantità di moto viene rappresentata, ir.t meccanica quantistica, da in volte l'operatore che genera traslazioni infinitesime nella direzione della corrispondente coordinata di posizione (§§21.1, 2), così una componente del momento angolare viene rappresentata da in volte il generatore di rotazioni infinitesime intorno al corrispondente asse (cartesiano). Le componenti del momento angolare, in meccanica quantistica, rimandano quindi all'algebra delle rotazioni infinitesime (§§13.6, 10), cioè all'algebra di Lie del gruppo di rotazioni 0(3) o, in modo equivalente, di SO(3), poiché l'algebra di Lie non fa distinzione tra questi due gruppi. Poiché SO(3) non è un gruppo abeliano, non tutti gli elementi dell'algebra di Lie commutano; in effetti i generatori di questa algebra C1, C2, C3, le rotazioni infinitesime attorno ai tre assi cartesiani spaziali, soddisfano1 22 ·18l
Queste sono collegate, secondo le regole della meccanica quantistica, alle componenti L 1, L 2, L 3 del momento angolare attorno ai tre assi:
Così le regole di commutazione del momento angolare sono 22
Le componenti del momento angolare L 1, L 2 , L 3, come quasi tutto il resto in meccanica quantistica, devono agire come operatori lineari sullo spazio di Hilbert H. In questo modo, i sistemi quantici che possiedono momento angolare forniscono una rappresentazione dell'algebra di Lie di S0(3) in termini di trasformazioni lineari di H (vedi §§13.6, 10, §14.6). Ciò conduce a uno degli aspetti più eleganti e rivelatori della meccanica quantistica, un soggetto che ripaga ampiamente uno studio molto dettagliato. Ma questo non è il posto per simili sottigliezze, perciò tenterò di esporre soltanto pochi punti particolarmente significativi. In primo luogo prendiamo nota del fatto che le particolari matrici
[22.18] Impiegate i quaternioni per verificarlo. 550
Algebra, geometria e spin quantistici
chiamate (senza h/2) matrici di Pauli, soddisfano le richieste relazioni di commutazioneP2.19J Esse forniscono la più semplice rappresentazione (non banale) del momento angolare, e noi immaginiamo che queste matrici 2 x 2 ag.iscano su una funzione d'onda con due componenti {'l'o(x), 'Jfi{x)}. Quando iniziamo a ruotare questo stato, le componenti 'lfo(x) e 'Jf i(x) vengono mescolate, secondo le regole di moltiplicazione matriciale che le matrici di Pauli generano. Possiamo etichettare questa funzione d'onda 'VA a due componenti usando un indice inferiore A (che prende i valori Oe 1, o altrimenti possiamo pensare che questo sia un indice astratto secondo la «notazione con indice astratto» a cui si è fatto riferimento in§ 12.8). La quantità descritta da 'VA viene chiamata spinore e il suo indice A viene chiamato indice di un 2-spinore. Risulta che 'VA è davvero un oggetto spinoriale nel senso descritto in § 11.3 (una rotazione continua di 2rc lo p01ia nel suo opposto). Invero, se «esponenziamo» con continuità una delle matrici di Pauli fino ad arrivare a una rotazione di 2rc, scopriamo di aver ottenuto l'operatore - I che manda 'VAin - 'VA• [22 ·201 Questa notazione fa parte di un poderoso formalismo che può essere sviluppato per integrare (o persino rimpiazzare )23 il formalismo del calcolo tensoriale, impiegando quantità «simili a tensori» costruite da elementi come «'VA»- Anche se non del tutto necessaria qui, la sua reale potenza si manifesta quando sfruttiamo la versione relativistica di questo formalismo. A questo scopo abbiamo bisogno anche di indici «con apice» A', B', C', ... , in aggiunta a quelli «senza apice» A, B, C, ... , che etichettano quantità che sono in senso opportuno complesse coniugate l'una dell'altra; vedi § 13 .9. Questa notazione è molto utile nella teoria quantistica dei campi (un fatto forse molto meno apprezzato di quello che meriterebbe; 24 vedi §25.2 e §34.3) e nella relatività generale 25 (svolge anche un ruolo fondamentale nella teoria dei twistor; vedi §33.6). Non è opportuno che io approfondisca tutto questo, ma sarà utile prendere in prestito qualcosa da questo formalismo di 2-spinori. Tutto quello di cui avremo bisogno qui e in §§22.9-11 è rappresentare in modo pulito gli stati generali di spin. Non ci serviranno gli indici con apice (fino a §§25.2, 3 e §§33.6, 8) poiché qui facciamo solo fisica non relativistica. Prima di addentrarci in tutto questo, desidero semplificare la notazione. Per il resto di questa sezione, e fino alla fine di §22.11, adotterò la comoda assunzione di aver scelto unità per cui n = I. In effetti, questo è sempre possibile: in §27.10 (e §31.1) vedremo inoltre che potremmo fare molto più e descrivere le cose in termini delle cosiddette «unità di Planck», in cui sia la velocità della luce che la costante gravitazionale sono poste eguali a uno. Adesso non vi è alcun bisogno di fare ciò, e in ogni caso non è difficile introdurre di nuovo n, se è richiesto, per mezzo di semplici considerazioni di dimensioni fisiche. (Per esempio, per reintrodurre nin qualunque formula fisica in cui nè stato posto a uno, [22.19] Verificatelo. Spiegate come le loro leggi di moltiplicazione si collegano a quelle dei quatemioni. [22.20] Fatelo esplicitamente. 551
LA STRADA CHE PORTA ALLA REALTÀ
rimpiazziamo qualunque grandezza, scalando come la q-esima potenza della massa e ignorando la lunghezza e il tempo, con tr q volte quella grandezza. In particolare, la massa, l'energia, il momento e il momento angolare sarebbero semplicemente divisi per ti.) Ritornando ora al formalismo 2-spinoriale, rammentiamo che una grandezza spinoriale del primo ordine o/A può essere impiegata per descrivere una particella con spin ½. Lo stesso genere di notazione può essere impiegato per valori di spin maggiori, corrispondenti ad altre rappresentazioni dell'algebra di Lie di SO(3). Il valore dello spin è sempre un multiplo intero non negativo di ½:
O,½, 1, i,2,
i, ...
(o reintroducendo ti diremmo che lo spin/ti prende questi valori) e la funzione d'onda può essere descritta da un oggetto o/As .. .F (un «tensore-spin») che è completamente simmetrico rispetto ai suoi n indici nel caso di spin f o/AB ... F = o/(AB ... F)
(dove le parentesi tonde denotano la simmetrizzazione su tutti gli n indici; vedi § 12. 7). In effetti, tutte le rappresentazioni di SO(3) - dove includiamo quelle spinoriale a due valori - possono essere costruite con le cosiddette somme dirette di queste particolari rappresentazioni, note come rappresentazioni irriducibili (vedi § 13. 7). Questo equivale a dire che la rappresentazione generale può essere espressa come una collezione (probabilmente infinita) di funzioni d'onda {o/As ... F, 1) è rappresentato (con fasi opportune per 11') e I+)) dal punto sulla sfera la cui direzione dal centro è quella di l.;>1) (vale a dire, quella che dà il risultato «sì» con certezza per una misurazione di spin E, in quella direzione), come è illustrato dalla freccia con doppia asta. Possiamo esprimere lo stato l.;>1) come una combinazione lineare l.;>1) = wl1') + zi+) (dove possiamo ritenere che i numeri complessi z, w siano le componenti w = 'l'o, z = \j/ 1 di un 2-spinore 'l'A). I punti sulla sfera corrispondono ai diversi rapporti z:w. Ciascuno di questi può essere rappresentato da un numero complesso u = z/w (è permesso anche 00 ) nel piano complesso, poiché questo piano è il piano equatoriale della sfera. li punto u proietta stereograficamente dal polo Sud fino al punto della sfera che rappresenta l.;>1).
In altre parole IPH 2 è proprio una copia della sfera di Riemann di cui abbiamo fatto la conoscenza per la prima volta, in §8.3. Ciascun punto di questa sfera di Riemann etichetta un differente stato di spin ½, che è l'autostato «m = ½» della particolare misurazione di spin lungo la direzione fino a questo punto dal centro della sfera (fig. 22.10). Vediamo più esplicitamente questa relazione geometrica se usiamo la proiezione stereografica della sfera dal polo Sud sul suo piano equatoriale, descritta in §8.3 (fig. 8.7a). Questo piano deve essere ritenuto il piano complesso del rapporto u = z/w (piuttosto che quello della «z» di §8.3) delle ampiezze quantistiche z e w. Questo collega direttamente il particolare punto sulla sfera, corrispondente alla direzione spaziale ", al rapporto zlw. Usiamo il proiettore E 11 per denotare la misurazione che pone la domanda: «Lo spin è nella direzione "?», così che l'autovalore è 1 (sì) se si trova che lo stato di spin è (o è proiettato su) I"), mentre è O (No) se lo spin, come risultato di ciò, viene proiettato sullo stato di spin ortogonale I "'), nella direzione spaziale opposta (corrispondente al punto agli antipodi sulla sfera di Riemann). (Si noti che «ortogonale» nello spazio di Hilbert non corrisponde a «ad angolo retto» nello spazio, in questo esempio, ma a «opposto».) Se partiamo con lo stato 11' ), allora la probabilità della risposta sì per la misu555
LA STRADA CHE PORTA ALLA REALTÀ
razione E,, è Iwl 2/(lwl 2 + lzl 2). Se lo spin è inizialmente in qualche stato I"'-) e viene effettuata una misurazione per accertare se lo stato è in qualche altra direzione 171), dove l'ordinario angolo euclideo tra"'- e 71 è 0, allora la probabilità di trovare il risultato sì è[ 22 ·27 l
f
(1 + cos 0).
Possiamo anche valutare questa probabilità in termini della geometria della sfera, quando " e 71 sono dati, rispettivamente, da due punti A e B sulla sfera e proiettiamo ortogonalmente B su un punto C del diametro passante per A (fig. 22.11) Se A: è il punto agli antipodi di A, allora la probabilità di sì è la lunghezza XB divisa per il diametro AA: della sfera.l22·28 l Si noti che la «sfera di Riemann» qui impiegata ha più struttura di quella di §8.3 e della sfera celeste di § 18.5, per il fatto che adesso fa parte della struttura della sfera anche la nozione di «punto agli antipodi» (per poter dire quali stati sono «ortogonali» nel senso dello spazio di Hilbert). La sfera è ora una «sfera metrica» piuttosto che una «sfera conforme», così che le sue simmetrie sono date da rotazioni nel senso ordinario, e perdiamo i moti conformi che si erano manifestati negli effetti di aberrazione sulla sfera celeste. Ciononostante, l'uso che facciamo della sfera di Riemann mette chiaramente in mostra una connessione esplicita tra i rapporti di numeri complessi che nascono nella meccanica quantistica e le comuni direzioni spaziali. Vediamo che i numeri complessi che appaiono nel formalismo degli stati quantici non sono cose completamente astratte, ma sono intimamente collegati al comportamento geometrico e dinamico. (Si rammenti anche il ruolo delle fasi complesse nella determinazione della dinamica di uno stato di momento, come è stato descritto in §21.6.) Dovrebbe essere sottolineato che la geometria di fig. 22.11, che esprime le probabilità che nascono in una misurazione quantistica in relazione a !PH2, non è limitata al caso dello spin, ma è del tutto generale per un sistema a due stati. Ciò che è speciale per il caso di spin f è 1'immediata associazione tra comuni direzioni spaziali e punti della sfera di Riemann IPH 2 • La sfera di Riemann è sempre là, in un sistema a due stati, per fornire la «diversificazione quantistica» di un paio di alternative classiche. In molte situazioni fisiche, tuttavia, il ruolo geometrico di questa sfera, e dei sottostanti numeri complessi quantistici (ampiezze), non è molto diretto e i fisici tendono a considerarli quantità interamente «formali». Questo atteggiamento nasce in parte dal fatto che la fase totale del vettore di stato di un intero sistema fisico viene ritenuta non osservabile, e così viene ignorata spesso la potenziale ricchezza geometrica dei coefficienti complessi [22.27] Dimostratelo. [22.28] Confermatelo. 556
Algebra, geometria e spin quantistici
Fig. 22.11 - Supponiamo che lo stato iniziale di un sistema a due stati (come quello di fig. 22. l O) sia rappresentato dal punto B sulla sfera di Riemann e che vogliamo compiere una misurazione dì tipo sì/no corrispondente a qualche altro punto sulla sfera, dove sì troverebbe lo stato in A e no lo troverebbe nel punto /\ agli antipodi di A. Supponendo che la sfera abbia raggio ½ e proiettando B ortogonalmente a C sull'asse A' A, troviamo che la probabilità di SÌ è la lunghezza /\C, che è ½ (1 + cos 0), mentre la probabilità di no è la lunghezza CA, che è ½ (1 - cos 0), dove 0 è l'angolo tra OB e OA, essendo O il centro della sfera.
interni. Le fasi relative tra una parte e l'altra svolgòno certamente un ruolo osservabile; un modo di esprimere ciò sta nel fatto che la geometria complessa dell'intero spazio proiettivo di Hilbert [P>H è fisicamente significativa. Anche se la fase totale è completamente eliminata nella definizione di [P>H, tutte le fasi relative sono presenti nella sua geometria. Vi sono, in effetti, approcci eleganti alla meccanica quantistica che sfruttano la geometria proiettiva complessa di [P>H. 28 Vi sono anche altre situazioni in cui la geometria della sfera di Riemann collega direttamente i numeri complessi della meccanica quantistica alle proprietà spaziali dello spin. Questo si applica, nel modo più significativo allo stato generico di spin delle particelle massive con spin più elevato, come sarà descritto tra poco (in §22.11). Ma per finire questa sezione, ritorniamo alla polarizzazione del fotone che abbiamo brevemente trattato in §22.7. Si rammenti che lo stato generale di polarizzazione di un fotone è una combinazione lineare complessa degli stati di elicità positiva I+) e di elicità negativa 1-):
1) = wl +) + zl-). l;interpretazione fisica di un simile stato viene espressa in termini della cosiddetta polarizzazione ellittica, che generalizza i casi particolari di polarizzazione lineare e circolare. Non ho intenzione di descrivere in dettaglio tutto questo, perché si riesce a ottenere un quadro già abbastanza chiaro se ragioniamo in termini di una classica onda elettromagnetica piana. I «piani» sono i fronti d'onda, che sono perpendicolari alla direzione di moto. In ciascun punto dello spazio vi sono un vettore elettrico E e un vettore magnetico B, che per un'onda piana sono sempre perpendicolari tra loro e giacciono sui fronti d'onda. Se immaginiamo di tenere fisso il punto dello spazio 557
LA STRADA CHE PORTA ALLA REALTÀ
ma di lasciar scorrere l'onda, il vettore elettrico ruota in modo che la sua punta descrive un'ellisse nel piano del fronte d'onda; il vettore magnetico descrive un'ellisse.identica seguendolo di un angolo retto. Vedi fig. 22.12. In alcuni casi particolari, l'ellisse si schiaccia fino a diventare un segmento di retta: i casi di polarizzazione lineare. La polarizzazione circolare avviene quando l'ellisse diventa un cerchio. Se orientiamo le cose in modo che l'onda venga direttamente verso di noi, i vettori ruotano in senso antiorario per elicità positiva e in senso orario per elicità negativa. Vediamo ora come la sfera di Riemann si inserisce in tutto questo. Supponiamo che il polo Nord rappresenti lo stato di elicità positiva I+) e il polo Sud quello di elicità negativa 1-); supponiamo inoltre che il fotone viaggi verso l'alto, nella direzione di I+). Adesso, invece di segnare z/w sulla sfera di Riemann, prendiamo in esame la sua radice quadrata q = (zlw)v 2 (non im-
Vettore magnetico
---it>
Vettore elettrico }Il,
(a)
(b)
(e)
Fig. 22.12 - La polarizzazione del fotone (vedi fig. 21.7) come una caratteristica delle onde elettromagnetiche piane. (a) Un'onda linearmente polarizzata che si allontana dall'osservatore. I vettori elettrici (frecce con punta nera) e i vettori magnetici (frecce con punta bianca) oscillano avanti e indietro, in due dati piani perpendicolari tra loro. (b) In un'onda circolarmente polarizzata, i vettori elettrici e magnetici ruotano attorno alla direzione di moto, rimanendo sempre perpendicolari tra loro e con la stessa lunghezza. (c) I diagrammi mostrano come i vettori elettrici e magnetici, visti da dietro, ruotano lungo l'onda (caso di elicità positiva): la figura inferiore mostra la situazione per polarizzazione circolare, mentre quella superiore la situazione per polarizzazione ellittica, in cui le punte delle due frecce tracciano ellissi congruenti con assi maggiori perpendicolari tra loro. La funzione d'onda di un fotone mostrerebbe un comportamento di questo genere. 558
Algebra, geometria e spin quantistici
"
.·,r-Equatore Sfera di Riemann
Ellisse di polarizzazione
Fig. 22.13 - Gli stati di polarizzazione del fotone rappresentati sulla sfera di Riemann. Assumiamo che il polo Nord rappresenti lo stato di elicità positiva I+ ) e il polo Sud quello di elicità negativa 1-), pensando che il momento del fotone sia in direzione nord. Il generico stato di polarizzazione wl +) + zl -) è rappresentato dal punto q = (zlw) 112 sulla sfera di Riemann. Consideriamo il semidiametro della sfera attraverso q (il «vettore di Stokes») e tracciamo il cerchio massimo che giace nel piano diametrale perpendicolare a questo asse. Orientiamo questo cerchio in senso destrorso attorno al vettore di Stokes. Proiettiamo quindi questo cerchio ortogonalmente sul piano equatoriale della sfera. Questo ci dà la richiesta ellisse di polarizzazione con il corretto orientamento.
porta quale delle due). Consideriamo il raggio della sfera attraverso q, il cosiddetto «vettore di Stokes», e tracciamo sulla sfera il cerchio massimo che giace nel piano diametrale perpendicolare a questo asse. Orientiamo questo cerchio in senso destrorso intorno all'asse per q; proiettiamo poi questo cerchio ortogonalmente sul piano equatoriale della sfera. Otteniamo così la richiesta ellisse di polarizzazione, con il corretto orientamento. Vedi fig. 22.13.(22.29]
22.10 Spin maggiori: descrizione di Majorana Come ulteriore esempio per illustrare la stretta relazione tra i numeri complessi apparentemente astratti della meccanica quantistica e la geometria dello spazio, consideriamo gli stati di spin per una particella massiva - o un atomo - con spin}= n/2. Come è stato affermato in precedenza (§22.8), questa può essere descritta da un tensore-spinore simmetrico \JfAs ... F con n indi-
[22.29] Verificate tutto questo; perché 11011 mi preoccupo per il segno di q? 559
LA STRADA CHE PORTA ALLA REALTÀ
d. Ora vi è un teorema che afferma che ogni tensore-spinore di questo tipo ha una «decomposizione canonica», per mezzo della quale è esprimibile come un prodotto simmetrizzato di spinori a un indice, definito in modo unico fino a fattori di scala e ordinamenti:[22 •301 o/AB ... F
= (X(A
~B ...
, se prendiamo come 'JfAB ...F, uno dopo l'altro, ciascuno degli stati base standard a [22.33] Spiegate perché questi punti sono agli antipodi. 564
Algebra, geometria e spin quantistici
cui è stato fatto riferimento in §22.10, vale a dire I+ ... +1' .. :1'). (Per questi, solo una delle n + 1 componenti indipendenti di 'l'As ...F è diversa da zero.) Dobbiamo tenere a mente che questi stati base sono simmetrizzati. Per esempio, l"-1'1') è un multiplo di 1+)11')11') + 11')1+)11') + 11')11')1+). In questo caso particolare, tutte le componenti di 'l'Asc si annullano tranne la singola componente indipendente 'lfo 11 = 'lf 101 = 'lf 110 • Sebbene la mia descrizione di questo argomento risulti piuttosto inadeguata a causa della sua brevità,38 riesce comunque a rendere l'idea di ciò che è implicato e il lettore può cominciare ad apprezzare il fatto che gli spinori forniscono veramente un percorso efficace (anche se non convenzionale) verso le armoniche sferiche.l22·34l Si rammenti da §22.8 (cfr. §13.7) che le grandezze spin-tensore 'l'AB ... F forniscono una rappresentazione irriducibile (n + 1)-dimensionale del gruppo S0(3) delle rotazioni, e la stessa cosa è valida per lej = 2n armoniche sferiche (spin-pesate). La descrizione di Majorana può essere facilmente ottenuta in questo modo, poiché gli spinori aA, PA, .. ., cpA nella decomposizione 'l'As ...F= a(APs ... cpF) corrispondenti agli zeri delle armoniche sferiche (spin-pesate) nascono nella descrizione precedente in cui compaiono solo 1; e nessun 11· In effetti è stato attraverso riflessioni di questo tipo che Majorana ha trovato per primo la sua descrizione. È possibile ottenere alcune comprensioni di grande valore delle armoniche sferiche impiegando il formalismo dei 2-spinori. l.;approccio spinoriale è, sotto molti aspetti, più semplice da usare, ma non è molto conosciuto. Le armoniche sferiche sono importanti in molte altre aree, per esempio in fisica classica, e nella maggior parte delle loro applicazioni non vi è alcun particolare collegamento con il momento angolare. (In tali situazioni, di solito si usa la lettera ,e al posto dij, poiché quest'ultima sembra avere attinenza con il momento angolare.) Le piccole oscillazioni di una bolla di sapone sono un esempio. Un altro è nell'analisi della distribuzione della temperatura, sulla sfera celeste, della radiazione di fondo (2.7 K) proveniente dalle profondità dello spazio, dove si è particolarmente interessati agli alti valori di di 200 e più. Questa analisi è molto significativa per la cosmologia, come vedremo in §§27.7, 10, 11 e §28.4. Il contrasto tra manifestazioni quantistiche e classiche delle armoniche sferiche è sorprendente e non intuitivo. In un sistema quantico in cui le coordinate 0 e q> hanno l'interpretazione standard di angoli spaziali, il valorej (o €) è sempre interpretato come un momento angolare, ma non è assolutamente così per un sistema classico. In particolare, un sistema di momento angolare zero in meccanica quantistica deve avere simmetria sferica, perché una funzione d'onda con}= O è unicamente formata dall'armonica sferica costante sulla sfera; in fisica classica, però, un momento angolare zero (assenza di rotazione) non implica certamente la simmetria sferica!
.e,
[22.34] Calcolate esplicitamente in questo modo (fino a un fattore globale) le ordinarie armoniche sferiche per}= 1, 2, 3. Verificate che sono davvero autostati di V2 e ò/ò. 565
LA STRADA CHE PORTA ALLA REALTÀ
In direzione opposta, vediamo che un sistema quantico scelto a caso con un grande momento angolare (grande valore di j) ha uno stato definito da una descrizione di Majorana consistente in '2J punti disseminati più o meno a caso sulla sfera S2 • Ciò non assomiglia assolutamente allo stato classico di momento angolare di un sistema di grande momento angolare, nonostante la comune impressione che un sistema quantico con grandi valori dei suoi numeri quantici 39 dovrebbe approssimare un sistema classico! Per un sistema quantico simile a un sistema classico, richiediamo che i punti di Majorana si addensino soprattutto attorno a una particolare direzione dal centro di S2, vale a dire la direzione che è l'asse (positivo) della rotazione classica. Perché vi è una simile discrepanza tra queste due descrizioni? La risposta è che quasi tutti i sistemi quantici «grandi» non assomigliano a quelli classici. Il più famoso di questi esempi è l'ipotetico gatto di Schrodinger, che è in una sovrapposizione quantistica di gatto vivo e gatto morto (vedi §29.7). Perché non vediamo realmente cose come questa al livello classico? Questo è un aspetto del paradosso della misura che sarà discusso nei capitoli 29 e 30. I.:analisi armonica per spazi più generali di S2 costituisce una parte importante di molte aree della ricerca scientifica; essa è estremamente utile quando si considerano piccole perturbazioni o oscillazioni di un sistema. Tuttavia, può essere opportuno un piccolo ammonimento. In uno spazio che non è compatto la situazione diventa di gran lunga più complicata rispetto alla situazione di S2 . Abbiamo visto qualcosa del genere nel capitolo 9, quando siamo passati dall'analisi di Fourier (sulla circonferenza che è compatta) alla trasformazione di Fourier (sulla retta reale che non è compatta). A volte si tende a credere che si possa trasportare l'analisi da una forma compatta a una non compatta (per esempio dalla sfera allo spazio iperbolico) solo con pochi cambiamenti di segno (e con la sostituzione delle funzioni trigonometriche con quelle iperboliche, in accordo con le idee di «capriola di segnatura» di § 18.4). Sfortunatamente, il procedimento può essere molto più complicato. Una simile «analisi armonica» incompleta cattura soltanto una piccolissima parte delle funzioni rilevanti sullo spazio iperbolico, a causa del1' estrema incompletezza del sistema delle armoniche.
22.12 Momento angolare quantistico relativistico Affrontiamo ora il problema del momento angolare relativistico. Si rammentino le espressioni classiche, descritte in §18.7. Analogamente alla combinazione della massa/energia e della quantità di moto in un 4-vettore p,,, vi è un 6-ten•Sore antisimmetrico Mah che descrive il momento angolare di un oggetto e il moto del suo centro di massa. Come dobbiamo trattarli in modo quantistico? 40 Abbiamo visto in § §21.1-3 come le nozioni quantistiche di energia e mo. mento rappresentino misteriosamente - o (sostanzialmente) siano - i generatori delle traslazioni temporali e spaziali dello spaziotempo. In modo ana566
Algebra, geometria e spin quantistici
logo, le componenti del 6-momento angolare M b rappresentano - o essenzialmente sono - i generatori dei moti rotazionali (Lorentz) dello spazio di Minkowski M. Questi moti rotazionali, assieme ai moti traslazionali p"' danno origine all'intero gruppo (non riflessivo) di Poincaré (§18.2) l'analogo minkowskiano dei moti rigidi della geometria euclidea. Più esplicitamente, i generatori dei moti traslazionali di Poincaré sono le componentip0 ,p 1,p 2 ,p 3 del 4-momento Pm dove l'energia E= p 0 = indldx0 genera le traslazioni temporali e le rimanenti tre componenti (vale a dire il momento) generano gli spostamenti spaziali: Pi = i h d!dx1, p 2 = i nd!dx2, p 3 = i nd!dx 3 - dove teniamo a mente che ( - p 1, - p 2 , - p 3 ) sono le componenti del 3-momento p; vedi §18.7. Le rotazioni di Poincaré del 3-spazio sono generate dalle componenti c- 2 M23 = L 1 = in€ 1, c 2 M3 1 = L 2 = in€ 2 , c 2 M 12 = L 3 = in€ 3 , che abbiamo già esaminato in §22.8, definendo la nozione quantistica del comune momento angolare. Queste sono le componenti puramente spaziali del 6-momento angolare M'11, mentre le rimanenti tre componenti indipendenti c- 2 M 01 , c- 2 M 02 , c 2 M 03 , che generano le trasformazioni di Lorentz della velocità, si riferiscono al moto uniforme del centro di massa, in accordo con §18.7 (vedi fig. 18.16). Poiché il gruppo di Poincaré non è abeliano, i suoi generatori non sono tutti commutanti tra loro. Le loro leggi di commutazione ci riferiscono le leggi di commutazione per gli operatori quantistici Pa e Ma": 0
[pmPb] =O, [pa, M'"'] = in(g} pc - g/pb), [Mab, Mcd]= in(g"c M'd - g"d M"c + g°d M"c - gac Mbd). Queste possono sembrare piuttosto complicate, ma hanno un significato fondamentale in fisica relativistica, poiché definiscono l'algebra di Lie (§ 14.6) del gruppo di Poincaré. Appaiono un po' più semplici nella notazione diagrammatica, rappresentata in fig. 22. l 8Y2 ·35 l Si rammenti che per il momento angolare non relativistico siamo stati in grado di descrivere una base per gli stati in termini degli autovalori}(;+ 1) e m delle due osservabili commutanti J 2 e L 3 ; vedi §§22.8, 11. Questi operatori forniscono un insieme commutante completo (nel senso che qualsiasi altro operatore costruito dai generatori L 1, L 2, e L 3, e che commuta con J 2 e L 3, non dà nulla di nuovo, poiché esso stesso deve essere una funzione di questi due). È una parte importante della meccanica quantistica trovare un simile insième commutante completo per un dato sistema in esame. Particolarmente, ci piacerebbe essere in grado di farlo per operatori costruiti con le [22.35] Dimostrate che i commutatori dati in §22.8 per il momento angolare 3-dimensionale sono contenuti in queste leggi. 567
LA STRADA CHE PORTA ALLA REALTÀ
Pa ,,,_.
I
pa
..+
J= lJ
Afab ,-+
[,, ,J I,-~ ==
[1Jq
=
[U,Jd]
=
g
=O
1 Jd - g 1 =itz~ g U- ~ ::itz~
Fig. 22.18 - La forma diagrammatica dei commutatori quantistici del 4-momento e del 6momento angolare relativistici [pmAl = O, [p,,,
Mhc] = in(g} pc - g/ i'), [M"i>, Mc"]= itz(g'c Jv[ad -gh" Mac + g'" Mhc _ g"c Afh").
componenti di p 0 e M"b, e impiegare i loro autovalori per classificare particelle o sistemi relativistici. Perché siamo interessati a osservabili commutanti? Il motivo è che se A e B sono due di queste - così che AB = BA - allora possiamo trovare stati I\Jf che sono éontemporaneamente autostati di entrambe, e il paio di autovalori corrispondenti (a,, b,,) può essere impiegato per etichettare questi stati. 42 Se abbiamo un insieme completo di osservabili commutanti A, B, C, D, ... (i cui autovalori abbracciano lo spazio in esame), allora abbiamo una famiglia di stati di base I\Jli:,1 e la corrispondente famiglia di autovalori (a,., b,, c1, d,,, ... ) può essere impiegata per etichettare questi statiJ22·36l Per ottenere un insieme commutante completo, si comincia di solito a trovare gli operatori di Casimir che sono operatori (scalari) commutanti con tutti gli operatori del sistema in esame. Nel caso del comune momento angolare 3-dimensionale (si rammenti §22.8), vi è solo un (indipendente)43 operatore di Casimir, e precisamente J 2 = Lf + LJ + Ll, Una domanda importante è: quali sono gli operatori di Casimir per il sistema generato da p 0 e M b, che soddisfano le leggi di commutazione precedenti? Lo spin intorno al centro di massa è definito dalla grandezza Mhc d S _ 1e
,J
,,J
0
a - 2,c;;,abcd
P '
conosciuta come vettore di spin di Pauli-Lubansld, dove l'antisimmetrico E0 1,cc1 di Levi-Civita è stato definito in § 19 .2, ma qui abbiamo E0123 = e 3 poiché non assumiamo e = 1. (Nella «notazione del matematico» potremmo scrivere S =*(MI\ p ), impiegando ora p per rappresentare il 4-momento, invece che il 3-momento, come in precedenza; cfr. § 11.6, § 12. 7, § 19.2.) Abbiamo visto che una singola particella classica senza struttura ha M 0 b = x 0pb xbp", dove x" è il vettore posizione di un punto sulla linea d'universo della particella (vedi la fine di § 18. 7). Assumiamo la medesima espressione nel caso quantistico, da cui segue che S 0 = Oper una simile particella. S" non ha [22.36] Elaborate i dettagli di queste affermazioni - dove potete assumere, per comodità, che gli autovalori formino un sistema discreto invece che uno continuo. Per prima cosa assumete che non vi siano autovalori degeneri, mostrate poi come la dimostrazione va modificata quando vi sono degenerazioni. Suggerimento: esprimete ciascun autovettore di A in termini di autovettori di B, e così via. 568
Algebra, geometria e spin quantistici
però bisogno d'annullarsi per un sistema di due o più particelle. Inoltre, per una singola particella con spin, il momento angolare Mah non ha questa semplice forma, poiché vi è un termine addizionale di spin µ- 2EabcdS,,pd, assumendoµ -:f:. O (vedi nota 11 del capitolo 18). Troviamo che sa è sempre ortogonale apa (pasa = O) e che commuta conpa (vale a dire [Sa,A] = O), così che sa, come Pm è indipendente dall'origine.l2 2·37l Vi sono due operatori di Casimir indipendenti (per il gruppo di Poincaré), e precisamente
essendo µ la massa di riposo dell'intero sistemaP2 ·38l Troviamo che il «J 2» definito nella seconda delle equazioni precedenti è proprio J2 = Lr + L'f + Ll, dove L 1, L2 , e L 3 sono le componenti del momento angolare rispetto al centro di massa nel suo riferimento di riposo. Per completare l'insieme di operatori commutanti possiamo scegliere p 1,p2,P3, e una componente, per esempio S3, del vettore di spin, il che - assieme a paJf e Sasa - dà in tutto sei. (Anche se sono possibili moltissime altre scelte, il numero totale di operatori indipendenti è sempre44 sei.) Questo ha notevole importanza per le discussioni di §22.13 e §31.l O. · La situazione è perciò molto simile al caso non relativistico in cui, per includere traslazioni nel tempo e nello spazio, potemmo scegliere l'energia E come «operatore di Casimirn per integrare la grandezza J2 , e le tre componenti del momento in aggiunta a L 3 • Si dovrebbe notare che, nel caso relativistico, non otteniamo direttamente J2, ma piuttosto
J2 = - c4(paPat I sasa, che ci dà qualcosa di fondamentalmente equivalente, purché PaPa -:f:. O. In verità, nella discussione precedente, abbiamo assunto che la massa di riposo µ non fosse nulla. Se µ = O, non possiamo esprimere lo spin in questo modo. Come trattiamo il caso µ = O? Recuperiamo invece 1' elicità s - una grandezza che abbiamo già incontrato, nel caso di un fotone, in §§22.7, 9. Questa è definita dalla richiesta fisica che il vettore di Pauli-Lubanski sa sia proporzionale al 4-momento Pa:[2 2-391
L;elicità destrorsa è data da s > O e quella sinistrorsa da s < O, ma è anche ammesso s =O.Abbiamo adesso quattro osservabili commutanti indipendenti, che possiamo ritenere essere s, p 1, p 2 , p 3• In realtà, il modo di gran lunga più pulito di trattare il caso senza massa è ricorrere alla teoria dei twistor. La trat[22.37] Dimostrate queste quattro affermazioni. [22.38] Date un semplice motivo del perché questi due operatori devono commutare con Pa e M"b. Suggerimento: date un'occhiata a §22.13. [22.39] Come possono Sa e Pa essere sia ortogonali che proporzionali? 569
LA STRADA CHE PORTA ALLA REALTÀ
teremo in §33.6 (dove vedremo che le «variabili di twistorn Zo, 2 1, 2 2 , 2 3 possono anche essere usate come quattro operatori commutanti indipendenti).
22.13 II generale oggetto quantistico isolato Come descrive, in generale, la meccanica quantistica un oggetto isolato, come un atomo o una molecola? Assumo che sull'oggetto non agiscano forze esterne e che esso rimanga localizzato, ma potrebbero esserci forze interne agenti dentro di esso. Per caratterizzare meglio un oggetto di questo tipo, separiamo la descrizione in (i) la caratterizzazione esterna dell'oggetto come un tutto e (ii) i suoi dettagliati meccanismi interni e la sua struttura geometrica. Questa caratterizzazione esterna (i) fa riferimento alla sua massa/energia globale, al suo momento, alla posizione e al moto del suo centro di massa e al suo momento angolare. Prendiamo queste grandezze nel senso relativistico e impieghiamo le Pa e Mah di §22.12 per descrivere i parametri esterni. I meccanismi interni (ii) si riferiscono alle particelle costituenti, alla loro natura particolare, alla natura delle forze tra di loro e alle loro relazioni geometriche. Si riterrà che queste relazioni siano date da alcune coordinate generalizzate q,. (§20.1) di natura completamente relativa45 (per esempio la distanza di qualche parte dal centro di massa, o gli angoli che formano differenti parti tra loro, o le distanze tra l'una e l'altra). Perciò, esse non variano se l'intero oggetto subisce una traslazione spaziale o temporale, o viene ruotato di un certo angolo, o viene mosso in qualche direzione con velocità uniforme. Data la loro natura relativa, tutte le coordinate interne non sono alterate da qualunque simmetria del gruppo di Poincaré. Ne segue che devono commutare con Pa e Mah_ Perché? Supponiamo che qualche operatore di simmetria S agisca su un sistema quantistico in conformità con
e che Q sia un operatore quantistico, allora l'azione dell'operatore di simmetria su Q è[ 22 ·40l
Qf-o'>SQS- 1• Se Q non è modificato da S allora SQS- 1 = Q, quindi SQ=QS. In questo modo, prendendo a turno per S ciascuna componente di Pa e Mah, vediamo che ogni parametro interno deve proprio commutare conpa e Mah_ [22.40] Spiegate perché. Suggerimento: un'occhiata a §22.4 può essere d'aiuto.
570
Algebra, geometria e spin quantistici
In questo contesto, ciò significa che possiamo separare la parte della funzione d'onda che si riferisce ai gradi di libertà interni da quella che si riferisce ai parametri esterni del 4-momento e del 6-momento angolare. Nei comuni trattamenti, supponiamo che il sistema sia in un autostato dell'appropriato sistema completo di osservabili esterne. I.:energia e il momento, in particolare, sarebbero dati da autovalori definiti e sarebbe abituale riferire le cose al sistema di riferimento in cui il 3-momento è zero (P = O, nella notazione di §21.5). Il momento angolare può allora essere trattato secondo le discussioni non relativistiche di §§22.8-11, così che possiamo richiedere che il sistema sia in un autostato del momento angolare totale J 2, e anche di L3 , se lo si vuole. I parametri interni dipenderanno naturalmente dai dettagli del particolare sistema in esame. In alcune cii:costanze, può darsi che sia una buona approssimazione ritenere che i gradi interni di libertà siano descritti da piccole oscillazioni intorno all'equilibrio. Sarà allora importante l'analisi classica di §20.3. Rammentiamo da §20.3 che, se prendiamo una hamiltoniana della for!I!a ,;il _ I Q a b I pab - 2 abq q + 2 PaPb, dove Q b e pab sono simmetriche, definite positive e costanti nel tempo, allora, nel caso classico, ciascuna frequenza normale ro/2rc proviene da un autovalore della matrice W = PQ (vale a dire, wa e = pabQbc)Ma nel caso della meccanica quantistica? Ricordando la relazione di Planck E= hv = 2rchv, dove v è la frequenza, potremmo aspettarci un'energia E= hro per un'oscillazione in quel particolare modo normale. Potremmo forse anche anticipare valori maggiori per l'energia, poiché classicamente l'ampiezza dell'oscillazione potrebbe diventare grande a piacere (purché si rimanga nell'ambito dell'approssimazione di «piccola oscillazione»), e col crescere dell'ampiezza cresce l'energia. Se supponiamo che siano implicate «armoniche più alte» - ricordiamo da §9.1 che queste hanno frequenze che sono multipli interi della frequenza fondamentale ro/2rc - potremmo immaginare che gli autovalori dell'energia quantistica sarebbero: 0
O, hro, 2 hro, 3 hm, 4 hro, ... In effetti, ciò non è molto distante dall'~satta risposta quantistica, ma dobbiamo tenere conto che vi è un contributo addizionale all'energia uguale a ½hro, l'energia di punto zero. 46 Gli autovalori dell'energia sono allora:
571
LA STRADA CHE PORTA ALLA REALTÀ
Questo deriva dalla discussione quantistica standard dell'oscillatore armonico l-dimensionale, 47 per il quale l'hamiltoniana è -;;?I= (m 2w 2q 2 + p 2)/2m. Separatamente per ciascun modo, vi è un contributo ali' energia da uno di questi valori, per ciascun autovalore della matrice W. Questi valori, per un sistema quantistico generale, sarebbero solo approssimazioni, perché diverrebbero importanti termini di ordine più elevato. Tuttavia, vari sistemi possono essere molto ben approssimati in questo modo. Avviene inoltre, e anche in modo piuttosto notevole, che la teoria quantistica del campo del fotone - o di qualsiasi altra particella del tipo chiamato «bosone» (vedi §23.7 e §26.2)- possa essere trattata come se l'intero sistema di bosoni fosse una collezione di oscillatori. Questi oscillatori sono proprio del semplice tipo armonico, quello sopra esaminato (dove nell 'hamiltoniana non vi sono termini di ordine più elevato) quando i bosoni sono in uno stato stazionario senza interazioni tra di loro. 48 Di conseguenza, questa rappresentazione in termini di «oscillatori armonici» è uno schema largamente applicabile. Ciononostante, per andare più in profondità, è necessaria una conoscenza dettagliata delle interazioni. Un atomo di idrogeno, per esempio, è formato da un elettrone in orbita attorno al suo nucleo, un solo protone (di solito supposto fisso per una buona approssimazione, poiché il protone si muove poco, essendo molto più massivo dell'elettrone - per un fattore che è circa 1836). Le regole della meccanica quantistica ci dicono però che l'orbita quantica non implica solo una singola traiettoria classica attorno al nucleo, ma è fondamentalmente una sovrapposizione quantistica di molte di queste. Queste «orbite quantiche» sovrapposte sono soluzioni stazionarie dell'equazione di Schrodinger, con una hamiltoniana che è sostanzialmente identica a quella classica, ma «canonicamente quantizzata» secondo le regole di §§21.2, 3 (e di §23.8, quando è necessario). Gli autostati del momento angolare sono autofunzioni che sono armoniche sferiche, per quanto riguarda la loro dipendenza angolare (§22.11 ). Per etichettare i vari stati, potremmo impiegare, in generale, come numeri quantici l'autovalore dell'energia E e quello del momento angolare j (assieme a m, se è appropriato). Nel caso dell'atomo di idrogeno (se trascuriamo gli spin dell'elettrone e del protone e prendiamo una forma non relativistica dell'hamiltoniana), troviamo che l'autovalore dell'energia E è determinato dall'autovalore del momento angolare j, ma questo, accidentalmente, non è determinato da E. In una teoria più accurata dell'atomo di idrogeno (e per atomi più complessi), in generale troviamo che E non determinaj, così che tutti i diversi stati sono effettivamente caratterizzati dal solo autovalore dell'energia. Nell'originaria teoria dell'atomo di Bohr, avanzata nel 1913, più di un decennio prima della molto più precisa meccanica quantistica di Heisenberg, Schrodinger e Dirne, i valori permessi per il momento angolare e l'energia dell'atomo di idrogeno erano calcolati come se le orbite fossero le classiche orbite ellittiche di Keplero-Newton - date dalla legge di attrazione elettro572
Algebra, geometria e spin quantistici
Fig. 22.19 - «L'atomo di Bohr», dove si ritiene che gli elettroni orbitanti seguano le classiche orbite ellittiche di Keplero-Newton, in accordo con la legge dell'attrazione elettrostatica, ma dove le loro energie e momenti angolari sono vincolati dalla «condizione quantistica» per cui i momenti angolari orbitali devono essere multipli interi di 1i. Questa idea ha avuto il suo più grande successo nel calcolo delle orbite circolari del singolo elettrone dell'atomo di idrogeno.
statica tra il nucleo e l'elettrone orbitante-, ma con la «condizione quantistica» che il momento angolare orbitale dell'elettrone dovesse essere un multiplo intero di n. Tali «orbite quantizzate» a volte vengono chiamate orbitali; vedi fig. 22.19. Questo procedimento funzionava decisamente bene, 49 ma non era supportato dalle basi teoriche fornite dalla successiva meccanica quantistica, che conducevano a risultati di generalità e accuratezza molto maggiori. Atomi più complessi, molecole semplici, effetti relativistici, la presenza dello spin degli elettroni e dei nuclei, eccetera, possono tutti essere trattati dal formalismo quantistico impiegando le idee sopra descritte, anche se ci si deve aspettare che siano fatti calcoli numerici e impiegate tecniche di approssimazione, piuttosto che trattamenti matematici esatti. Anche il precedente impiego dell'elettrostatica è un'approssimazione e si devono permettere le transizioni da uno stato stazionario a un altro tramite emissione/assorbimento di fotoni. Queste richiedono la teoria di Maxwell, ma nella sua forma quantizzata che, a rigar di termini, necessita del formalismo della teoria quantistica dei campi (che sarà esposta per sommi capi nel capitolo 26). Per un'esattezza completa sarebbe anche necessario l'elettrone relativistico di Dirac del capitolo 24. Un àtomo nell'autostato di minima energia, ossia in uno stato jòndamentale, rimane in quello stato ( assumendo che sia completamente isolato da disturbi ambientali), ma se è in uno stato con maggiore energia - ossia in uno stato eccitato - allora50 vi è una probabilità finita che caschi nello stato fondamentale, con l'emissione di uno o più fotoni. Per questo motivo ci si attende di trovare atomi o molecole liberi nel loro stato fondamentale, o in stati a questo vicini. La frequenza v di un singolo fotone emesso, quando un atomo o una molecola passa da uno stato a un altro, è fissata, tramite la relazione di Planck E= 2rcnv (vedi §21.4) e la conservazione dell'energia, dalla difjèrenza di energia E tra i due stati. Simili frequenze sono state a lungo osservate, in righe spettrali, la cui spiegazione si è rivelata un lunghissimo enigma scientifico. La straordinaria ricchezza di informazioni in questi sistemi di righe spettrali osservate è spiegata 573
LA STRADA CHE PORTA ALLA REALTÀ
dalla teoria quantistica nel modo sopra accennato. Questa spiegazione ha costituito uno dei maggiori trionfi della fisica del ventesimo secolo! Le previsioni della fisica classica (che implicano la legge di attrazione coulombiana tra cariche positive e negative e le equazioni di Maxwell, che ci dicono che un elettrone in accelerazione deve emettere energia elettromagnetica) si basavano sul fatto che un elettrone orbitante sarebbe dovuto precipitare spiraleggiando sul nucleo, dando origine, in modo catastrofico e in poco tempo, a uno stato singolare. Questa conclusione era in palese contraddizione con i fatti osservati. La meccanica quantistica non ha soltanto eliminato questo paradosso, ma ha anche fornito una teoria dettagliata delle righe spettrali che ci ha dato uno strumento straordinariamente potente in molte aree della scienza, dalla scienza investigativa alla fisica nucleare fino alla cosmologia. Un commento finale di notevole importanza: si può osservare che l'esistenza di numeri quantici discreti, come ij e gli m del momento angolare o degli autostati dell'energia per l'oscillatore armonico o l'atomo di idrogeno, eccetera, nascono in ultima analisi dalla compattezza di qualche spazio. 51 Nel caso del momento angolare, dalla compattezza della sfèra delle direzioni spaziali, che è la S2 a cui si applica l'analisi armonica di §22.11. Senza qualcosa come la compattezza (o la periodicità), avremmo solo soluzioni di equazioni come v'2 = -k, in cui l'autovalore k non ha alcun vincolo. È ironico che in assenza d{ ooa simile .compattezza il formalismo generale della meccanica quantistica non avr-ebbe fornito quella sorprendente discretezza che ha dato origine al soggetto, e da cui ha avuto origine lo stesso nome «quanto»!
Note 1.
2.
3. 4.
5. 6. 7.
574
Sembra siano stati questi salti a stimolare l'espressione colloquiale «quantum leap (balzo quantico)». Per un fisico, questa è una scelta di parole estremamentè strana, poiché i salti quantici che avvengono nella riduzione dello stato quantico tendono a essere eventi straordinariamente minuscoli, scarsamente rilevabili e probabilmente non reali. Per una discussione generale relativa ai differenti punti di vista sulla meccanica quantistica, vedi Rae (1994); Polkinghome (2002); Home (1997); o DeWitt e Graham (1973). Vedi caP.itolo 29, e Everett (1957); Wheeler (1957); DeWitt e Graham (1973); Geroch (1984). Come nel caso di una sinsola particella (§21.9), alcuni autori potrebbero usare «Il \jf Il 2» invece della mia li 'I' Il. Per una bella introduzione allo studio di simili spazi, vedi Chen (2002); Reed e Simon (1972). Nella letteratura quantistica è spesso usata la notazione Qt, invece di quella Q* impiegata nella più importante letteratura matematica; vedi § 13. 9. Vedi Dirac (1982) per la ristampa più recente. Vedi Shankar (1994) per una trattazione più recente.
Algebra, geometria e .1pin quantistici
8. Vedi Dirac (1966) sul fatto che la rappresentazione di Schrodinger non esiste nella teoria quantistica del campo relativistico. 9. La rappresentazione di interazione, per esempio, è spesso impiegata nei calcoli della «teoria delle perturbazioni dipendenti dal tempo», dove l'hamiltoniana dipende dal tempo. Vedi Shankar (1994), capitolo 18; Dirac (1966). 10. Qui ignoro il fatto che gli autostati non sono normalizzabili, il che potrebbe interdire a posizione e momento di essere vere «osservabili» in alcune formulazioni. 11. Più in generale, diciamo che q, indipendentemente dal fatto che sia un autovalore o no, è il valore di aspettazione di Q per lo stato normalizzato i'l') se q =
('l'IQI\Jf). 12. Vedi Dirac (1982). Parametri complessi sono impiegati in molti campi, per esempio Fortney (1997). 13. Un trattamento elegante delle misurazioni di proiezione può essere trovato in Kraus (1983); Nielsen e Chuang (2000). 14. Vedi von Neumann (1955). 15. Vedi Lilders (1951), vedi anche Penrose (1994). 16. Vedi Elitzur e Vaidman (1993). 17. Sembra che l'idea originaria di misurazioni senza interazione sia dovuta a Robert Dicke (1981 ). Ha alcune applicazioni molto sconcertanti, come nella rivelazione di onde gravitazionali; vedi Braginsky ( 1977). Lo straordinario esperimento concettuale della «bomba» di Elitzur-Vaidman qui descritto (vedi anche Penrose 1994) potrebbe condurre ad altri tipi di applicazioni. 18. Vi sono ora buone prove che almeno la maggior parte dei vari tipi di neutrini siano massivi, forse anche tutti. Persino così, l'assunzione per cui siano «senza massa» fornisce una buona approssimazione per il loro comportamento. Ritornerò su tale questione in §25.3. 19. Questo raffinamento del postulato di proiezione sembra dovuto a Li.iders (1951) e, in questo caso, il punto IP-) in IPH 4 sarebbe chiamato il «punto di Li.iders». 20. Per un esempio più economico ( e più interessante), potremmo prendere in esame una situazione leggermente differente in cui la superficie di un mezzo rifrangente è impiegata come separatore di fascio, dove invece di essere polarizzato il fascio incidente è mirato all'angolo di Brewster per il mezzo. Il fascio riflesso ha allora una specifica polarizzazione lineare, mentre il fascio trasmesso ha la polarizzazione lineare opposta. I.?analisi è sostanzialmente la stessa di prima (con polarizzazione lineare invece che circolare), ma adesso non abbiamo bisogno di garantire che il fotone in arrivo sia polarizzato, poiché il semplice fatto che provenga dall'esterno del mezzo (all'angolo appropriato), invece che dal!' interno, è sufficiente a garantire che la misurazione nulla produca il richiesto stato polarizzato. Per una buona referenza generale sull'elettromagnetismo, vedi Becker (1982); Jackson (1998). 21. Una «particella senza struttura» non ha momento angolare attorno al suo centro di massa, poiché l'espressione M = 2x /\ p di§ 18.6 si annulla quando x =O.Ma, come fatto osservare nella nota 11 del capitolo 18, al momento angolare deve essere aggiunta una grandezza che descrive lo «spin intrinseco», quando vi è la «struttura» definita dallo spin della particella. Lo vedremo più esplicitamente in §22.11. 22. Il lettore attento può chiedersi se sono qui implicate sottigliezze di segno della specie incontrata in §21.2, provenienti dalla segnatura della metrica. Per un trattamento dettagliato della teoria del momento angolare in meccanica quantistica, dall'algebra di Lie di SO(3), il lettore dovrebbe vedere le lucide esposi575
LA STRADA CHE PORTA ALLA REALTÀ
23. 24. 25. 26.
27. 28. 29. 30. 31. 32. 33. 34. 35. 36. 37.
38.
39.
40.
41. . 42.
43. 576
zioni di Jones (2002) e Elliot e Dawber (1984). Una derivazione alternativa e molto più «fisica» dell'algebra del momento angolare è data in Shankar (1994); anche se a mio parere vi è un po' più di lavoro implicato in questo approccio! Vedi Penrose e Rindler (1984). Vedi Geroch (Conferenze dell'Università di Chicago, non pubblicate). Witten (I 959); Geroch (1968, 1970); Penrose e Rindler (1984, 1986). La parola «indipendente» è usata nel senso che tutte le componenti di 'l'AB ..F possono essere ottenute algebricamente da questo insieme indipendente, ma non da un insieme più piccolo. Qui questo nasce semplicemente dalla simmetria, così che il totale di 211 componenti si riduce a n + I componenti indipendenti (per esempio, 'l'ooi, 'lf010 , 'l'ioo, non sono, in modo banale, componenti indipendenti, poiché 'l'oo1 = %10 = '1'100)Come al solito, indichiamo la nostra referenza canonica, Shankar ( 1994). Vedi nota 12 del capitolo 21; anche Nielsen e Chuang (2000) discutono alcuni aspetti della scienza dell'informazione quantistica da un punto di vista simile. Vedi Majorana (1932). · Vedi Biedenham e Louck (1981) per una rassegna generale. Per una interessante applicazione moderna, vedi Swain (2004). Vedi Penrose (1994, 2000); Zimba e Penrose (1993 ). Nel contesto delle armoniche sferiche, è frequentemente impiegata la lettera invece della} che impiego qui. Per maggiori dettagli, vedi qualsiasi testo di meccanica quantistica, per esempio Shankar (1994) o Arfken e Weber (2000). Shankar (1994). Vedi Newman e Penrose (1966); Penrose e Rindler (1984). Vedi Goldberg, e altri (1967). Vi sono anche proprietà di ortogonalità e di normalizzazione (per fissare lascala globale) delle armoniche sferiche che sono importanti per usarle e fare calcoli con esse. Tali questioni, tuttavia, ci porterebbero troppo in là, e il lettore dovrebbe fare riferimento alle seguenti esposizioni della teoria delle armoniche sferiche: Groemer (1996); Byerly (2003). lJ lettore che desidera approfondire l'algebra e la geometria degli spinori, dovrebbe prendere nota del fatto che gli indici spinoriali possono essere «innalzati» o «abbassati» secondo lo schema: ç1 = ç0 , ç0 = - I; 1• Vedi Penrose e Rindler (1984); Zee (2003), appendice. Il termine «numero quantico» si riferisce di solito ai possibili autovalori discreti di qualche significativa osservabile quantistica ( come il momento angolare, la carica, il numero barionico, eccetera) che è usata per classificare una particella o un sistema quantistico semplice. Vedi §3.5. Vedremo nei capitoli 24-26 che una meccanica quantistica veramente relativistica (speciale) richiede molto di più delle riflessioni di base di questa sezione, ma questo non ha effetto sulla presente discussione. Si rammenti la nota 6. Qui l'indipendenza tiene conto dell' antisimmetria di M 0 h• Vi è una connessione tra questo e il fenomeno della «separazione delle variabili» che avviene quando una funzione generalef(0, ), per esempio, può essere scritta come una sommaf(0, )= 1:Àug;(0)hi), dove g;(0) e h/) sono rispettivamente autofunzioni di appropriati operatori (commutanti) A e B. Le armoniche sferiche hanno questa proprietà. Vedi Groemer (1996); Byerley (2003). «Indipendente» fa qui riferimento all'indipendenza funzionale (confronta con
e,
Algebra, geometria e spin quantistici
44.
45. 46.
47. 48. 49.
50. 51.
la nota 26). In questo modo, mentre 2J2, (J2) 3 e cos J2 non sono il medesimo operatore di Casimir come J2, non sono però indipendenti da J2. Qualche precauzione è richiesta riguardo all'invarianza del «numero di operatori commutanti indipendenti». A rigor di termini, questo si riferisce alla dimensione di uno spazio che è valido per le soluzioni locali di equazioni differenziali alle derivate parziali. Nei problemi quantistici, vi sono probabilmente richieste di compattezza per lo spazio delle soluzioni (per esempio, lo spazio S2 di §22.11) che limitano fortemente gli autovalori permessi e confondono il conteggio dei gradi di libertà. Sono qui ignorati i problemi di relatività generale, e così «relativo» è considerato nel senso della relatività speciale. Vi è, tuttavia, la libertà di aggiungere una costante all'hamiltoniana, come considerata in §20.3, che ridefinisce semplicemente lo zero dell'energia (cfr. esercizio [24.2] di §24.3), così che questa aggiunta di } nro a volte viene ritenuta possedere nessun significato fisico diretto. Vedi, per esempio, il classico trattamento di Dirac in The principles of Quantum Mechanics, Dirac (1982). Le grandezze T] = (2m nrot 112 (p + imq), nella rappresentazione di Heisenberg di §22.4 svolgono il ruolo degli operatori di creazione di §26.2. Ha prodotto, in particolare, la precedentemente incomprensibile formula di Balmer per le frequenze delle righe dello spettro dell'idrogeno: v = R(N- 2 - M- 2), dove R è una costante (conosciuta come la costante di Rydberg-Ritz) e dove M > N > O sono interi. Vi possono essere «regole di selezione», nascenti da leggi di conservazione, che proibiscono alcune di queste transizioni. Confrontate con la nota 44.
CAPITOLO
IL
23
MONDO QUANTISTICO ENTANGLED
23.1 La meccanica quantistica di sistemi di molte particelle Abbiamo visto, nei due capitoli precedenti, quanto sia misterioso il comportamento di singole particelle quantistiche, con o senza spin, e come si sia sviluppato uno strano e meraviglioso formalismo matematico per far fronte a questo comportamento. Non sarebbe irragionevole aspettarci che, poiché il nostro formalismo ci ha descritto il comportamento quantistico di singole particelle o di altri enti isolati, dovrebbe anche dirci come descrivere sistemi contenenti parecchie particelle, forse interagenti tra loro in svariati modi. In un certo senso ciò è vero (fino a un certo punto) poiché il formalismo generale di §21.2 è abbastanza ampio per_questo, ma sorgono alcune caratteristiche decisamente nuove quando in un sistema è presente più di una sola particella. La novità fondamentale è il fenomeno dell'entanglement quantistico, per mezzo del quale un sistema di più di una particella deve nondimeno essere trattato come una singola unità solistica. Varie manifestazioni di questo fenomeno ci offrono un comportamento quantistico ancora più misterioso di quello che abbiamo finora incontrato. Inoltre, le particelle che sono identiche l'una all'altra sono sempre automaticamente entangled tra loro, anche se vedremo che ciò può avvenire in due modi del tutto diversi, in base alla natura della particella. Ritorniamo a ciò che abbiamo presentato nei due capitoli precedenti sulla matematica di un sistema quantico. I:approccio hamiltoniano, che ci fornisce l'equazione di Schrodinger per l'evoluzione del vettore di stato quantistico, è ancora valido quando vi sono molte particelle, probabilmente interagenti, probabilmente con spin, proprio come nel caso di una singola particella senza spin. Tutto quello di cui abbiamo bisogno è un'opportuna hamiltoniana che includa tutte queste caratteristiche. Non abbiamo una funzione d'onda separata per ciascuna particella, abbiamo invece un unico vettore di stato che descrive l'intero sistema. In una rappresentazione di posizione, questo singolo vettore di stato può ancora essere pensato come una funzione d'onda 'f', ma sarebbe una funzione di tutte le coordinate di posizione di tutte le particelle, così che sarebbe realmente una funzione dello spazio delle configurazioni del sistema di parti578
Il mondo quantistico entangled
celle (vedi §12. l ), e potrebbe anche dipendere da alcuni parametri discreti che etichetterebbero gli stati di spin (per esempio, se usassimo una descrizione 2spinoriale \J'AB.. Fo come quella in §22.8, per descrivere una particella con spin, allora i «parametri discreti» etichetterebbero le diverse componenti individuali). C equazione di Schrodinger ci dirà come \J' evolve col tempo, così che \J' dovrà dipendere anche dalla variabile temporale t. Una caratteristica degna di nota della teoria quantistica standard è che per un sistema di molte particelle vi è soltanto un'unica coordinata temporale, mentre ciascuna delle singole particelle presenti nel sistema quantistico ha il suo proprio insieme indipendente di coordinate di posizione. Questa è una curiosa caratteristica della meccanica quantistica non relativistica, se ci piace pensare che essa sia una sorta di approssimazione limite a una teoria relativistica «più completa». In uno schema relativistico non vi è infatti una sostanziale differenza tra il modo con cui trattiamo lo spazio e quello con cui dovremmo trattare il tempo. Poiché ciascuna particella ha le proprie coordinate spaziali, dovrebbe avere anche la propria coordinata temporale. Ma non è questo il modo con cui funziona la comune meccanica quantistica: vi è soltanto un unico tempo per tutte le particelle. Quando ragioniamo s1.1lla fisica in ùn modo ordinario «non relativistico», questo può davvero sembrare ragionevole, poiché nella fisica non relativistica il tempo è esterno e assoluto, e semplicemente «trascorre».in modo universale, indipendentemente dal particolare contenuto dell'universo in qualsiasi singolo istante. Ma, da quando è stata introdotta la teoria della relatività, sappiamo che una tale rappresentazione può essere soltanto un'approssimazione. Quello che è il «tempo» per un osservatore è un miscuglio di spazio e tempo per un altro, e viceversa. C ordinaria teoria quantistica richiede che ciascuna particella abbia individualmente le proprie coordinate spaziali; di conseguenza, in una teoria quantistica adeguatamente relativistica, ciascuna particella dovrebbe avere la propria coordinata temporale. In verità, questo punto di vista è stato adottato di quando in quando da vari autori, 1 risalendo fino agli ultimi anni del terzo decennio del ventesimo secolo, ma non sembra che sia stato sviluppato in una completa teoria relativistica. La difficoltà fondamentale nell'ammettere che ciascuna particella abbia il proprio tempo risiede nel fatto che ciascuna particella sembra andare allegramente per la sua strada in una dimensione temporale separata, così che sarebbero necessari ulteriori ingredienti per riportarci alla realtà. In §26.6, introdurrò l'approccio alla teoria quantistica relativistica con «l'integrale sui cammini», che è basato su un formalismo relativistico lagrangiano invece che hamiltoniano, e verrà eluso il problema «un unico tempo/molti spazi». Tuttavia, come vedremo più avanti, entreranno in scena nuovi problemi, come sempre avviene, indipendentemente da quale (noto) procedimento sia impiegato. Inoltre, vedremo tra poco che la stessa comune equazione di Schr6dinger non è immune alle difficoltà del «ritorno alla realtà». A mio parere, que579
LA STRADA CHE PORTA ALLA REALTÀ
sta semplice asimmetria tra spazio e tempo dell'approccio di Schrodinger cela qualcosa di profondo che è ancora mancante nella nostra rappresentazione quantistica delle cose. Ma questo non dovrebbe al momento preoccuparci. Per ora ignorerò tali problemi e presenterò le cose soltanto dal punto di vista della teoria quantistica non relativistica, dove si può ritenere valida la nozione di un tempo universale esterno. In ogni caso, il problema della relatività non scomparirà e dovremo ritornarci alla fine di questo capitolo, in §23.10. Allora, come dobbiamo trattare i sistemi di molte particelle secondo la rappresentazione standard non relativistica di Schrodinger? Come è stato descritto in §21.2, avremo una singola hamiltoniana in cui devono apparire tutte le variabili di momento per tutte le particelle del sistema. Ciascuno di questi momenti viene rimpiazzato, nella prescrizione di quantizzazione della rappresentazione di posizione (Schrodinger), da un operatore di derivata parziale rispetto alla relativa coordinata di posizione di quella particolare particella. Tutti questi operatori devono agire su qualcosa e, per motivi di coerenza, devono tutti agire sulla medesima cosa: questa è la funzione d'onda. Come è stato asserito in precedenza, dobbiamo avere proprio un'unica funzione d'onda \J1 per l'intero sistema e questa funzione d'onda deve essere davvero una funzione di tutte le varie coordinate di posizione di tutte le singole particelle.
23.2 L'enormità dello spazio degli stati di molte particelle Tutto ciò sembra innocuo, ma lo è davvero? Facciamo una pausa per assimilare l'enormità di questa ultima richiesta, apparentemente semplice. Nel caso in cui ciascuna particella dovesse avere la propria distinta funzione d' onda, per n particelle scalari (cioè, senza spin) dovremmo avere n diverse funzioni complesse della posizione. Anche se questo richiede un po' di sforzo alla nostra capacità immaginativa, per poche particelle è qualcosa a cui possiamo far fronte. (In queste considerazioni ignoro il tempo; supponete che tutto avvenga nel medesimo istante.) A livello di visualizzazione, la nostra rappresentazione non sarebbe molto differente da quella di un campo nello spazio con n differenti componenti, in cui ogni componente descrive un «campo» distinto. (Ciascuno di questi campi distinti rappresenterebbe la funzione d'onda di una singola particella.) Forse dovremmo parlare di 2n componenti, se ragioniamo in termini di componenti reali, poiché le.funzioni d'onda sono complesse. Dopo tutto, un campo elettromagnetico ha sei componenti reali - cioè sei funzioni di tre variabili (analoghe a tre funzioni d'onda scalari complesse) - e un campo di vettori elettrici e magnetici non è uno sforzo così grande per l'immaginazione! In che modo dobbiamo fare il conto della «libertà» in un campo scalare complesso, come la funzione d'onda per una particella scalare nel 3-spazio? Qual è il «numero» dei diversi campi possibili di questo tipo? Si ricordi che, 580
Il mondo quantistico entangled
secondo la notazione di § 16. 7, 1' espressione ooa denota la libertà disponibile per un campo (liscio) liberamente scelto con a componenti reali in uno spazio di b dimensioni reali. In questo modo, per un campo scalare complesso, a = 2 (perché un numero complesso conta come due numeri reali), così che la libertà sarebbe 002001 • Questo se si ragiona per un particolare valore del tempo - cioè tenendo t costante ~, poiché consideriamo l'ordinario spazio tridimensionale, che dà b = 3 (e non il valore b = 4 per lo spaziotempo). Potremmo anche considerare lo spaziotempo, ma in questo caso abbiamo equazioni di campo che limitano la libertà. Nel caso della funzione d'onda, è l'equazione di Schrodinger che riduce la libertà a quella che può essere liberamente specificata, come dati iniziali, su un 3-spazio iniziale, così che otteniamo ancora 00 200-' per la libertà nel campo. In qualità di considerazione accessoria, possiamo esaminare il caso di un campo libero di Maxwell senza sorgenti (cariche) di cui preoccuparci. Qui abbiamo sei componenti reali nell'ordinario 3-spazio, così che, se prendiamo il campo solo a un istante t fissato e ignoriamo le ·equazioni di Maxwell, otteniamo 00 6001 come libertà; ma le equazioni di Maxwell implicano due vincoli su qualsiasi 3-spazio iniziale di dati, precisamente l'annullamento della divergenza dei vettori elettrico e magnetico.l23•1l Questo riduce di due il numero effettivo di componenti libere sulla 3-superficie dei dati iniziali, così che la libertà è effettivamente 004001 • Prendiamo ora in esame la descrizione quantistica di n particelle scalari. Se la descrizione fosse proprio con n differenti funzioni d'onda, la libertà sarebbe 00211001 , perché questa è la libertà nella scelta di n numeri complessi per punto nel 3-spazio. Ma nel caso di una effettiva funzione d'onda quantistica che descrive n particelle scalari, abbiamo una funzione complessa di 3n variabili reali; questa equivale a un campo scalare complesso in uno spazio di 3n dimensioni, così che la libertà è invece 002001", che è incredibilmente più grande. Probabilmente non è così facile apprezzare l'enormità di questo aumento, quando è nascosto in tutti quegli oo. Lasciatemi quindi prendere in esame un universo «giocattolo» che ha soltanto 1Opunti, che possiamo etichettare con O, 1, 2, 3, 4, 5, 6, 7, 8, 9. La funzione d'onda di una particella scalare in questo universo consisterebbe di un numero complesso in ciascuno di questi 1Opunti, cioè 1O numeri complessi z0, z 1, z2 , ••• , z 9• Lo spazio di tutte queste funzioni d'onda sarebbe H10 , lo spazio complesso di Hilbert a 1Odimensioni (20 dimensioni reali). Se normalizziamo la funzione d'onda in modo che la somma dei quadrati dei moduli di questi z sia 1, allora lz6l2 rappresenterebbe la probabilità che una misurazione di posizione trovi la particella in 6, e così via. Ciò non è una cosa così assurda. In situazioni fisiche reali si potrebbe avere una successione di 1Oscatole, con un elettrone che potrebbe trovarsi in una qua00
"
[23.1] Sapete spiegare questo? Ricordate la nozione 4-dimensionale di «divergenza» descritta in §19.3; qui abbiamo bisogno della versione tridimensionale. Suggerimento: vedete l'esercizio [19.2].
581
LA STRADA Cl!E PORTA ALLA REALTA
~
....
~ o
1
.
2
.
...
3
.,.•··
.
4
5
6
,;·
'
7
. ,::
-'
.···
8~9t
Fig. 23.1 - Immaginiamo un «universo giocattolo» con solo 1Opossibili collocazioni per particelle, qui raffigurate da 1O scatole. Sono mostrate due particelle distinguibili A e B, ciascuna delle quali può occupare una qualsiasi scatola, indipendentemente dall'altra.
lunque di queste scatole. Vedi fig. 23.1. Gli sperimentatori possono costruire cose di questo genere chiamate punti quantici che hanno rilevanza per la possibilità teorica di costruire computer quantici, che farebbero uso dell'immensità di dimensioni di questi tipi di spazio di funzioni d'onda che sto per esaminare. Supponiamo ora che vi siano due particelle in questo nostro universo; è meglio che non siano particelle dello stesso tipo, per un motivo a cui giungerò più avanti. Così denominiamole particella A e particella B; ciascuna di esse potrebbe essere in 1Oposti alternativi, così che vi sono 100 modi diversi di piazzarle (concedendo che possano essere entrambe nella stessa scatola). Adesso abbiamo bisogno di 100 numeri complessi differenti, per esempio z 00 , z01 , ••• , z 09 , z 10, z 11 , ••• , z 19 , z20 , ••• , z 99 , per definire la funzione d'onda, poiché un numero complesso è assegnato a ciascun modo di piazzare le due particelle. Se normalizziamo in modo che la somma dei quadrati dei moduli di tutti questi z sia I, allora lz38l2, per esempio, rappresenterebbe la probabilità di trovare la particella A in 3 e la particella B in 8. Ora abbiamo a che fare con H 100 • Se avessimo tre particelle diverse - una particella A, una particella B e una particella C- la funzione d'onda consisterebbe di 1000 numeri complessi z 000 , z001 , ••• , z 999 e lo spazio degli stati sarebbe H1000 • Se le regole fossero state tali da avere soltanto tre singole funzioni d'onda, la spazio degli stati sarebbe stato soltanto H30 . Per quattro particelle diverse avremmo H 10000 , mentre per quattro funzioni d'onda individuali avremmo soltanto H40 , e così via. Ritornando alla notazione «ooa 003 "» che ho usato prima, prendiamo nota del fatto che il «oo 3» superiore si riferisce al «numero di punti» nel 3-spazio euclideo IE3. Questo numero è ora sostituito da I O, il numero di punti del nostro universo giocattolo, così che ooa"-' 3" diventa 00" 10" ( che denota il numero di punti in uno spazio reale di a x I 011 dimensioni. In questo modo, invece di 00 2003", per la libertà in una funzione d'onda scalare di n particelle in IE3, abbiamo ora 00 2x 10" per la libertà in una funzione d'onda di n particelle per il nostro universo giocattolo. Lo spazio di Hilbert complesso è ora H 1011 , per la funzione d'onda di n particelle del nostro universo giocattolo, da confrontare 582
Il mondo quantistico entangled
con H 1011 per n distinte funzioni d'onda complesse di una particella. In questo modo, la nostra funzione d'onda di n particelle è definita su uno spazio di 2 x 1011 dimensioni (questo spazio complesso di Hilbert 1011-dimensionale ), invece che su un semplice 20n-dimensionale spazio per n funzioni d'onda distinte. Per appena 8 particelle, per esempio, questo vuol dire 200.000.000 dimensioni contro soltanto 160.
23.3 Entanglement quantistico; disuguaglianze di Beli Che ruolo ha tutta questa informazione extra? Esprime quelle che vengono chiamate relazioni di «entanglement» tra le particelle. Come dobbiamo intenderle? Gli entanglement tra particelle, una nozione resa esplicita per la prima volta da Schrodinger (1935b), sono quelli che conducono a quei fenomeni, estremamente sconcertanti ma effettivamente osservati, noti come effetti di Einstein-PodolsÌci-Rosen (EPR). 2 Si tratta di caratteristiche abbastanza sottili del mondo quantistico e piuttosto difficili da dimostrare sperimentalmente in modo convincente. È sorprendente l'impressione di doversi rivolgere a qualcosa di così esoterico e celato alla vista quando, per sistemi di molte particelle, pressoché l'intera «informazione» nella funzione d'onda riguarda simili questioni! È un mistero su cui ritornerò tra poco (§23.6). A mio parere, questo mistero tenta di dirci qualcosa riguardo il tipo di direzioni lungo le quali dovrebbe muoversi il nostro attuale formalismo quantistico. Ma, sia come sia, ci sta certamente dicendo qualcosa sulla capacità potenziale della computazione quantistica,3 un argomento, oggetto di una ricerca molto attiva, che mira a sfruttare le enormi risorse di «informazione» che giacciono nascoste in queste relazioni di entanglement. Che cos'è dunque l'entanglement quantistico? Che cosa sono gli effetti EPR? Tutto diventerà più chiaro se prendiamo in esame una situazione finito-dimensionale, cosa che possiamo fare se ci concentriamo solo su stati di spin. La più semplice di queste situazioni EPR è quella considerata da David Bohm (1951). In questa, immaginiamo una coppia di particelle di spin{, per esempio la particella PL e la particella PR, che partono assieme in uno stato combinato di spin O e poi viaggiano in direzioni opposte, a sinistra e a destra, verso i rispettivi rivelatori, Le R, posti a una grande distanza l'uno rispetto all'altro (vedi fig. 23.2). Supponiamo che ciascuno dei rivelatori sia in grado di misurare lo spin della particella che si avvicina in qualche direzione che è decisa solo quando tra le due particelle vi è già una notevole distanza. Il problema è vedere se è possibile riprodurre le previsioni della meccanica quantistica impiegando qualche modello in cui le particelle sono ritenute entità, di tipo classico, indipendenti e non connesse, incapaci di comunicare tra loro dopo essersi separate. A causa di un notevole teorema dovuto al fisico nordirlandese John S. Bell, 583
LA STRADA CHE i'ORTA ALLA REALTÀ
R
Fig. 23.2 - L'esperimento EPR pensato di Bohm. Un paio di particelle di spin½ PL e PR hanno origine in uno stato combinato di spin O e poi viaggiano in direzioni opposte, a sinistra e a destra, verso i rispettivi rivelatori, L e R, ampiamente separati. Ciascun rivelatore è sistemato per misurare Io spin della particella che si avvicina, ma in una direzione che è decisa solo quando le particelle sono già in volo. II teorema di Beli ci dice che non è assolutamente possibile riprodurre le previsioni della meccanica quantistica con un modello in cui le due particelle possono agire come oggetti, di tipo classico, indipendenti che non possono comunicare dopo che sono stati separati.
non è possibile riprodurre in questo modo gli effetti della meccanica quantistica. Bell ha ottenuto disuguaglianze, 4 colleganti le probabilità congiunte dei risultati di due misurazioni fisicamente separate, che sono violate dalle previsioni della meccanica quantistica, ma che sono però obbligatoriamente soddisfatte da qualunque modello in cui le due particelle sì comportano come entità indipendenti dopo la loro separazione fisica. Perciò, la violazione della disuguaglianza di Bell segnala la presenza di effetti essenzialmente quantistici - effetti di entanglement quantistici tra particelle fisicamente separate che non possono essere spiegati da alcun modello in cui le particelle sono trattate come cose effettivamente non connesse e indipendenti. Vi sono molti esempi particolari di questo genere di violazione della disuguaglianza di Beli in letteratura. 5 Alcuni di questi, a cui sì fa riferimento come «disuguaglianze di Beli senza probabilità», 6 sono decisamente notevoli per il fatto che implicano soltanto questioni sì/no, di modo che non dobbiamo preoccuparci di probabilità - o piuttosto ci preoccupiamo solo dei casi limite di probabilità O («mai») e 1 («sempre»). Qui presenterò solo due versioni esplicite della contraddizione, del tipo disuguaglianza di Bell, tra particelle quantistiche e particelle individuali. Entrambe queste versioni implicano un paio di particelle di spin ½che vanno separatamente in un rivelatore L a sinistra e in un altro rivelatore R a destra. La prima, che segue un argomento dovuto a Henry Stapp (1971), (1979), è un esempio diretto della versione originale di Bohm dì EPR, a cui sì è fatto riferimento in precedenza e in cui abbiamo bisogno di esaminare valori probabilistici. La seconda, dovuta a Lucien Hardy (1992), (1993), è «quasi» una versione senza probabilità, ma contiene una piccola sorpresa extra. Prima di vederle in dettaglio, avrò bisogno di un po' più di notazione (di Dirac). Supponiamo di avere un sistema quantico consistente di due parti l'I') e lip), che possono essere ritenute indipendenti l'una dall'altra; se desideria584
Il mondo quantistico e11tangled
mo allora considerare lo stato quantico che consiste delle due parti insieme, possiamo scrivere
Questo è ancora un singolo stato e sarebbe legittimo scrivere un'equazione come lx) = l'V) I), che esprime questo fatto. Il tipo di prodotto qui impiegato è ciò che gli studiosi di algebra chiamano prodotto tensoriale; esso soddisfa le seguenti leggi: (zl\jf))I) ;= z(i\jf))I)) = i'V)(zl)), (I 0) + i'V))I) = le)I ) + 11/f)I), l'V)de> +I))= l'V)IB) + l'V)I). L'operazione di prodotto tensoriale è comunemente denotata con ®, nella letteratura matematica (vedi anche §13.7), quindi il prodotto l\jf)I) potrebbe essere denotato con l\jf)®I). In ogni caso, è comodo usare il simbolo ® in connessione con gli spazi (di Hilbert) a cui appartengono questi prodotti. In questo modo, se l'V) appartiene a HP e I) appartiene a Hq, l'V)I) appartiene a HP®Hq. La dimensione di HP@H'I è il prodotto delle dimensioni dei suoi due fattori, così che potremmo legittimamente scrivere HP®Hq = HPq_ Io permetto che l'una o l'altra, o entrambe, di queste dimensioni sia 00 , nel qual caso riteniamo che anche il prodotto sia oo. Soltanto una parte molto piccola di HP@Hq consiste di elementi della forma l'V)I) (assumendo chep, q > 1), dove l'V) appartiene a HP e I) appartiene a Hq. Questi sono gli stati non entangled. Un elemento generico di HP®Hq sarebbe una combinazione lineare di questi stati non entangled (implicante probabilmente una somma infinita o un integrale, se sia p che q sono infiniti). 7 Dovremmo tenere a mente, tuttavia, che la nozione stessa di entanglement dipende dalla particolare suddivisione del nostro intero spazio di Hilbert Hpq in qualcosa della forma HP®Hq. (Nessuna suddivisione di questo genere di uno spazio generale di Hilbert Hpq deve essere preferita a qualunque altra. Dal punto di vista algebrico, vi sono sempre molti modi di esprimere H" come un prodotto tensoriale, ogni volta che n è un numero composto.) Nelle situazioni in cui si è interessati alla nozione di entanglement, la particolare suddivisione di interesse fisico è qualcosa di ragionevolmente ovvio, specialmente quando vi sono particelle «individuali» separate da una grande distanza, che è tutto quello che avviene nei fenomeni EPR. Qualche volta è utile impiegare una formulazione con indici astratti per operazioni come questa (vedi §12.8). Il vettore ket l'V) potrebbe essere scritto \j/1, con un indice astratto superiore, e il suo corrispondente (complesso coniugato) vettore bra ('VI come Ww con un indice astratto inferiore. La parentesi completa ('VI) sarebbe Wa
i1-> (dove ancora non mi preoccupo di normalizzare i miei stati)Y 3•2ll233l In letteratura si vede spesso la seguente formulazione: 11' L) i._i, R) - i._i, L) 11" R), in modo che nella notazione venga chiaramente indicato quale stato si riferisce alla particella di sinistra e quale alla particella di destra. A mio parere ciò non è necessario perché (i) la notazione, in ogni caso, individua soltanto la parte di spin della funzione d'onda e non la posizione o il momento della particella o qualsiasi altra cosa, così che la direzione dello spin fissa quello di cui ci stiamo preoccupando, e (ii) poiché i prodotti tensoiiali non commutano, possiamo dire senza nessuna ambiguità quale «Iato» del prodotto è l'uno e quale l'altro. Uso la convenzione in base alla quale il lato sinistro del prodotto si riferisce alla particella di sinistra e il lato destTO a quella di destra. I lettori che trovassero ambiguo questo modo di procedere, possono reinserire L e R nei ket per tutta la discussione. Questo è un chiaro esempio di stato entangled, poiché non può essere Iiscritto nella forma la) I /3) con la) localizzato in Le I~) localizzato in RP 34l Tentiamo di vedere quali sono le conseguenze di questo stato entangled. Adesso immagino di sedere a sinistra, in L, e di stare per effettuare una misurazione dello spin della particella di sinistra PL nella direzione «in su» 1' (sì se 1'; NO se .J, ). Questa misurazione proietterebbe lo stato I.a) in It ) i._i,) se ottengo la risposta sì e in(-) i.,1, )11') se ottengo NO. Lo stato risultante non sarebbe più entangled, tranne per il fatto che PL sarebbe probabilmente entangled senza speranza col mio apparato di misurazione L. Si può però affennare chiaramente che, se io ottengo la risposta sì, il mio collega situato al rivelatore di destra R riceverà una PR avente spin 1-.i, ), mentre se io ottengo NO, il mio collega riceverà una particella avente spin 11'). Quindi, se in seguito eseguirà anche lui una misurazione «in su» su PR, otterrà obbligatoriamente un risultato opposto al mio. [23.2] Se 11') e j,i,) sono normalizzati, quale fattore occorre per normalizzare jQ)? (Potete assumere che 11 la)IP) 11 = Ila 11 IIPII.) [23.3] Siete in grado di comprendere perché questo stato ha spin O? Suggerimento: un modo è quello di impiegare la notazione con indici per dimostrare che qualsiasi combinazione antisimmetrica di questo tipo deve essere sostanzialmente uno scalare, tenendo a mente che lo spazio di spin è 2-dimensionale. [23.4] Perché no? Trovate, tuttavia, un modo di farlo, se la) e IP) non sono così localizzati. 586
Il mondo quantistico entangled
Non vi è nulla di speciale in questa scelta su/giù; infatti, qualunque sia la direzione in cui scelgo di misurare, per esempio 1t, se il mio collega sceglie di misurare nella medesima direzione 1t, il suo risultato sarà opposto al mio. Ciò dovrebbe risultare evidente a motivo dell'invarianza rotazionale dello spin O, ma è istruttivo effettuare un calcolo algebrico diretto per verificare che (il ~imbolo «oc» significa «eguali, a meno di un fattore globale diverso da zero», vedi § 12.7)
I.a> oc l1t)l?1)- l?1)l1t), dove ?I denota la direzione opposta a 1t. (Prendete nota: se l1t) = al1') + bi+), allora I?1) oc El 1') - al+ ).)[23 •5l . Da tutto questo possiamo anche ricavare quali sarebbero le probabilità congiunte per ss, SN, NS, NN (abbreviando sì a se NO a N) se io e il mio collega scegliessimo direzioni diverse per misurare lo spin. Supponete che io scelga "" e il mio collega ?I, essendo 0 l'angolo tra "" e ?I. Allora, usando il valore dj probabilità dato in §22.9 (vedi fig. 22.11), troviamo che le probabilità congiunte possono essere date da accordo: _!_ (1 - cos 0), disaccordo: _!_ (1 + cos 0)
2
2
(dove «accordo» significa ss o NN e «disaccordo» significa SN o NS). Esaminiamo ora l'esempio di Stapp. Le cose sono disposte in modo che il mio apparato può essere orientato per misurare lo spin nella direzione 1', che è assunta come direzione verticale verso l'alto, o nella direzione ➔, che è una direzione orizzontale (perpendicolare a 1'). I; apparato del mio collega è orientato per misurare lo spin nella direzione ?1, che giace nel piano delle direzioni 1' e ➔, a 45° rispetto a ciascuna di esse, o nella direzione "", che giace nel medesimo piano, ma è a 45° 1ispetto a 1' e a 135° rispetto a ➔ (fig. 23.3). Vi sono tre casi in cui la 1p.ia direzione di misurazione forma un angolo di 45° rispetto a quella del mio collega, e solo uno in cui l'angolo è 135°. Nei primi tre casi otteniamo una probabilità di accordo che è di poco inferiore al 15%, mentre nel caso di angolo di 135° otteniamo appena un po' più di 85%. Supponiamo che finché le particelle non sono in volo io non possa scegliere quale delle due misurazioni fare, e che la stessa cosa valga anche per il mio collega. Va bene, mettiamo il mio collega su Titano (una delle lune di Saturno) e la sorgente delle particelle in qualche luogo tra noi due, in modo che persino alla velocità della luce avremmo quasi tre quarti d'ora per prendere una decisione! Vedi fig. 23.4. Le particelle non hanno alcun modo di «sapere» come io e il mio collega (indipendentemente) stiamo per orientare i nostri strumenti di misura. [23.5] Confermate questo commento tra parentesi e date una verifica diretta, col calcolo, dell'espressione precedente per lf.l). Suggerimento: guardate l'esercizio [22.26].
587
LA STRADA CHE PORTA ALLA REALTÀ
Mia disposizione alternativa
Disposizione alternativa del collega
Fig. 23.3 - Le disposizioni delle polarizzazioni per la versione di Stapp dell 'EPR di Bohm; un esempio di disuguaglianze di Bel!. All'inizio, supponiamo che le misurazioni di spin, in entrambi i lati, siano nelle direzioni date dalle frecce con asta piena, ma per un cambiamento di idea l'una o l'altra o entrambe potrebbero essere ruotate nella direzione delle frecce con asta spezzettata. Le probabilità congiunte quantistiche non possono essere modellate da nessuno schema, di tipo classico, con coppie di particelle che si comportano come enti indipendenti, non comunicanti, senza nessuna preconoscenza delle direzioni delle proposte misurazioni di spin.
Supponiamo che io abbia scelto 1' e il mio collega 71 quando ciascuno di noi riceve un flusso di particelle apparentemente orientate a caso. Ciascuna delle particelle che ricevo, una alla volta, fa parte di una coppia EPR-Bohm, inviata dalla sorgente a metà strada, e il mio collega, volta per volta, riceve l'altra particella della coppia. Quando confrontiamo le nostre registrazioni (forse alcuni anni più tardi, al ritorno del mio collega) scopriamo che fra i nostri risultati vi è un accordo di poco inferiore al 15%, in sintonia con quanto detto in precedenza. Ora, se le particelle non avessero alcuna preconoscenza di come orienteremo i nostri apparati di misura e si comportassero come entità ( di tipo classico) distinte non comunicanti, il fatto che io abbia improvvisamente cambiato la mia decisione all'ultimo minuto e abbia misurato invece la direzione ➔ non dovrebbe assolutamente alterare i risultati ottenuti dal mio collega. Se io avessi fatto così, allora - poiché l'angolo tra le nostre due direzioni è ancora 45° - vi sarebbe di nuovo soltanto un accordo di circa il 15% tra
Titano Terra
~
----
- - - -i.-- -- - .. ~ EPR sorgente
Fig. 23.4 - I.:autore, situato sulla Terra, immagina di essere colui che riceve una delle particelle di una successione di coppie di particelle EPR, mentre l'altro ricevitore è un collega su Titano, essendo la sorgente delle coppie circa a metà distanza tra i due. Persino per particelle viaggianti alla velocità della luce, vi sarebbero circa 45 minuti per decidere le orientazioni dei rivelatori. 588
J/ mondo quantistico entangled
le misurazioni che otterrei ora e quelle originarie del mio collega. D'altra parte, supponiamo invece che il mio collega abbia avuto un ripensamento all'ultimo minuto e abbia misurato" invece di ?I, ma che io non abbia mutato la mia decisione. Il cambiamento deciso dal mio collega non dovrebbe, allo stesso modo, aver intaccato le mie originarie misurazioni 1'. Scopriremmo ancora che le nuove misurazioni del mio collega dovrebbero essere in accordo con le mie originarie misurazioni 1' soltanto per circa il 15%. Ma supponiamo che tutti e due avessimo deciso di cambiare orientazione al1'ultimo minuto, in modo che le mie misurazioni sarebbero ➔ e quelle del mio collega"· Ora siamo passati a un angolo di 135° tra di esse, e quindi in base alle previsioni della meccanica quantistica l'accordo dovrebbe essere più dell'85%. Questo è coerente con il fatto che le coppie di particelle forniscano le corrette probabilità congiunte per ciascuna delle possibili orientazioni dei rivelatori appena esaminate? Vediamo un po'. Le coppie di particelle devono essere preparate per incontrare una qualsiasi delle quattro possibili combinazioni di sistemazione dei rivelatoti, e per dare le corrette probabilità quantistiche in ciascun caso. Ricordiamo quali sono. Ci si attende che i risultati della mia alterata sistemazione del!' apparato ( ➔) non abbiano più del 15% di accordo con l'originaria sistemazione 11 del mio collega. Questa, a sua volta, non dovrebbe avere più del 15% di accordo con la mia 01iginaria sistemazione 1', e questa non dovrebbe avere più del 15% di accordo con l'alterata sistemazione" del mio collega. Se una particolare coppia di particelle darà accordo nel caso ➔, r::, non può essere in disaccordo in tutti e tre i casi ➔, 11 e 1', 11 e 1', re;.. (Tre disaccordi devono dare disaccordo, non accordo.) Così, in almeno una di queste tre possibili coppie di sistemazioni, vi deve essere accordo. Ma questo avviene in meno del 15% dei casi, per ciascuna possibile coppia di sistemazioni. Vi sono solo h·e di queste coppie, il che non pem1ette più di 15% + 15% + 15% = 45% di accordo quando ci spostiamo al caso ➔,"· (In effetti, la percentuale di accordo risulta minore di questa, perché ho realmente contato per h·e volte il caso di accordo per tutte e tre le coppie di sistemazioni.) Ma il 45% non è assolutamente vicino all'85%, così abbiamo una manifesta contraddizione con le nostre assunzioni «di tipo classico» per le coppie di particelle! Alcuni potrebbero preoccuparsi per il fatto che questo ragionamento sembra essere stato formulato in termini di ipotetiche misurazioni che «avrebbero potuto essere fatte ma clie non sono state fatte» (i «controfattuali» del filosofo). Ma questo non è importante. La questione fondamentale è che è stato assunto che le particelle si comportino in modo indipendente l'una dall'altra, dopo che hanno lasciato la sorgente, e che diano le corrette probabilità congiunte quantistiche qualunque sia la combinazione di sistemazioni dei rivelatori con cui avranno a che fare. Il punto è che le particelle devono imitare le previsioni della meccanica quantistica. Abbiamo trovato che queste non possono essere divise in previsioni separate per le due particelle in modo individuale. Il solo modo con cui potrebbero coerentemente fornire le 589
LA STRADA CHE PORTA ALLA REALTÀ
corrette risposte quantistiche è che siano, in qualche modo, «connesse» l 'una con l'altra, fino a che una delle due venga effettivamente misurata. Questa misteriosa «connessione» tra di loro è l'entanglement quantistico. Naturalmente nessun esperimento di questa natura è stato effettuato su simili distanze; ma molti esperimenti di tipo EPR di natura sostanzialmente simile sono stati effettivamente eseguiti (impiegando di solito la polarizzazione dei fotoni, non le direzioni di spin di particelle di spin½, ma questa differenza non è importante). Le previsioni della meccanica quantistica (invece di quelle del buon senso) sono state coerentemente confermate! Anche se entanglement quantistici diretti di questa natura non sono ancora stati certamente osservati su distanze come quella tra la Terra e Saturno, alcuni recenti esperimenti hanno confermato violazioni della disuguaglianza di Bell su distanze di più di 15 chilometri. 8
23.5 L'esempio EPR di Hardy: quasi senza probabilità Consideriamo adesso il bellissimo esempio di Lucien Hardy. 9 Il mio collega e io siamo di nuovo pronti a fare misurazioni di spin, in cui io scelgo tra misurazioni 1' e ➔ (la direzione della verticale verso l'alto e quella dell'orizzontale verso destra), come prima, ma ora il mio collega sceglie anche lui tra 1' e ➔, indipendentemente dalla mia scelta. La nuova caratteristica cruciale è che la sorgente di coppie di particelle adesso non le emette in uno stato combinato di spin O, ma in un particolare stato di spin I. Assumo che questo stato iniziale sia quello con la descrizione di Majorana lf--") (§22.10, fig. 22.14), in cui la direzione di -" giace nel quarto di piano determinato dalle direzioni perpendicolari 1' e ➔ e ha un'inclinazione verso l'alto di 4/3 (così l'angolo 0tra ➔ e -" soddisfa cos0= 3/5 ), e dove f- è opposto a ➔; vedi fig. 23 .5 Possiamo esprimere questo stato come[23 ·6l //· ::.. ( l"
lf--") = lf-)I-"> + l-")if-),
=- di sarebbe una funzione d'onda di un tipo diverso da quello di \jf, anche se sia èf> sia \jJ sono, adesso, di frequenza positiva. La grandezza èf> fornirebbe una funzione d'onda per uno stato di una antiparticella. Il corrispondente operatore di creazione per l'antiparticella in quello stato sarebbe ~' mentre quello di distruzione sarebbe ~*. Cerchiamo di stabilire un contatto con l'originario «mare» di Dirac (descritto in §24.8) pensando che il «misterioso» stato all'estrema destra di tutti gli operatori sia, nel caso di Dirac, uno stato diverso dal solito stato di vuoto IO), che ricordiamo deve essere ritenuto del tutto privo di particelle e antiparticelle. Assumiamo, invece, che questo nuovo stato di «vuoto» sia lo stesso «mare» di Dirac, denotato da l.r), che deve essere completamente pieno in tutti gli stati elettronici di energia negativa, ma senza niente altro. Prendiamo ora in considerazione la situazione di un singolo positrone che, nella rappresentazione originaria di Dirac, è descritto da un singolo «buco» negli stati d'energia negativa dell'elettrone; tutti gli altri stati d'energia negativa devono essere riempiti a eccezione di questo particolare stato . Ciò è realizzato con l'applicazione dell'operatore di creazione~ a IO), dando lo stato finale ~IO). Questo stato non sembra essere uguale allo stato ~*l.r), che avevamo con la descrizione di «mare di Dirac», ma in un certo senso gli stati ~IO) e *II) sono fondamentalmente equivalenti. Ambedue gli operatori ~ e * implicano l'introduzione della medesima quantità algebrica nello stato totale, vale a dire quel particolare vettore definito da èf> nello spazio di Hilbert delle funzioni d'onda di una particella. La differenza tra gli operatori ~e * sta sol[26.6] Spiegate perché possiamo rimuovere uno specifico stato in questo modo, nonostante le mie precedenti puntualizzazioni circa quello che un operatore di distruzione fa effettivamente. Suggerimento: guardate l'esercizio [26.2}. 663
LA STRADA CHE PORTA ALLA REALTÀ
tanto nel modo algebrico[26 •7l con cui si reputa che questo vettore dello spazio di Hilbert agisca sullo stato totale. Poiché possiamo sempre impiegare le leggi di anticommutazione per portare ci> e * all'estrema destra, si può giudicare che il modo con cui - t). Purché l'hamiltoniana sia ordinaria, cioè si trasformi in se stessa sotto l'azione di T, vediamo che anche l'evoluzione di Schrodinger va in se stessa, finché l'inversione temporale, t I-,> - t, è accompagnata dal cambiamento di segno dell'unità immaginaria, i I-,> - i. In effetti, questo è proprio il modo con cui pensiamo all'azione di T in meccanica quantistica. (Possiamo far osservare che una funzione f(t) di frequenza positiva è ritrasformata in una funzione di frequenza positiva sotto l'azione congiunta delle sostituzioni t I-,> - te i I-,> - i, così che, sotto questo aspetto, tutto va bene.)(27 •11Tutta[27.1] Perché? Spiegate anche perché la quantità di moto è trattata in modo coerente da questa sostituzione.
687
LA STRADA CHE PORTA ALLA REALTÀ
via, il comportamento della riduzione R dello stato quantico sotto l'azione di Tè un'altra faccenda, e ci fornirà un importante problema per le nostre discussioni nel capitolo 30 (§30.3).
27.2 Ingredienti submicroscopici Vi sono, tuttavia, altri problemi che potrebbero preoccupare il lettore smaliziato, persino nel caso della sola dinamica classica. La simmetria rispetto all'inversione temporale è certamente vera per la dinamica submicroscopica di singole particelle e dei campi loro associati, in meccanica classica. Ma, in pratica, si conosce poco il comportamento degli ingredienti individuali di un sistema. Normalmente, si stima che una conoscenza dettagliata della posizione e dell'impulso di ogni particella sia non ottenibile e non necessaria, poiché il comportamento globale del sistema è già abbastanza ben descritto in termini di alcune medie appropriate dei parametri fisici delle singole particelle. In altre parole, come la distribuzione della massa, della quantità di moto e dell'energia, la posizione e la velocità del centro di massa, la temperatura e la pressione in vari punti, le proprietà elastiche, i momenti d'inerzia, la forma globale e la sua orientazione nello spazio, eccetera. Un problema importante è perciò sapere se è o non è sufficiente avere una buona conoscenza iniziale di simili parametri medi «globali», per determinare, in pratica, il comportamento dinamico del sistema con un adeguato grado di accuratezza. Questo non è certamente sempre il caso. Alcuni sistemi, noti come caotici, hanno la proprietà per cui il loro comportamento finale dipende, in modo critico, dalla specificazione dettagliata e precisa dello stato iniziale. Un esempio è offerto da un «giocattolo da dirigente» in cui un pendolo magnetico oscilla appena sopra una collezione di magneti disposti sulla base. Vedi fig. 27 .1. Il comportamento dinamico è abbastanza ben governato, in modo deterministico, dalle leggi di Newton e da quelle della magnetostatica, assieme al rallentamento dovuto alla resistenza dell'aria; tuttavia, la posizione finale di riposo del pendolo dipende in modo così critico dallo stato iniziale da essere realmente imprevedibile, anche se una conoscenza veramente det-
Fig. 27.1- Il moto caotico. Un «giocattolo da dirigente» consistente in un pendolo magnetico oscillante su una collezione di magneti fissi. Il cammino reale preso dal pendolo dipende, in modo estremamente sensibile, dalla sua posizione iniziale e dalla sua velocità. 688
Il Big Bang e il suo retaggio termodinamico
tagliata di questo stato iniziale, con tutte le particelle e i campi costituenti, fisserebbe certamente, in modo unico, questa evoluzione. t Sono noti anche molti altri esempi di «sistemi caotici», tanto è vero che buona parte delle stravaganze delle previsioni meteorologiche sono comunemente attribuite alla natura caotica dei sistemi dinamici implicati. Persino il moto gravitazionale newtoniano, molto ordinato (e molto prevedibile), dei corpi del sistema solare costituisce (probabilmente), dal punto di vista tecnico, un sistema caotico, anche se le scale temporali, rilevanti per un simile «caos», sarebbero di gran lunga maggiori di quelle dell'osservazione astronomica. Cosa dire riguardo all'evoluzione nel passato, invece che nel futuro? Questa «imprevedibilità caotica» è normalmente molto peggiore per la «retrovisione», che è implicata nell'evoluzione nel passato, che per la «previsione» della normale evoluzione nel futuro. Questo ha a che fare con la seconda legge della termodinamica, che nella sua forma più semplice fondamentalmente affenna: 2 Il calore passa da un corpo più caldo a un corpo più freddo. Secondo questa legge, se colleghiamo un corpo caldo e uno freddo impiegando un materiale conduttore del calore, il corpo caldo si raffredderà e quello freddo si riscalderà, finché non arriveranno ad avere la stessa temperatura. Questo è ciò che ci dice la previsione, e questa evoluzione è di carattere deterministico. D'altra parte, se osserviamo questo processo nella direzione temporale opposta, troviamo che i due corpi alla stessa temperatura si evolvono spontaneamente in corpi di diversa temperatura, e sarebbe quindi praticamente impossibile decidere quale corpo diventi più caldo e quale più freddo, di quanto e quando. Questa procedura di retrovisione dinamica, per questo sistema, è chiaramente una prospettiva senza speranza. In effetti, questa difficoltà si applicherebbe alla retrovisione di quasi tutti i sistemi macroscopici, con un gran numero di particelle, che si comportano in base alla.seconda legge. Per questo motivo, la fisica si occupa normalmente di previsioni, invece che di retrovisioni. 3 Come ulteriore aspetto di ciò, si ritiene che la seconda legge sia un ingrediente essenziale per il potere predittivo della fisica, poiché elimina quei problemi che abbiamo appena incontrato con la retrovisione. Nonostante ciò, molti fisici sosterrebbero che questa legge non è «fondamentale» nello stesso senso in cui sono fondamentali, per esempio, la legge di conservazione dell'energia, il principio di sovrapposizione lineare in meccanica quantistica e forse il modello standard della fisica delle particelle. Essi argomenterebbero che la seconda legge è un ingrediente necessario, in modo quasi «ovvio», per qualunque teoria fisica ragionevole. Molti sarebbero dell'opinione che essa è un qualcosa di vago e impreciso, che non possiamo assolutamente paragonare alla straordinaria precisione che troviamo nelle leggi dinamiche che controllano la fisica fondamentale. Io desidero argomentare in modo molto diverso e dimostrare la quasi «stupefacente» pre689
LA STRADA CHE PORTA ALLA REALTÀ
cisione che si cela dietro quell 'apparentemente vago principio statistico che di solito chiamiamo semplicemente «seconda legge».
27.3 :Uentropia Esaminiamo, con più esattezza, ciò che la seconda legge effettivamente afferma. Prima di iniziare, dovrei mettere il lettore al corrente della prima legge della termodinamica; questa prima legge afferma semplicemente che, in qualunque sistema isolato, l'energia totale viene conservata. Il lettore potrebbe però protestare per il fatto che questo concetto non è nuovo ( § I 8. 6, §20.4, §21 .4), ma quando questa legge fu formulata (inizialmente da Sadi Carnot negli anni Venti del diciannovesimo secolo, anche se non fu da lui pubblicata)4 non era ancora chiaro che il calore è semplicemente una forma d'energia - e neppure l'ordinario concetto macroscopico di energia era completamente chiaro. La prima legge rende esplicito il fatto che l'energia totale non viene persa quando, per esempio, un corpo perde la sua energia cinetica (§18.6) rallentando a causa della resistenza dell'aria. Infatti, questa energia viene semplicemente presa per riscaldare l'aria e quel corpo. Questa energia termica è (principalmente) l'energia cinetica delle molecole dell'aria e delle vibrazioni delle particelle che compongono quel corpo. La temperatura, inoltre, è semplicemente una misura dell'energia per grado di libertà, così che i concetti termodinamici di calore e temperatura sono fondamentalmente eguali a precedenti nozioni dinamiche, applicate però a livello dei singoli costituenti dei materiali e trattate in modo statistico. La prima legge possiede quel genere di precisione che ci è familiare: il valore di qualcosa, e precisamente l'energia totale, rimane esattamente costante sebbene possano avvenire i tipi di processo più complicati. L'energia totale dopo il processo è uguale all'energia totale prima del processo. Mentre la prima legge è un'uguaglianza, la seconda legge è una diseguaglianza; ci dice che un'altra grandezza, nota come entropia, ha, dopo un certo processo, un valore più grande (o, almeno, non più piccolo) di quello che aveva prima. L'entropia è, grosso modo, una misura della «randomness» (casualità) del sistema. Il nostro corpo, in movimento nell'aria, parte con un'energia in forma organizzata (l'energia cinetica del suo moto), ma, quando rallenta per la resistenza dell'aria, questa energia viene distribuita nei movimenti casuali delle particelle dell'aria e delle singole particelle del corpo. La «casualità è aumentata»; in termini più specifici, l'entropia è aumentata. La nozione di entropia fu introdotta da Clausius nel 1865, ma fu poi l'eminente fisico austriaco Ludwig Boltzmann, nel 1877, a renderne (per quanto possibile) chiaro il significato. Per comprendere l'idea di Boltzmann (per un sistema classico), abbiamo bisogno della nozione di spazio delle fasi (§ 12.1, §§ 14.1, 8, §§20.1, 2, 4) che, ricordiamolo, per un sistema classico di 690
li Big Bang e il suo retaggio termodinamico
Macroscopicamente iistinguibili
-~-----1 Spazio delle fasi 'P, coarse graining
Fig. 27.2 - I..:entropia di Boltzmann. Questa implica la divisione dello spazio delle fasi P in parti («cellette») - un «coarse graining» di P dove i punti di una data celletta rappresentano stati fisici che sono macroscopicamente indistinguibili. La definizione di Boltzmann dell'entropia di uno stato x, in una celletta ,V di volume V, è S = k log V, dove le è la costante di Boltzmann.
n particelle ( senza caratteristiche), è uno spazio 'il' di 6n dimensioni, ciascun punto del quale rappresenta posizioni e momenti di tutte le n particelle. Per rendere precisa la nozione di entropia, abbiamo bisogno di avere un'idea della cosiddetta riduzione a grana grossa (coarse graining). 5 Possiamo pensare che questa sia una suddivisione dello spazio delle fasi 'il' in un certo numero di parti che chiamerò «cellette». Vedi fig. 27.2. L'idea è che le collezioni di punti di 'il', che rappresentano stati del sistema tra loro indistinguibili dal punto di vista macroscopico, siano raggruppate nella medesima celletta, mentre si ritiene che i punti di 'il' appartenenti a cellette differenti siano macroscopicamente distinguibili. I.; entropia S di Boltzmann, per lo stato del sistema rappresentato da qualche punto x di 'il', è
S= klog V, dove V è il volume della celletta 1/ che contiene x (il logaritmo è il logaritmo naturale; vedi §5.3) e k è la costante di Boltzmann, 6 che ha il valore
k = 1.38 x 10- 23 J K- 1 ( dove J significa joule e K- 1 significa «per grado kelvin»). Ho detto che la definizione di Boltzmann rende «chiara» la nozione di entropia. Ma, affinché la formula precedente rappresenti qualcosa di fisicamente preciso, occorrerebbe avere una prescrizione esatta per la riduzione a grana grossa che la nostra famiglia di «cellette» dovrebbe rappresentare. Vi è indubbiamente qualcosa di arbitrario nella particolare suddivisione in cellette che potrebbe essere scelta. Sembra che questa definizione dipenda dalla vicinanza con cui scegliamo di esaminare un sistema. Due stati che sono «macroscopicamente indistinguibili» per un osservatore potrebbero essere distinguibili per un altro. Inoltre, anche la scelta dell'esatto posizionamento della frontiera tra due cellette è molto arbitraria, poiché a due punti di 'il' vicini, ma posizionati in lati opposti della frontiera, potrebbe essere assegnata un'entropia abbastanza diversa, nonostante siano virtualmente identici. Questa definizione di S è ancora 691
LA STRADA CI-JE PORTA ALLA REALTÀ
molto soggettiva, sebbene sia un netto progresso rispetto a precedenti definizioni di applicabilità più limitata e un indubbio miglioramento rispetto all'idea che sia soltanto una misura della «casualità» di un sistema. Personalmente ritengo, a proposito della posizione fisica dell'entropia, che non sia un concetto «assoluto» nell'attuale teoria fisica, anche se è certamente una nozione molto utile. Vi è però la possibilità che possa acquisire una posizione più fondamentale in futuro. Per questo scopo, occorrerebbe certamente prendere in considerazione la fisica quantistica - e, in ogni caso, è la meccanica quantistica a offrire una misura assoluta per qualsiasi particolare volume 11 contenuto in P, dove possono essere scelte unità (come le unità di Planck, vedi §27.10) tali che li= 1)27 •21 Sia come sia, è notevole quanto sia piccolo l'effetto che l'arbitrarietà della riduzione a grana grossa ha nei calcoli termodinamici. Sembra che il motivo stia nel fatto che la maggior parte delle considerazioni d'interesse riguardano rapporti tra volume totale e volume delle cellette (nello spazio delle fasi) talmente grandi che il tracciamento della frontiera tra cellette ha ben poca importanza, purché la riduzione a grana grossa rifletta «ragionevolmente» l'idea intuitiva di quando i sistemi devono essere considerati macroscopicamente distinguibili. Per ottenere un significativo cambiamento in S, poiché questa è definita come il logaritmo del volume della celletta, occorrerebbe davvero un grande cambiamento nel tracciamento della frontieraJ27- 3l A mio parere, nell'odierna teoria fisica, l'entropia ha lo status di «cosa utile», invece che di «cosa fondamentale» - sebbene vi siano indicazioni per cui, in un contesto più profondo che evidenzi l'importanza di considerazioni quantistico-relativistiche (specialmente in relazione all'entropia dei buchi neri), vi possa essere una posizione più fondamentale per questo genere di nozione. Affronteremo tale questione più avanti in questo capitolo (§27.10) e in §§30.4-8, §31.15 e §32.6.
27.4 La forza del concetto d'entropia Un semplice esempio può rendere più chiaro il ruolo della formula di Boltzmann per l'entropia. Consideriamo un contenitore chiuso in cui un decimo di tutto il suo volume è una regione, delimitata come speciale, per esempio una regione ~ a forma di lampadina chiusa da un lato, che comunica con il resto del contenitore attraverso una piccola apertura, vedi fig. 27.3. Supponiamo che in questo contenitore vi sia un gas costituito da m molecole; ci chiediamo quale sia il valore da assegnare ali' entropia Snella situazione in [27.2) Mostrate come assegnare una misura assoluta a un volume dello spazio delJe fasi, se le unità sono scelte in modo che ti = 1. [27.3) Come si collega il logaritmo nella formula di Boltzmann alle «enormi» discrepanze nei volumi delle cellette? 692
11 Big Bang e il suo retaggio termodinamico
Fig. 27.3 - Un contenitore chiuso, parte del quale è una regione Ra forma di lampadina il cui volume è I/ lO di quello de Il'intero contenitore. Di quanto cresce l'entropia quando un gas, inizialmente tutto contenuto in R, può fluire nell'intero volume?
cui tutto il gas si trovi nella regione -;;?, in confronto a quello che deve essere assegnato quando il gas è distribuito a caso in tutto il contenitore. In accordo con la fonnula di Boltzmaru1, avremo S= klog'P;.?, dove V;.?è il volume della regione 11;.? dello spazio delle fasi in cui tutte le molecole sono in 'R. Per semplicità, supponiamo che tutte le molecole del gas siano distinguibili l'una dall'altra (almeno in linea di principio): questo è il caso della cosiddetta statistica di Boltzmann, diversa dalla «statistica di Bose-Einstein» dei bosoni e dalla «statistica di Fermi-Dirac» dei fermioni, descritte in §23. 7. Supponiamo cioè che tutte le molecole del gas siano distinguibili tra loro (almeno in linea di principio).l27AJ Assumendo che il gas sia comune aria a pressione atmosferica, nel caso che il volume totale del contenitore sia un litro, abbiamo che il valore di m è circa 1022 . Il rapporto tra il volume V;.? della regione 11;.? dello spazio delle fa1 27 5 si e il volume di tutto lo spazio delle fasi P è 10-111 ( = -1om· - ) , l - l che è
1o- l 0000000000000000000000, e così abbiamo un esempio della «grandezza» dei rapporti di volume che compaiono in considerazioni di questo genere. La cifra rappresenta la probabilità, ridicolmente minuscola, di trovare - solo per puro caso - che tutte le molecole del gas sono proprio in 1/;. L'entropia di quella situazione altamente improbabile è molto più piccola dell'entropia della situazione dove il gas è distribuito in tutto il volume, poiché la differenza è circa
_ k Iog(l o- 10000000000000000000000) = 2 _3 x 1022 k = =0.32 J K- 1 secondo la formula di Boltzmann,l27• 6l dove ho sfruttato il fatto che il logaritmo naturale di 10 è circa 2.3. In questo modo, se supponiamo che il gas
[27.4] Spiegate come differirebbe il conteggio in questi tre casi. [27.5] Perché? [27.6] Spiegate il motivo per cui questo risultato non è significativamente alterato se introduciamo considerazioni di fermioni/bosoni e teniamo conto della probabile diminuzione di impulso delle molecole del gas quando non sono più vincolate a stare in R.
693
LA STRADA CHE PORTA ALLA REALTÌ\
sia inizialmente contenuto in R, per esempio per mezzo di una valvola che lo separa dal resto del contenitore, quando apriamo la valvola e lasciamo che il gas diffonda in tutto il contenitore, abbiamo un apprezzabile aumento del1' entropia, di circa 2.3 x 10 22 k, che in unità ordinarie è soltanto circa un terzo di un joule per grado Kelvin. Il lettore potrebbe protestare per il fatto di avere un contenitore in cui assolutamente nessuna molecola di gas si trovi inizialmente nella parte non speciale di esso; perciò, indeboliamo w1 po' la nostra definizione della regione "PR, in modo che R debba contenere almeno il 99.9% delle molecole di gas. Adesso, quindi, non più di un millesimo delle molecole si trova fuori di R; un vuoto di questo genere neila regione non speciale rientra nelle possibilità della tecnologia attuale. Il risultato non viene quasi alterato, poiché l'incremento d'entropia, all'apertura della valvola, è ancora dell'ordine di 2.3 xl 0 22 kY 77 l Questa è una straordinaria illustrazione del fatto che, anche se c'è soggettività nella scelta delle cellette (per esempio, "PR), ciò non causa nessun serio problema finché le cellette vengono scelte «in modo ragionevole». Il logaritmo nella formula di Boltzmann ha un altro importante scopo, oltre a quello di rendere maneggevoli quei grandissimi numeri: far sì che la risultante definizione di entropia, per sistemi indipendenti, sia additiva. In questo modo, se le entropie assegnate a due sistemi indipendenti sono S 1 e S2 , l'entropia assegnata al sistema totale, formato da questi due sistemi presi assieme, sarà S 1 + S2 • Sto assumendo che lo spazio delle fasi sia "P = ;z:>1 x "P2 , dove ;z:>1 e 'A sono gli spazi delle fasi per i due sistemi, e che le cellette del sistema totale siano il prodotto delle cellette di "P 1 e "P2 , poiché questa è un'assunzione molto naturaler27 -3J per sistemi indipendenti S 1 e S2 • (Vedi §15 .2, esercizio [ 15 .1] e fig. 15 .3a per la definizione di x applicato a spazi.). Dato che i volumi delle cellette sono moltiplicati, le corrispondenti entropie sono sommate (per la proprietà standard del logaritmo; vedi §5.2). In normali esempi di sistemi fisici - e certamente nel caso molto studiato di un gas ordinario in un contenitore ordinario - vi è una particolare celletta E della riduzione a grana grossa il cui volume E supera di gran lunga il volume di qualunque altra celletta; essa rappresenta lo stato di equilibrio termico. In effetti, di norma E sarà praticamente uguale al volume P di tutto lo spazio delle fasi, superando quindi, con facilità, la somma dei volumi di tutte le altre cellette. Vedi fig. 27.4. Per un gas ordinario, che riteniamo costituito da palline sferiche, tutte eguali, in equilibrio termico, la distribuzione delle velocità assume una forma particolare, nota come distribuzione di Maxwell (scoperta da quello stesso James Clark Maxwell che abbiamo già incontrato, in relazione all'elettromagnetismo). Essa ha la forma [27. 7] Provate a capire il motivo, facendo varie rozze stime per le grandezze implicate. (Se lo desiderate, impiegate la formula di Stirling, n!,,,(nle)"(2nnt 112 .) In effetti, l'incremento d'entropia è un po' diminuito, da 2.3 x 10 22 k a 2.29 x 1022 k, approssimativamente. [27.8] Perché è naturale questa assunzione per la grana grossa? 694
Il Big Bang e il suo retaggio termodinamico
Fig. 27.4 - La particolare celletta E, che rappresenta l'equilibrio termico, ha un volume E che di norma è praticamente uguale al volume P del!' intero spazio delle fasi 'il', superando perciò di gran lunga i volumi di tutte le altre cellette riunite.
Equilibrio termico
(che i bene informati riconosceranno come una distribuzione gaussiana, chiamata anche «curva a campana») dove v è il modulo della 3-velocità della particella di gas in questione, /3 è una costante collegata alla temperatura e A è una costante tale che l'integrale della probabilità su tutto lo spazio delle possibili velocità sia 1; vedi fig. 27 .5. L'equilibrio termico, poiché ha la più grande entropia possibile per il sistema, è lo stato in cui ci si aspetterebbe che il sistema si fissi se lasciato libero per un tempo sufficientemente lungo, in accordo con la seconda legge. La distribuzione dì Maxwell, appena descritta, è valida per un gas costituito da particelle classiche identiche, senza alcun grado interno di libertà. Le cose possono diventare notevolmente più complicate quando vi sono molti tipi di costituenti di differenti dimensioni e vari gradi interni di libertà ( come lo spin o oscillazioni tra le sue parti costituenti). Per questi sistemi in equilibrio termico, vi è un principio generale, noto come equipartizione del/'energia, secondo il quale l'energia del sistema è egualmente distribuita (con una dispersione statistica) tra tutti i gradi di libertà del sistema.
V
Fig. 27.5 - La distribuzione maxwelliana delle velocità, per un gas in equilibrio, ha la forma A e- /N dove A e /3 sono costanti, con /J collegato alla temperatura del gas, e v è la velocità della particella. La parte punteggiata della curva la estende a valori negativi div, rivelando la familiare «curva a campana» della distribuzione gaussiana della statistica. 695
LA STRADA CHE PORTA ALLA REALTÀ
Un altro modo con cui può essere generalizzata la distribuzione di Maxwell è quello di spostarci dall'esatto equilibrio tennico e chiederci come sarà il comportamento del gas nel suo approccio all'equilibrio (in base alla seconda legge); in queste circostanze, il comportamento del gas è descritto da un'equazione nota come equazione di Boltzmann. Il lettore percepirà che qui interviene una vasta materia, di notevole rilevanza per la comprensione teorica del comportamento dei corpi macroscopici classici, quando a causa del numero troppo elevato di particelle costituenti non è possibile seguire il loro comportamento individuale. Questa materia è la meccanica statistica.
27.5 Derivazione della seconda legge - o no? Cerchiamo ora di capire cosa c'è dietro la seconda legge. Immaginiamo di avere un sistema fisico rappresentato da un punto x in uno spazio delle fasi 'P, convenientemente ridotto a grana grossa. Supponiamo (fig. 27.6a) che x parta ORA da una piccola celletta 11 di volume V. Il punto x si muoverà poi per 'P in qualche modo, secondo le equazioni dinamiche appropriate alla situazione fisica in considerazione. Tenendo a mente l'enorme differenza di
Equihbrio termico
t
(a)
,,
Fig. 27.6 - La seconda legge in azione. L'evoluzione di un sistema fisico è rappresentata da una curva nello spazio delle fasi. (a) Se sappiamo che all'istante ORA il nostro sistema è rappresentato da un punto x in una celletta 1/ di volume V molto piccolo e tentiamo di prevedere il suo probabile comportamento futuro, concludiamo, a causa della grandissima differenza nei volumi delle cellette, che, in assenza di qualsiasi grande bias nel suo moto, quasi certamente entrerà in cellette sempre più grandi, in accordo con la seconda legge. (b) Supponiamo però di applicare questo ragionamento al passato, chiedendo il modo più probabile con cui la curva ha trovato dapprima la sua collocazione in 1/. Il medesimo ragionamento sembra portare alla conclusione apparentemente assurda che il modo più probabile con cui x si sarebbe trovato in 1/ sarebbe stato di passare in cellette sempre più grandi, retrocedendo nel passato, in stridente contraddizione con la seconda legge.
696
Il Big Bang e il suo retaggio termodinamico
volume delle diverse cellette e prevedendo che non vi sia alcun particolare «bias» (deviazione) riguardo al moto di x in relazione alle posizioni delle cellette, ci aspettiamo che nella stragrande maggioranza dei casi x vagherà in cellette di volume sempre più grande. In altre parole, l'entropia del sistema, col passare del tempo, diventerà sempre più grande. Una volta che x è entrato in una celletta con un certo valore dell'entropia, diventa estremamente improbabile che, in un qualunque ragionevole periodo di tempo, possa ritornare in una celletta con un valore dell'entropia significativamente più piccolo di quello della celletta in cui era prima; questo implicherebbe di trovare un volume assurdamente più piccolo, cosa estremamente improbabile. Pensate all'esempio che abbiamo appena preso in considerazione e all' enorme riduzione di volume dello spazio delle fasi che accompagnerebbe unariduzione molto modesta di entropia, a causa del logaritmo nella formula di Boltzmann e della piccolezza della costante di Boltzmann. Una volta che il gas è uscito da ? O) che rappresenta ORA, il punto x su è costretto a essere in qualche regione V, di dimensione ragionevole, ma non particolarmente grande ( che rappresenta un universo con il valore dell'entropia che ci capita di osservare adesso), ma dove la curva è scelta a caso. Questo corrisponde a un universo la cui entropia aumenta nel futuro a partire da ORA, ma cresce anche nel passato da ORA - violando la seconda legge! Quella che troviamo effettivamente, per un universo con la nostra familiare seconda legge, è qualcosa come la rappresentazione in fig. 27.8b, d dove ç ha una estremità - l'estremità del passato (per esempio, t = O) - in un volume -e, immensamente piccolo, di 'Pu (che ha quindi un'entropia enormemente piccola), ma che poi si agita come vuole (secondo le leggi dinamiche), trovando volumi sempre immensamente più grandi al crescere di t, e dove per il particolare istante t0 , rappresentante ORA, ci capita di tro-
ç
e;
ç
702
Il Big Bang e il suo retaggio termodinamico
t=O
~
(a)
~
Fig. 27.8 - Differenti possibili evoluzioni dell'universo, descritte da una curva
ç
parametrizzata nello spazio delle fasi 'iDu di possibili stati dell'universo (per esempio, di massa globale fissa o di qualsiasi altra grandezza conservata). (a) Se la curva è posta a caso in 'iDu, passa quasi tutta la sua vita in &e, a parte fluttuazioni minori, l'universo difficilmente si differenzia dall'equilibrio termico (e potrebbe rassomigliare a fig. 27.20d se è chiuso). (b) Se specifichiamo solo che la curva parte da ORA in una celletta molto piccola (rappresentata ombreggiata), ritenendo che i punti rassomiglino all'universo in cui adesso viviamo, ma dove ç è diversamente posto a caso, allora troviamo un'evoluzione futura coerente con ciò che continuiamo a vedere, con l'entropia crescente coerentemente con la seconda legge. (c) Se applichiamo la medesima considerazione alla situazione dove l'intera curva è soltanto costretta a passare attraverso qualche istante particolare tN > O, (oRA), troviamo un futuro ragionevole per l'universo, ma, come con fig. 27.6b, troviamo una grande violazione della seconda legge nel passato. (d) A questo si rimedia se specifichiamo inoltre che l'estremità iniziale (t = O) di ç giaccia nell'assurdamente minuscola regione 11, in cui l'universo parte con lo straordinariamente speciale Big Bang che è avvenuto in apparenza nel nostro reale universo.
ç
ç
vare x nel volume 1J, ancora abbastanza piccolo, che corrisponde all'universo che osserviamo. Questo è semplicemente ciò che la seconda legge afferma, e otteniamo (d),(b), in contrapposizione a (c),(b). Lasciatemi esprimere con altre parole ciò che è stato scritto prima. Supponiamo di considerare le cose dall'osservatorio privilegiato di qualche particolare istante t0 (> O), che chiamiamo ORA, trovando che x è in qualche regione di grandezza ragionevole a quel momento t0 • Osservando poi dove vaga ç per valori più grandi di t, vediamo proprio che, al crescere di t, entra in cellette di grandezza sempre maggiore. Questo è coerente con la seconda legge e con l'assunzione precedente in base alla quale x non esibisce «alcun particolare bias» rispetto alle posizioni delle cellette. Ma se osserviamo le cose, a partire dall'istante t0 , con una prospettiva invertita rispetto al tempo, abbiamo l'impressione che x, partendo dalla regione 1J, sia guidato intenzionalmente, indietro nel tempo, verso !'assurdamente piccola regione dello spazio delle fasi che ho indicato con e. Da questa prospettiva invertita, sembra proprio che il comportamento di x 703
LA STRADA CHE PORTA ALLA REALTÀ
sia incredibilmente «biased» (deviato), poiché cerca cellette che, al decrescere del tempo, diventano sempre più straordinariamente piccole. Dobbiamo interpretare ciò come una perversa «deliberata» ricerca di cellette sempre più piccole, «solo per la malvagità di farlo»? No, è solo perché la regione '8 è circondata da cellette che diventano successivamente sempre più piccole (vedi fig. 27 .8) - così che, se çdeve raggiungere '8 quando t tende a zero, deve proprio incontrare cellette sempre più piccole. Il mistero sta semplicemente nel fatto che un'estremità di çdeve trovarsi entro '8! Questa è la giusta interpretazione, se desideriamo capire la sorgente della seconda legge. La regione '8rappresenta l'origine Big Bang dell'universo, e tra poco vedremo come questa regione sia effettivamente piccola in modo ridicolmente assurdo! Dobbiamo tentare di capire ciò che è qui implicato: in quale modo particolare '8 è speciale? Possiamo assegnare una misura numerica a questo modo di essere speciale? Quali sono, in ogni caso, i motivi osservativi per credere nel Big Bang? I motivi per credere in un'origine esplosiva dell'universo derivarono inizialmente da uno studio teorico dell'equazione di Einstein in un contesto cosmologico, eseguito da Alexandre Friedmann nel 1922 (vedi §27.11). In seguito, nel 1929, Edwin Hubble scoprì che le galassie lontane si stanno effettivamente allontanando da noi 11 in un modo che sembra implicare che la materia dell'universo sia il 1isultato di una enorme esplosione. Secondo i calcoli attuali, l'esplosione - adesso chiamata Big Bang- è avvenuta circa 1.4 x 10 10 anni fa. Le conclusioni di Hubble erano basate sul fatto che la luce proveniente da oggetti in rapido allontanamento è spostata verso il rosso (così che le linee spettrali sono spostate verso «l'estremo rosso dello spettro», vale a dire verso lunghezze d'onda maggiori) a causa dell'effetto DopplerP7 · 101 Egli scoprì che questo spostamento verso il rosso (red-shift) diventava sistematicamente tanto più grande quanto più distante appariva essere la galassia, indicando una velocità d'allontanamento proporzionale alla distanza da noi, coerentemente con una «esplosione». Ma il più impressionante elemento diretto di supporto osservativo al Big Bang è la presenza universale di una radiazione permeante lo spazio, che ha la temperatura di circa 2. 7 K (cioè 2. 7°C sopra lo zero assoluto ). 12 Anche se questa sembra essere una temperatura straordinariamente bassa per un evento così violento, questa radiazione di fondo è effettivamente ritenuta il «flash» del Big Bang, enormemente attenuato («spostato verso il rosso») e raffreddato, a causa dell'enorme espansione dell'universo. Questa radiazione a 2.7 K ha un ruolo estremamente importante nella moderna cosmologia. Comunemente viene chiamata «fondo a microonde», ma anche «radiazione di fondo di cor[27.10) Deducete lo spostamento di frequenza Doppler della relatività speciale per una sorgente che si allontana con velocità v. (a) usando un modello ondulatorio della luce e (b) usando prodotti scalari di 4-vettori e E= h v. 704
Il Big Bang e il suo retaggio termodinamico
po nero» o «radiazione cosmica residua». È estremamente uniforme (qualcosa come una parte su 105), indicando che I'universo primordiale, subito dopo il Big Bang, era esso stesso straordinariamente uniforme e molto ben descrivibile dai modelli cosmologici che esamineremo in §27.11. Cerchiamo ora di acquisire qualche intuizione fisica a proposito della natura del vincolo di entropia enormemente bassa posto al Big Bang che costringe S ad avere un volume così piccolo. t 3 Scopriremo che ciò che era straordinariamente speciale riguardo al Big Bang era in effetti la sua grande uniformità, cui abbiamo appena accennato. Dobbiamo cercare di comprendere perché questo corrisponda a un'entropia molto bassa e in che modo ci fornisca una seconda legge, importante per noi sulla Terra, nella forma che conosciamo. ·······~ -·-· . ·Prèi1diamo-di·nuovo1n·considerazione; per primircosiçìfruolo del Sole in quanto sorgente di entropia bassa. Vi è comunemente la concezione errata in base alla quale l'energia fornita dal Sole sia quella da cui dipende la nostra sopravvivenza. Questo è fuorviante, perché, affinché quell'energia sia utile per noi, ci deve essere fornita in una forma a bassa entropia. Se l 'intero cielo fosse, per esempio, uniformemente illuminato a una temperatura uniforme - o quella del Sole o qualunque altra - non vi sarebbe alcun modo di fare uso di questa energia (qualunque sia il genere di creatura che potremmo immaginare si sia evoluta a questo scopo). Una fornitura d'energia in equilibrio termico è inutile. Fortunatamente per noi, il Sole è una macchia calda su uno sfondo freddo. Durante il giorno, alla Terra arriva energia dal Sole, ma nel corso del giorno e della notte tutta quest'energia ritorna ancora nello spazio. Il bilancio energetico netto è (in media) semplicemente che rimandiamo indietro tutta l'energia che riceviamo. i 4 Quella che riceviamo dal Sole è però sotto forma di singoli fotoni dì alta energia (fondamentalmente fotoni «gialli» ad alta frequenza, a causa dell'elevata temperatura del Sole), mentre quella che restituiamo allo spazio è principalmente sotto forma dì fotoni di bassa energia (infrarossi a bassa frequenza). (Questa è una conseguenza della formula dì Planck, E= hv, e delle sue intuizioni sulla radiazione di corpo nero; vedi §21.4). A causa della loro energia più alta (temperatura più alta) vi sono molti meno fotoni dal Sole rispetto a quelli che ritornano nello spazio, perché l'energia totale trasportata da essi è la medesima. Il numero più piccolo di fotoni del Sole significa un numero minore di gradi di libertà, quindi una regione più piccola di spazio delle fasi e perciò un'entropia più piccola, rispetto ai fotoni ritornati nello spazio. Le piante impiegano questa energia a bassa entropia nella fotosintesi, riducendo con ciò la loro entropia, e noi sfruttiamo le piante per ridurre la nostra, mangiandole o mangiando qualcosa che mangia le piante, e respirando l'ossigeno che esse rilasciano. Vedi fig. 27.J._,_________,_ _ _- ___ _...,J---7Vtr-perché-il~amacchia--€,tt:dainuii.. ciclo freddo? La storia dettagliata è complicata, ma alla fine si riduce al fatto che il Sole - e tutte le altre stelle - si sono condensate, a causa della gravitazione, da un gas in pre705
LA STRADA CHE PORTA ALLA REALTÀ
'
' ,
--~tòF·
~-
.J Fig. 27.9 - La Terra restituisce la medesima quantità di energia che riceve dal Sole, ma quella che riceve dal Sole è sotto forma di entropia molto più bassa, perché la luce gialla del Sole ha frequenza più alta di quella infrarossa che la Terra restituisce. In accordo con la relazione di Planck E= hv, i fotoni del Sole trasportano un'energia per fotone molto più alta di quelli che la Terra restituisce, così che l'energia dal Sole è trasportata da un numero di fotoni inferiore a quello dei fotoni restituiti dalla Terra. Minor numero di fotoni significa minor numero di gradi di libertà e quindi regione dello spazio delle fasi più piccola ed entropia minore di quella nei fotoni che ritornano nello spazio. Le piante impiegano questa energia a bassa entropia nella fotosintesi, riducendo così la propria entropia, e noi sfruttiamo le piante per ridurre la nostra, mangiandole o mangiando qualcosa che le mangia, e respirando l'ossigeno che esse rilasciano. Tutto questo, in ultima analisi, proviene dallo squilibrio di temperature nel cielo che è il risultato dell'agglomerazione gravitazionale che ha prodotto il Sole.
cedenza uniforme (in prevalenza idrogeno). Quali che siano le altre influenze presenti (le forze nucleari, in primo luogo), il Sole non potrebbe neppure esistere senza la gravità! Il basso valore dell'entropia del Sole (considerevole distanza dall'equilibrio termico) proviene da un immenso serbatoio di bassa entropia che è potenzialmente disponibile nell'uniformità del gas da cui il Sole si è condensato grazie alla gravità. La gravitazione è qualcosa di ambiguo, in relazione all'entropia, a causa del fatto di essere sempre attrattiva. Noi siamo soliti pensare all'entropia in termini di un gas ordinario: gas concentrato in piccole regioni significa entropia bassa (come nel caso del contenitore in fig. 27.3), gas disperso uniformemente vuol dire stato d'equilibrio termico ad alta entropia. Ma, nel caso della gravità, le cose tendono ad andare in modo opposto. Un sistema uniformemente distribuito di corpi gravitanti rappresenta un'entropia relativamente bassa (a meno che le velocità dei corpi siano enormemente alte e/o i corpi siano molto piccoli e/o molto lontani, in modo che i contributi gravitazionali diventino insignificanti), mentre si ottiene un'entropia alta quando i corpi gravitanti si agglomerano (fig. 27.1 O). Cosa dire dello stato di massima entropia? Mentre con un gas l'entropia mas706
Il Big Bang e il suo retaggio termodinamico
......... ... . . . . .. . .. .
....
. ....·:f~ ..
(a)
Aumento dell'entropia
••
..
..• ... . ....". ..
>
Tempo
-.:
• ·,l· .;,:·.. •
• •
....
•
(b)
•
Fig. 27.10 - Entropia crescente, al crescere del tempo, da sinistra a destra. (a) Per un gas in una scatola, inizialmente tutto introdotto in un angolo, l'entropia cresce quando il gas inizia a diffondersi in tutta la scatola, raggiungendo infine lo stato unifo1me di equilibrio termico. (b) Nel caso della gravità, le cose tendono ad andare in modo opposto. Un sistema di corpi gravitanti all'inizio uniformemente distribuito rappresenta un'entropia relativamente bassa e si ha una tendenza all'agglomerazione quando l'entropia cresce. Vi è infine un grande aumento di entropia sotto forma di buchi neri, che inghiottono la maggior parte del materiale.
sima di equilibrio termico corrisponde al gas uniformemente distribuito in tutta la regione in questione, nel caso di grandi corpi gravitanti, l'entropia massima è ottenuta quando tutta la massa è concentrata in un solo posto - sotto la forma di quell'entità nota come buco nero. Dobbiamo capire qualcosa di questi strani e meravigliosi oggetti per procedere ulteriormente e per ottenere una stima notevole dell'entropia che è potenzialmente disponibile nell'intero universo. Ciò ci permetterà allora di valutare i valori dei volumi necessari per '8 e "Pu-
27.8 I buchi neri Che cos'è un buco nero? In termini grossolani, è una regione dello spaziotempo risultante dal collasso gravitazionale di materiale, in cui l'attrazione gravitazionale è diventata così forte che neppure la luce può sfuggire. Per ottenere una rappresentazione intuitiva del perché potrebbe avvenire una cosa del genere, pensate alla nozione newtoniana di velocità di fi1ga; se un sasso viene scagliato verso l'alto partendo dal terreno con una certa velocità v, ricadrà sul terreno dopo aver raggiunto una certa altezza, che è quella per cui l'energia cinetica del sasso è stata interamente impiegata per superare la differenza di energia potenziale rispetto al terreno (§ 18.6). Questa altezza dal terreno dipende soltanto dalla velocità iniziale, ignorando gli effetti della resistenza dell'aria.l2 7·11 l Nel caso di una velocità che supera (2GMIR) 112 , chia[27.11) Mostrate che questa altezza è v2R(2gR - v2) 1, dove R è il raggio della Terra e g è l'accelerazione dovuta alla gravità alla superficie della Terra. 707
LA STRADA CHE PORTA ALLA REALTÀ
mata velocità difitga, il sasso sfuggirebbe però al campo gravitazionale della Terra. (Qui, Me R sono rispettivamente la massa e il raggio della Terra, mentre G è la costante gravitazionale di Newton.) Supponiamo ora di avere, al posto della Terra, un corpo molto più massivo e concentrato; la velocità di fuga diventerà allora più grande (poiché il rapporto MIR cresce se M auménta e R diminuisce), e possiamo quindi immaginare che la massa e la concentrazione potrebbero diventare così grandi che la velocità di fuga alla superficie potrebbe persino superare la velocità della luce. Possiamo credere che quando ciò avviene, nella teoria newtoniana, il corpo apparirebbe completamente scuro, se osservato da grandi distanze, poiché da esso non potrebbe sfuggire nessuna luce - e questa fu proprio la conclusione a cui giunse, nel 1784, l'insigne astronomo ed ecclesiastico inglese John Michell. Più tardi, nel 1799, il grande fisico matematico francese, Pierre-Simon de Laplace, arrivò alla stessa conclusione. 15 Tuttavia, questa conclusione a me non sembra così chiara. La velocità della luce, nella teoria di Newton, non ha infatti alcuno stato assoluto e quindi potrebbe avvenire che, per un simile corpo, la velocità della luce alla sua superficie sia notevolmente più grande di quella misurata nello spazio libero, così che la luce potrebbe ancora sfuggire, indipendentemente dalla massività e dalla concentrazione di quel corpo. 16 [27· 12l Perciò, la «stella scura» di Michell, nonostante sia un profetico precursore del concetto di «buco nero», a mio parere non fornisce un esempio convincente di oggetto gravitante «invisibile» nella teoria newtoniana. Questo problema è molto più pe1iinente nel contesto della te01ia della relatività, poiché qui la velocità della luce è fondamentale e rappresenta davvero la velocità limite per tutti i segnali(§ 17.8). Tuttavia, dato che siamo interessati a un fenomeno gravitazionale, abbiamo bisogno di uno spaziotempo relativistico generale, invece di quello di Minkowski. Nella relatività generale si prevede infatti che avvengano situazioni in cui la velocità di fuga superi la velocità della luce, dando come risultato quello che ora chiamiamo buco nero. Ci si aspetta che un buco nero si formi quando un grande corpo massivo raggiunge uno stadio in cui le forze, dovute alla pressione interna, sono insufficienti a bilanciare la spinta verso il centro dovuta alla sua stessa attrazione gravitazionale. In effetti, questo collasso gravitazionale dovrebbe avvenire quando una grande stella, la cui massa supera di parecchie volte quella del Sole diciamo che sia 1OM0 ( dove 1M 0 è una massa solare, la massa del Sole) - consuma tutte le sorgenti interne di energia a sua disposizione, così che si raffredda e non può mantenere una pressione sufficiente per evitare il collasso. Quando ciò avviene, il collasso può diventare inarrestabile, poiché gli effetti gravitazionali crescono senza posa. [27.12] Capite perché? Suggerimento: ragionate in termini di teoria corpuscolare della luce e di luce esterna che arriva sulla superficie del corpo. Che cosa avviene se la luce cade su uno specchio orizzontale alla superficie del corpo?
708
li Big Bang e il suo retaggio termodinamico
Una descrizione dettagliata può diventare molto complicata, specialmente in condizioni di grande pressione, poiché entrano in gioco sofisticati problemi che riguardano il compo1iamento della materia. Di particolare rilevanza è la pressione di degenerazione degli elettroni o dei neutroni; questa ha a che fare con il principio di Pauli che, come ricordiamo da §23. 7, impedisce a due o più fermioni identici di occupare lo stesso stato quantico. In una nana bianca, che potrebbe avere qualcosa come una massa solare concentrata circa nella dimensione della Terra, l'attrazione gravitazionale è bilanciata dalla pressione di degenerazione degli elettroni; in una stella di neutroni della stessa massa, che sarebbe un corpo con un diametro di circa l O km, è invece bilanciata dalla pressione di degenerazione dei neutroni. (Una palla da tennis riempita col materiale di una stella di neutroni peserebbe quanto la luna Deimos di Matie!) Tuttavia, a causa delle esigenze della relatività, la pressione di degenerazione non può bilanciare l'attrazione gravitazionale se la massa è superiore a circa 2M0 . ll risultato cruciale è stato ottenuto, nel 1931, da Subrahmanyan Chandrasekhar, quando stabilì un limite di circa l .4M0 per le nane bianche. Successivi petfezionamenti hanno fissato un limite leggermente più grande per le stelle di neutroni. 17 La conclusione di tutto ciò è che non vi è alcuna configurazione di riposo per un oggetto freddo di più di circa 2M0 ( e probabilmente non più di 1.6M0 ). Un tale oggetto collasserebbe e continuerebbe a collassare fino a raggiungere quel genere di dimensione per la quale le considerazioni di Michell cominciano a diventare pertinenti. Che cosa succede allora? Ritorniamo alla nostra grande stella di 1OM0 , per esempio, assumendo che inizialmente sia a una temperatura abbastanza alta così che la pressione termica possa sostenerla. Quando la stella si raffredda, a un certo stadio, il nucleo compresso supererà il limite di Chandrasekhar e collasserà. La caduta verso l'interno delle parti esterne potrebbe innescare una violenta esplosione, nota come supernova. Esplosioni di questo tipo sono state frequentemente osservate, soprattutto nelle altre galassie, e per qualche giorno la supernova può brillare più dell'intera galassia in cui risiede; ma se in questa esplosione non è emesso abbastanza materiale - e per una stella di 1OM0 iniziali ciò è altamente improbabile - ci si aspetta che la stella collassi inarrestabilmente fino a raggiungere le condizioni in cui si applicano le considerazioni di Michell. Esaminiamo la fig. 27.11, che è un diagramma spaziotemporale raffigurante il collasso in un buco nero. (Naturalmente ho dovuto sopprimere una delle dimensioni spaziali.) Osserviamo che la materia continua a collassare all'interno, attraverso quella superficie - chiamata orizzonte (assoluto) degli eventi - dove la velocità di fuga diventa proprio la velocità della luce. Da allora in poi, nessuna ulteriore informazione può giungere dalla stella a un osservatore esterno, e si è formato un buco nero. La rappresentazione in fig. 27.11 è basata sulla famosa soluzione dell'equazione di Einstein, scoperta da Karl Schwarzschild, nel 1916, 18 poco dopo la pubblicazione della teoria di Einstein e solo pochi mesi prima che 709
LA STRADA CHE PORTA ALLA REALTÀ
Fig. 27.11 - Diagramma spaziotemporale di collasso in un buco nero. (Una dimensione spaziale è soppressa.) La materia collassa all'interno, attraverso la 3-superficie che diventa l'orizzonte (assoluto) degli eventi. Né materia né informazioni possono sfuggire dal buco una volta che si è formato. I coni nulli sono tangenti all'orizzonte e permettono a materia o segnali di entrare nell'interno ma non di sfuggire all'esterno. Un osservatore esterno non può vedere dentro il buco, ma solo la materia - ampiamente offuscata e spostata verso il rosso appena prima che entri nel buco.
Schwarzschild morisse per una rara malattia contratta sul fronte ·orientale durante la Prima guerra mondiale. Questa soluzione descrive il campo gravitazionale statico che circonda un corpo a simmetria sferica, indipendentemente che sia o meno in contrazione. L'orizzonte si trova a una distanza radiale r = 2MG/c 2 ( esattamente il valore critico di Michell)P 7· 13 l [27.13] La forma originaria della metrica di Schwarzschild era ds2 = (1 2Mlr)dt 2 1 2 2 2 2 2 (1 - 2Mlrt dr - r ( d0 + sin 0 dqi ), dove le unità sono scelte in modo che G = c = 1 e 0 e qi sono le ordinarie coordinate polari sferiche (§22. l O). Spiegate come la coordinata radiale r è fissata da una condizione sull'area delle sfere dir et costanti. Questa forma della metrica non si estende, in modo liscio, alla regione r :,; 2M; per questo si può impiegare la forma di Eddington-Finkelstein della metrica: ds 2 = (l -2Mlr)dv 2 - 2 dv dr-r 2(d0 2 + sin2 0df). Trovate una trasformazione di coordinate che colleghi esplicitamente queste due forme. Spiegate perché le curve nulle in ciascun (11, r)-piano devono essere le geodetiche radiali nulle e impiegate questo fatto per ottenere le loro equazioni e tracciarle. (Tracciate in verticale le rette r = costante e inclinate di 45° a sinistra verso l'alto le rette n = costante.) Identificate l'orizzonte degli eventi e la singolarità (§27.9). 710
Il Big Bang e il suo retaggio termodinamico
l;orizzonte degli eventi non è una superficie materiale, è soltanto una particolare (iper)superficie dello spaziotempo che separa i posti da cui possono sfuggire segnali da quelli da cui nessun segnale può sfuggire, essendo inesorabilmente catturato dal buco nero. Uno sventurato osservatore che passasse attraverso l'orizzonte deglì eventi, dall'esterno verso l'interno, non noterebbe, appena entrato, alcunché di peculiare. Inoltre, il buco nero di per sé non è un corpo ponderabile. Pensiamo che sia semplicemente una regione gravitante dello spaziotempo da cui nessun segnale può sfuggire. Cosa possiamo dire del destino della povera stella? Tratteremo questo problema nel prossimo paragrafo. Dapprima prendiamo in esame la situazione delle osservazioni: vi sono prove dell'effettiva esistenza di buchi neri? Certamente: negli anni Settanta, era noto un certo numero di curiosi sistemi di «stelle doppie», in cui solo un membro della coppia era luminoso nell'intervallo di luce visibile. I.;esistenza, la massa e il moto dell'altro erano dedotti dai dettagli fini del moto del suo partner visibile; inoltre, dall'emissione di raggi X provenienti dalle immediate vicinanze, si deduceva che il partner invisibile era un oggetto compatto, la cui massa era troppo grande per essere uno di quei due oggetti materiali - una nana bianca o una stella di neutroni - che gli accettati principi fisici avrebbero ammesso. L'emissione di raggi X era coerente con il fatto che l'oggetto invisibile fosse un buco nero circondato dal cosiddetto «disco di accrescimento» di gas e polvere, che gradualmente si muove a spirale sempre più vicino al buco, diventando enormemente caldo quanto più si avvicina. Infine, raggi X sono emessi prima che il materiale entri effettivamente nel buco (vedi fig. 27.12a). Il meglio conosciuto ( e il più convincente dal punto di vista osservativo a quel tempo) di questi candidati a buco nero era la sorgente di raggi X Cigno X-1, il membro compatto e scuro di una coppia con massa di circa 7M0 , che certamente le impedisce di essere una nana bianca o una stella di neutroni, secondo la teoria accettata. Questo tipo di prova era sempre piuttosto indiretta e meno che completamente soddisfacente, perché si basava sulla teoria per dirci che simili oggetti massivi concentrati non possono esistere come corpi estesi. Adesso però vi è qualche prova più direttamente imponente per l'esistenza dei buchi neri. I dischi di accrescimento non sono le sole configurazioni assunte dal materiale che cade nei buchi neri; in alcuni casi, il materiale cade «direttamente», e sembra che adesso questo tipo di compo1iamento sia stato osservato (fig. 27.12b). Se l'oggetto compatto attraente dovesse avere una superficie materiale di qualunque genere, il materiale che cade dentro riscalderebbe quella superficie, il cui bagliore sarebbe visibile dopo un certo tempo. Ma nessun bagliore è stato osservato. Perciò, vi è ora qualche prova diretta del fatto che una simile entità compatta non ha affatto una superficie, e si può quindi dedurre, in modo abbastanza convincente, che questa entità sia davvero un buco nero. 19 711
LA STRADA CHE PORTA ALLA REALTÀ
(a)
(b)
Fig. 27.12- Sistemi di stelle doppie, un membro delle quali è un (minuscolo) buco nero. (a) La materia asportata dalla stella più grande dal buco nero forma un disco di accrescimento attorno a esso, che gradualmente discende a spirale e si riscalda, finché raggi X sono emessi prima che il materiale entri realmente nel buco. (b) In alcuni casi non vi è nessun disco di accrescimento e il materiale semplicemente cade «direttamente». Se l'oggetto compatto che attrae dovesse avere una superficie ponderabile, il materiale che cade dentro si riscalderebbe, ma non si vedrebbe alcun bagliore, il che conferma la presenza di un buco nero.
Quanto detto si riferisce a buchi neri «stellari», la cui massa sarebbe solo poche volte quella del Sole. Vi sono anche alcune prove impressionanti del1'esistenza di buchi neri molto più massivi. Sembra che la maggior parte delle galassie forse tutte - abbiano al loro centro buchi neri molto grandi. Sembra, in particolare, che al centro della Via Lattea, la nostra galassia, vi sia un buco nero di massa 3 x I O M 0 ; i moti effettivi di stelle orbitanti intorno a esso sono stati seguiti in dettaglio e sono risultati completamente coerenti con la presenza di questo buco nero.
27.9 Orizzonti degli eventi e singolarità spaziotemporali In fig. 27.11 ho tracciato alcuni coni nulli, in modo che le proprietà causali dello spaziotempo diventino ragionevolmente apparenti. La caratteristica più essenziale è l'esistenza dell'orizzonte degli eventi del buco nero che, nello spaziotempo, è una 3-superficie -;?I. Come affermato nel paragrafo precedente, questo ha la proprietà per cui nessun segnale che ha avuto origine nella regione all'interno di -;?,può arrivare nella regione esterna. Ciò può essere visto come un effetto dell'inclinazione dei coni verso l'interno, così che si trovano a essere tangenti a -;?I. Qualunque linea d'universo che passasse dall'interno all'esterno di -;?I dovrebbe violare la causalità che i coni definiscono(§ 17.7). Ho raffigurato il caso in cui il collasso gravitazionale è del tutto sfericamente simmetrico, quello che è stato inizialmente studiato da J. Robert Oppenheimer e Hartland Snyder nel 1939 e che impiega la geometria di Schwarzschild per descrivere la regione esterna alla materia che precipita. Anche se l'orizzonte -;?,ha strane proprietà, la sua geometria locale non è significativamente diversa da quella in un altro luogo. Come è stato spiegato prima, un osservatore in una nave spaziale non noterebbe alcunché di particolare nel!' attraversamento di -;?I dall'esterno all'interno. Tuttavia, non ap712
li Big Bang e il suo retaggio termodinamico
pena s'intraprende quel viaggio pericoloso, non vi è più 1itorno. L'inclinazione dei coni nulli è tale che non vi è possibilità di fuga, e l'osservatore incontrerebbe ben presto effetti di marea rapidamente crescenti (la curvatura dello spaziotempo; vedi § 17.5 e § 19.6), che tendono all'infinito avvicinandosi alla singolarità spaziotemporale nel centro (r = O). Queste caratteristiche non sono specifiche del caso di simmetria sferica, ma sono del tutto generali. Vi sono, in verità, teoremi molto generali che affermano che non possono essere evitate singolarità in qualunque collasso gravitazionale che oltrepassi un certo «punto di non ritorno». 20 Alcuni dei problemi pertinenti saranno discussi più dettagliatamente in §28.5. Per un buco nero di poche masse solari, le forze di marea sarebbero facilmente in grado di uccidere una persona molto prima che questa raggiunga l 'orizzonte, tanto meno che lo attraversi, ma per i grandi buchi neri di 106 M 0 , o più, che si ritiene si trovino nel centro delle galassie, non vi sarebbero particolari problemi per gli effetti di marea all'attraversamento del!' orizzonte (poiché l'orizzonte ha un «diametro» di alcuni milioni di chilometri). In effetti, nel caso della nostra galassia, la curvatura all'orizzonte del suo buco nero è soltanto circa venti volte la curvatura dello spaziotempo alla superficie della Terrache non riusciamo neppure a notare! Tuttavia, l'inarrestabile trascinamento dell'osservatore verso la singolarità al centro fa sì che gli effetti di marea crescano rapidamente sino all'infinito, distruggendo l'osservatore in meno d'un minuto! La distruzione a causa delle rapidamente crescenti forze di marea è, in effetti, il destino comune a tutto quello che cade verso il centro di un buco nero. Ricordate la nostra preoccupazione per il destino del materiale della nostra stella di 1OM0 in collasso? Ebbene, persino le singole particelle di cui è composto incontreranno, in rapida successione, forze di marea così forti da essere ridotte a pezzi, di che tipo nessuno lo sa! Ciò che sappiamo veramente è che finché può essere mantenuta la rappresentazione di Einstein di uno spaziotempo classico, che agisce secondo le equazioni di Einstein (con densità di energia non negative e qualche altra debole e «ragionevole» assunzione), una singolarità spaziotemporale sarà incontrata dentro il buco. 21 La previsione è che le equazioni di Einstein ci diranno che questa singolarità non può essere evitata da alcun materiale nel buco e che le «forze di marea» (ossia la curvatura di Weyl; vedi §19.7) diventeranno infinite molto probabilmente, nel caso generale, in un modo selvaggiamente quasi oscillatorio. 22 In realtà, sarà inevitabile entrare nel regno della gravità quantistica (o qualunque sia il termine appropriato), e così queste previsioni della teoria classica dovranno essere modificate in accordo con questa. Non sappiamo ancora quale deve essere la corretta teoria della «gravità quantistica», ma queste considerazioni sui buchi neri ci forniscono un importante input; e questo input dovrebbe guidare la nostra ricerca della corretta «gravità quantistica» nelle oppo1iune direzioni. Questi problemi avranno grande importanza per noi successivamente, in particolare nei capitoli 30, 31 e 32. 713
LA STRADA CHE PORTA ALLA REALTÀ
In generale si crede che le singolarità spaziotemporali del collasso gravitazionale si trovino necessariamente sempre entro un orizzonte degli eventi, perciò quali che siano gli straordinari effetti fisici che avvengono in tali singolarità, essi saranno nascosti alla vista di qualsiasi osservatore esterno. Questa però non è una proprietà matematicamente affermata della relatività generale. I.: assunzione in base alla quale le singolarità saranno sempre così nascoste è nota come censura cosmica, 23 e sarà discussa con maggiore completezza in §28.8. D'altra parte, non dobbiamo arrivare fino alla singolarità per trovare straordinari effetti risultanti dal collasso gravitazionale. Vi sono alcuni processi molto violenti visibili nell'universo; per esempio, si crede che le quasar eccezionalmente luminose siano alimentate da buchi neri rotanti nel centro delle galassie, poiché la rotazione del buco nero è la sorgente di alimentazione, anche se il materiale effettivamente emesso (apparentemente lungo l'asse di rotazione) proviene dall'esterno del buco (vedi §30.7). I.:energia emessa da qualche quasar, anche se proviene da una minuscola regione ( di dimensione simile al sistema solare), può superare in splendore un'intera galassia per un fattore 102 o 103 o più! Esse possono essere viste a distanze enormemente grandi e sono importanti strumenti osservativi per la cosmologia. Vi sono anche sorgenti di potenti raggi y(fotoni di elevatissima energia) che si ritiene implichino buchi neri, forse coppie di buchi neri in collisione. 24
27.10 L'entropia dei buchi neri Ritorniamo all'esame delle regioni esterne «più sicure» di isolati buchi neri stazionari («morti»). Vedremo che a simili oggetti deve essere assegnata un'entropia straordinariamente grande. Per prima cosa, dovremmo prendere nota del fatto che vi sono teoremi matematici 25 che forniscono prove convincenti che buchi neri generali, che possono inizialmente possedere complicate irregolarità dovute a un collasso asimmetrico - una catastrofe irreversibile, probabilmente con un violento moto a spirale - si sistemeranno rapidamente, nonostante ciò, in una forma geometrica notevolmente semplice ed elegante. Questa è descritta dalla metrica di Kerr2 6 ed è caratterizzata da due soli parametri fisici/geometrici (numeri reali) denotati da m e a. 27 Qui, m è la massa totale del buco nero e a x m è il momento angolare totale (in unità dove G = c = 1). Come il premio Nobel Subrahmanyan Chandrasekhar (il cui famoso risultato del 1931, come ricordiamo da §27.8, instradò l'astrofisica sul cammino verso i buchi neri) ha scritto: I buchi neri sono i più perfetti oggetti macroscopici dell'universo: i soli elementi necessari per la loro costruzione sono i nostri concetti di spazio e tem714
Il Big Bang e il suo retaggio termodinamico
po. E poiché la teoria della relatività generale fornisce solo un'unica famiglia di soluzioni per la loro descrizione, sono anche gli oggetti più semplici. 28
einarrestabile natura dei buchi neri, quando raccolgono ogni genere di materiale - che potrebbe avere un'immensa quantità di struttura dettagliata - convertendolo in una singola configurazione descrivibile con soli dieci parametri (che sono a, m, la direzione dell'asse di rotazione, la posizione del centro di massa e la sua 3-velocità), è una poderosa manifestazione della seconda legge. Questi dieci parametri rappresentano tutto ciò che è necessario per un'adeguata caratterizzazione macroscopica dello stato finale. 29 Anche se un buco nero non sembra simile a materia ordinaria all'equilibrio termico, condivide con esso la proprietà cruciale per cui enormi numeri di stati microscopicamente distinti conducono a qualcosa che può essere descritto da un numero molto ristretto di parametri. Per questo motivo, la celletta di grana grossa dello spazio delle fasi, a esso corrispondente, è davvero enorme e, di conseguenza, i buchi neri hanno entropie enormi. In effetti, l'entropia di un buco nero ha una notevole interpretazione geometrica: è proporzionale all'area dell'orizzonte degli eventi di quel buco! Secondo la famosa formula di Bekenstein-Hawking, a un buco nero può essere attribuita un'entropia ben definita, che è 3
s -kc4Gh -A BI-I -
dove A è l'area superficiale dell'orizzonte del buco nero - e dove potete pensare che BH stia al posto di Bekenstein-Hawking o di black hole (buco nero), come desiderate! (Prendete nota della comparsa sia della costante di Planck sia della costante gravitazionale, il che significa che questa entropia è un effetto di «gravità quantistica».) In verità, questo è il primo posto dove abbiamo visto comparire assieme nella medesima formula sia la costante fondamentale della meccanica quantistica (la costante di Planck, scritta nella forma di Dirne fi), sia quella della relatività generale (la costante gravitazionale G di Newton). Per questioni di fisica fondamentale, in cui sono implicate sia la meccanica quantistica sia la relatività generale, è spesso conveniente adottare unità in cui entrambe queste costanti siano pari a uno. Abbiamo già visto, in§ 17.8 e§§ 19.2, 6, 7 (e altrove, come nel capitolo 24) che è spesso estremamente conveniente adottare unità in cui la velocità c della luce è pari a uno. Senza perdita di coerenza, possiamo estendere questa convenzione così che anche 1i e G abbiano valore unitario. Ciò ha come conseguenza il fatto che tutte le unità di tempo, spazio, massa e carica elettrica sono ora completamente fissate, fornendo le cosiddette unità di Planck (o unità naturali o unità assolute). Possiamo ritenere, inoltre, che anche la costante k di Boltzmann sia pari a uno (vedi §27.3) 715
LA STRADA CIIE PORTA ALLA REALTÀ
G=c= h=k= 1, e allora anche l'unità di temperatura diventa una cosa assoluta. Queste unità sono lontane da quelle pratiche per l'uso quotidiano, come si può vedere quando tentiamo di esprimere le nostre unità convenzionali in termini delle unità di Planck: grammo= 4.7 x 104, metro = 6.3 x 1034 , secondo
1.9 x 1043 ,
grado Kelvin= 4 x 10- 33 _ ln queste unità, la carica del protone (o quella dell'elettrone col segno meno) è approssimativamente e = 1 , e più esattamente 30
e= 0.085 424 5 ... Possiamo anche invertire queste relazioni trovando che massa di Planck= 2.1 x 10- 5 g, lunghezza di Planck = 1.6 x 10- 35 m, tempo di Planck = 5 .3 x 1O 44 s, temperatura di Planck= 2.5 x l 032 K, carica di Planck = 11. 7 cariche del protone. Vedremo qualcosa di più sulle unità di Planck in §31.1. Ritornando alla formula di Bekenstein-Hawking per l'entropia dei buchi neri, 1TOviamo che in unità di Planck l'entropia SsH di un buco nero di area A della superficie è semplicemente SsH=
l
4A.
Nel caso della soluzione di Kerr, troviamo esplicitamente
8nG 2
A =--m(m+,J111 2 -a 2 ) c4
-J , -a-?) 2nGk ( m+mS 1311 =--m ch (in unità generali). Tratteremo alcuni motivi fondamentali della notevole formula di Bekenstein-Hawking in §30.4. Per avere un'idea degli straordinari valori per l'entropia che possono essere ottenuti in un buco nero, prendiamo prima in esame quello che, negli anni Sessanta, si pensava fosse il maggior contributo all'entropia dell'universo, e 716
Il Big Bang e il suo retaggio termodinamico
precisamente l'entropia della radiazione a 2. 7 K: il fondo lasciato dal Big Bang. Questa entropia è, in unità naturali, circa 108 o 109 per barione. (Grosso modo, questo è il numero di fotoni per barione lasciato dal Big Bang.) Paragoniamo questa cifra, certamente enorme, con l'entropia dovuta ai buchi neri che si trovano nell'universo. Gli astronomi non hanno un'idea del tutto chiara di quanti buchi neri possano esserci, e neppure della loro grandezza, ma vi sono indicazioni molto attendibili a favore dell'esistenza di un buco nero al centro della nostra galassia, la Via Lattea, con una massa di circa 3xl0 6M 0 , che potrebbe ragionevolmente essere un valore tipico. Alcune galassie ham10 buchi neri molto più grandi, che dovrebbero facilmente controbilanciare quelle galassie che potrebbero averne di più piccoli, poiché, dopo tutto, sono i buchi neri grandi a dare il contributo principale all'entropia totaleJ27·14l Come stima grossolana (probabilmente molto conservativa), assumiamo che la nostra galassia sia tipica, trovando così un'entropia per barione di circa 10 21 , che eclissa completamente la cifra di 10 8 o 109 per la radiazione di fondo di corpo nero. Inoltre, qualunque sia il suo valore attuale, essa crescerà inarrestabilmente e straordinariamente col trascorrere del tempo.
27.11 Cosmologia Prima di tentare di trovare una valutazione del valore certamente colossale dell'entropia che è potenzialmente accessibile al nostro universo - in modo che possiamo avere un'impressione di come sia effettivamente speciale il nostro universo adesso e di come deve essere stato «particolarmente speciale» al momento del Big Bang - avremo bisogno di conoscere un po' dicosmologia. Cercheremo d'impiegare indicazioni cosmologiche per valutare la grandezza della celletta '8 dello spazio delle fasi che rappresenta il Big Bang, per confrontarla con il volume dell'intero spazio delle fasi 'Pu e anche con il volume della celletta 1t che rappresenta l'universo così come è adesso. Lasciatemi iniziare con una breve descrizione dei cosiddetti modelli standard della cosmologia, che sono (fondamentalmente) tre. Come ricordiamo da §27.7, la discussione risale al russo Alexandre Friedmann, che nel 1922 trovò per primo le appropriate soluzioni cosmologiche dell'equazione di Einstein, con una sorgente di materia che può essere usata per approssimare una distribuzione completamente uniforme, su grande scala, di galassie (conosciuta anche come «fluido perfetto» o «polvere»). I modelli cosmologici della classe generale studiata da Friedmann (qualche volta con un tipo di sorgente di materia diverso dalla «polvere» di Friedmann) sono ora comunemente chiamati modelli di Friedmann-Lemaìtre-Robertson-Walker (FLRW) a causa dei successivi contributi, chiarificazioni e generalizzazioni di questi altri. [27 .14] Riuscite a capirne il motivo? 717
LA STRADA CHE PORTA ALLA REALTÀ
Un modello FLRW è fondamentalmente caratterizzato dal fatto che è completamente spazialmente omogeneo e isotropo. In termini grossolani «isotropo» significa che l'universo appare simile in tutte le direzioni, e pertanto ha un gruppo 0(3) di simmetria rotazionale. «Spazialmente omogeneo» significa che l'universo appare anche uguale in ogni punto dello spazio, a ogni momento; di conseguenza, vi è un gruppo di simmetrie che è transitivo(§ 18.2) su ciascun membro di una famiglia di 3-superfici di tipo spazio, che sono le 3-superfici 'li dello «spazio» al «momento» t costante (dando in tutto un gruppo di simmetria 6-dimensionale).l2 7·15l Questa coppia di ipotesi è in buon accordo con osservazioni della distribuzione di materia su scala molto grande e con la natura della radiazione di corpo nero. Si trova direttamente che l 'isotropia spaziale è un'approssimazione molto buona (per sorgenti molto distanti e soprattutto per la radiazione 2.7K). Inoltre, se l'universo non fosse omogeneo, potrebbe apparire isotropo solo da certi posti molto particolari,[27·161 e perciò, a meno di non trovarci in una posizione molto privilegiata, l'universo non dovrebbe apparirci isotropo, in assenza di omogeneità. Naturalmente l'isotropia osservativa non è esatta, poiché vediamo galassie, ammassi di galassie e superammassi di galassie soltanto in certe direzioni; vi sono però distribuzioni irregolari di materiale, non sempre visibile, su scale sorprendentemente grandi, come quella a cui si fa riferimento come «Grande Attrattore» che sembra attrarre a sé non solo la nostra galassia, ma anche parecchi ammassi vicini di galassie. Pare, tuttavia, che le deviazioni dall'uniformità spaziale diventino proporzionalmente più piccole, quanto più lontano guardiamo. Le migliori informazioni che abbiamo per le regioni più lontane che ci sono accessibili provengono dalla radiazione di fondo di corpo nero a 2.7 K. I dati COBE, BOOMERANG e WMAP, eccetera, ci dicono che, anche se ci sono deviazioni molto leggere a quella scala, di circa qualche parte su 105, l'isotropia è adeguatamente mantenuta. 31 Sembra davvero che le cosmologie omogenee e isotrope - i modelli FLRW - siano eccellenti approssimazioni della struttura dell'universo reale, almeno fino al limite dell'universo osservabile che si estende fino a una distanza che include circa 10 11 galassie, contenente circa l 080 barioni. (Vedremo tra poco che cosa significa questo concetto di «universo osservabile».) 1:isotropia spaziale e l'omogeneità implicano32 che le sezioni spaziali 3-dimensionali 'li a «tempo costante» riempiano tutto lo spaziotempo 'ì1t (senza intersecarsi tra loro), poiché ciascuna delle loro 3-geometrie condivide il gruppo di simmetria di omogeneità e d'isotropia di 'ilt.; vedi fig. 27.13. Le (essenzialmente) tre differenti possibilità per la 3-geometria dipendono dal valore K della curvatura spaziale (costante); sono possibili tre casi: curvatu[27.15] Perché 6-dimensionale? [27 .16] Date un argomento generale per mostrare perché un (3-)spazio connesso non può essere isotropo attorno a due punti distinti senza essere anche omogeneo. 718
Il Big Bang e il suo retaggio termodinamico
Fig. 27.13 - I modelli cosmologici spazialmente omogenei e isotropi di Friedmann-Lemaìtre-Robertson-Walker (FLRW). Il tempo cresce verso l'alto e ciascun modello parte con un Big Bang. Ciascuno è riempito con una famiglia I-parametro di 3-superfici 7, non intersecantisi, di genere spazio e omogenee, che danno lo «spazio» al tempo t. Nei modelli di Friedmann, la materia è trattata come un fluido perfetto («polvere»). Sono illustrati i tre casi: (a) K > O, dove le 7, sono 3-sfere S3 (indicate nei diagrammi come un cerchio S 1), in cui il modello infine collassa in un Big Crunch (grande compressione); o (b) dove le 7, sono 3-spazi euclidei IP, raffigurati come il 2-piano in cima; o (e) dove le 7, sono 3-spazi iperbolici (indicati da una rappresentazione conforme in cima). In (d), (e) e (f), una costante cosmologica positiva è incorporata in (a), (b ), (c), rispettivamente, con espansione esponenziale finale, dove nel caso (d) è supposto che A sia abbastanza grande da impedire la fase di collasso.
ra spaziale positiva (K > O), curvatura zero (K = O), curvatura negativa (K < O). Nella letteratura cosmologica, di solito si normalizza il raggio di curvatura, nei casi K O, facendo riferimento a K > O e K < O semplicemente come K = 1 e K = - 1, rispettivamente. Tuttavia, per chiarezza delle successive discussioni, non seguirò questo uso, in quanto preferisco le rispettive descrizioni K > O e K < O. In fig. 27.13a, b, c, ho cercato di raffigurare l'evoluzione temporale dell'universo, secondo l'originaria analisi di Friedmann dell'equazione di Einstein, per le diverse scelte alternative della curvatura spaziale. In ciascun caso, l'universo parte da una singolarità - il cosiddetto Big Bang - dove la curvatura dello spaziotempo diventa infinita e poi l'universo si espande rapidamente. Il comportamento finale dipende, in modo critico, dal valore di K. Se
*
719
LA STRADA CHE PORTA ALLA REALTÀ
K > O (fig. 27.13a), l'espansione infine si inverte e l'universo ritorna in una singolarità, nota come Big Crunch, che è l'esatta inversa temporale del Big Bang nel modello di Friedmann. Se K = O (fig. 2 7. l 3b ), l'espansione riesce solo a tener duro e non ha luogo un collasso. Se K < O (fig. 27 .13c), non vi è alcuna possibilità di collasso, poiché l'espansione raggiunge infine un ritmo costante. (Vi è qui un'analogia con la pietra scagliata dal suolo verso l'alto, che è stata discussa in §27.8. Se la velocità iniziale della pietra è minore della velocità di fuga, alla fine ricadrà sul suolo come l'universo di Friedmann per K > O; se è eguale alla velocità di fuga, riesce soltanto a non ricadere sul suolo, come nel caso K = O; se è maggiore della velocità di fuga, prosegue e arriva a un ritmo limite che non rallenta, come nel caso K < O.) Il lavoro originario di Friedmann non implicava una costante cosmologica, 33 ma praticamente in tutte le successive discussioni sistematiche di cosmologia si era tenuto conto del suggerimento di Einstein (nel 1917) di un termine cosmologico Agab - nonostante la scelta preferita da Einstein (dopo il 1929, vedi § 19. 7) di prendere A = O. Questo suggerimento si è rivelato fo1iunato, perché recenti prove osservative, di vario tipo, hanno cominciato a puntare chiaramente nella direzione dell'esistenza reale di una costante cosmologica positiva (A >0) nel comportamento dell'universo. Riprenderò l'argomento in §28.10, ma per il momento il lettore è rimandato alle illustrazioni di fig. 27.13d, e, f, che rappresentano le analoghe di fig. 27.13a, b, c, in cui però è incorporata nelle equazioni di Friedmann una (sufficientemente grande) A positiva. Secondo le attuali osservazioni e opinioni degli studiosi di cosmologia, uno di questi modelli sembrerebbe dare una giusta descrizione della storia dell'universo reale, almeno dal momento del decoupling (disaccoppiamento), quando l'universo aveva soltanto circa 3 x 105 amli, vale a dire circa 1/50000 della sua età attuale di 1.5 x I 0 10 anni approssimativamente, poiché il decoupling è il momento a cui effettivamente «guardiamo indietro» quando osserviamo la radiazione di fondo. Prima del decoupling l'universo sarebbe stato fondamentalmente «dominato dalla radiazione», mentre dopo sarebbe stato «dominato dalla materia». Non ci aspettiamo che il modello «polvere» di Friedmann sia appropriato nella fase dominata dalla radiazione, mentre potrebbe essere più appropriato il modello di Tolman ( 1934). Questo non fa una grande differenza per le nostre descrizioni. Esso abbrevia la vita del! 'universo dal Big Bang al decoupling per un fattore di circa¾ rispetto alla previsione[27 · 17l di Friedmann come ho indicato in fig. 27.14. I sostenitori della cosmologia inflazionaria suggeriscono un cambiamento molto più grande per l'evoluzione, vale a dire un'espansione esponenziale, che avrebbe aumentato la scala dell'universo per un fattore forse di 1060 • Ma questo avrebbe avuto fine nel momento in [27.17) Vedete se siete in grado di dedun-e questo fattore¾, assumendo che il comportamento di un modello «polvere» di Friedmann sia di forma t = AR312 per piccoli valori del tempo t, e quello della «radiazione» di Tolman sia t = BR2, dove R = R(t) è una misura del «raggio» dell'universo e A e B sono costanti. Suggerimento: le tangenti alle curve devono coincidere?
720
Il Big Bang e il suo retaggio termodinamico
Fig. 27.14 - Prima del «decoupling», che è avvenuto quando l'universo aveva circa 300.000 anni (solo circa 1/50000 della sua età attuale) - l'epoca a cui «guardiamo indietro» con la radiazione di fondo -1 'universo era «dominato dalla radiazione» e non valeva l'approssimazione della «polvere» di Friedmann. Abbiamo invece l'alquanto più rapida espansione di Tolman, indicata dalla curva interna.
cui l'universo aveva circa solo 1o- 32 secondi di età, e perciò non farebbe alcuna differenza per fig. 27.13 o fig. 27.14! Le conseguenze, sotto altri aspetti, potrebbero però essere enormi, se questo modello inflazionario fosse corretto. Prenderò in esame la cosmologia inflazionaria in §§28.4, 5. In ogni caso, penso che sia ragionevole non includere l'inflazione nel cosiddetto «modello standard della cosmologia», e io qui non lo farò. 34 Ma quale dei tre modelli di fig. 27 .13d, e, f può essere ritenuto il più appropriato per l'universo attuale? Discuterò questo problema in §28.1 O; per il momento, riteniamo che uno qualsiasi di essi potrebbe essere fondamentalmente corretto. Esaminiamo con più attenzione ciascuna di queste tre diverse geometrie spaziali. Il caso K > O è normalmente rappresentato come la 3-sfera. Si dovrebbe dire, tuttavia, che vi è anche lo spazio proiettivo IRIP 3, ottenuto identificando i punti antipodali di S3 (vedi § § 15.4-6); è difficile immaginare che questi due sarebbero, in pratica, distinguibili dal punto di vista osservativo. Vi sono altre identificazioni tra punti distinti di S3 , che danno i cosiddetti spazi a lente, ma nessuno di questi è globalmente isotropo. 35 Il caso (isoh·opo) K = O è l'ordinario 3-spazio euclideo, mentre quello K < O è la 3-geometria iperbolica che abbiamo studiato in §§2.4-7 e § I 8.4. Vedi rispettivamente fig. 2.21 a, b, c per le eleganti e ingegnose rappresentazioni di M. C. Escher delle (versioni 2-dimensionali delle) rispettive geometrie spaziali per K> O, K = Oe K O è detto universo chiuso, che significa spazialmente chiuso (vale a dire che contiene un'ipersuperficie compatta di genere spazio). 36 Spesso i cosmologi chiamano il caso K < O«aperto», mentre, dal punto di vista tecnico, anche il caso K = O è spazialmente aperto. Di conseguenza, non impiegherò qui questa terminologia alquanto confusa. Se abbandoniamo l'isotropia globale, allora, come nel caso degli spazi a lente con K > O sopra citati, vi sono modelli di universi chiusi (non isotropi) anche per K = Oe K < 0. 37 Il 4-spazio 'ilt completo è descritto in termini di una evoluzione temporale per la 3-geometria spaziale, come abbiamo visto, in cui vi è una scala globale che cambia col tempo. Nella descrizione standard, l'universo inizial721
LA STRADA CHE PORTA ALLA REALTÀ
R
R
K>O, A=O (a)
R
K=O, A=O (b)
R
KO (d)
Fig. 27.15 - Grafici di R = R(t) per i modelli di Friedmann, prima con A = O: (a) K > O, (b) K = O, (c) K < O, e poi (d) con A> O. (Il caso (d) è plottato per K = O, ma gli altri casi sono molto simili, purché A sia abbastanza grande rispetto alla curvatura spaziale.)
mente si espande molto rapidamente da un Big Bang, ma pensare che vi sia stato un «punto centrale» in cui ha avuto luogo l'esplosione, dal quale tutto si allontana, è una descrizione scorretta. Un'immagine più ragionevole, nel caso di due dimensioni spaziali, è la superficie di un pallone mentre viene gonfiato; ogni punto della superficie si allontana da ogni altro punto, al passare del tempo, e non vi è alcun «punto centrale» in questo modello di universo. In questa analogia, la superficie deve rappresentare l'intero universo. Perciò, il centro del pallone non fa parte dell'universo in espansione, così come qualsiasi altro punto non appartenente alla superficie. Impieghiamo la notazione dI:2 per denotare la metrica di una di queste tre 3-geometrie, dove nei casi K -:f:. O la normalizziamo in modo che sia quella della 3-sfera unità o quella dello spazio iperbolico unità (cioè prendiamo K = 1 o K = -1, rispettivamente)Y 7· 18l La 4-metrica dell'intero spaziotempo può allora essere espressa nella forma ds 2 = dt 2 -R2 dI?,
dove t è un parametro di «tempo cosmico», i cui valori determinano le singole 7, e dove R =R(t)
è una funzione del parametro temporale t che dà la «grandezza» dell'universo spaziale «al tempo t». Così, la metrica per ciascuna 7, è data da R 2 dI?. In fig. 27 .15a, b, c, ho tracciato il grafico di R = R(t) per K = 1, O, - 1, rispettivamente, nel caso originario di Friedmann di «polvere» (fluido perfet[27.18] Vedete se siete capaci di dimostrare che d1:2 = d,.2 + sin2 q,(dtp2 + sin2 0d02) descrive la metrica di una 3-sfera unità; impiegate poi le procedure di §18.1 per dedurre che dl:2 = dr + sinh2X( dx 2 + sin2 0 d02) descrive lo spazio iperbolico unità. Suggerimento: scrivete dapprima la metrica per una 3-sfera di raggio arbitrario. 722
Il Big Bang e il suo retaggio termodinamico
to)l2 7·19l con A= O, e in fig. 27.15d ho mostrato ciò che avviene con un A positivo, dato che le curve per tutti e tre i valori di K sono molto simili (purché, nel caso K > O, A sia abbastanza grande da sopraffare il susseguente collasso - proprio come suggeriscono le osservazioni). Il ritmo di espansione finale è allora esponenziale.
27.12 I diagrammi conformi Per comprendere che cosa s'intende col termine «universo osservabile», è utile impiegare il cosiddetto diagramma conforme, 38 una rappresentazione (spesso 2-dimensionale) di tutto lo spaziotempo, in cui le direzioni nulle sono tracciate con un angolo di 45° rispetto alla verticale e anche l'infinito è rappresentato come (parte del) la :frontiera del diagramma. Per questa nozione di «infinito» è comunemente impiegata la lettera ?, pronunciata «scrai»; «?+» è usato per l'infinito fitturo (o futuro nullo), alla fine «raggiunto» da raggi luminosi uscenti, e «?-» per l'infinito passato (per raggi luminosi incidenti). Normalmente sono 3-superfici nulle nella teoria standard di Einstein con A= O, e 3-superfici di genere spazio se A> 0. 39 I diagrammi conformi raffigurano la struttura di causalità dello spaziotempo, quando siamo interessati alla famiglia di coni nulli più che alla sua metrica completa. Questa è la versione lorentziana della geometria conforme che abbiamo incontrato in §2.4, §8.2 e §§18.4, 5 (definita da una classe di equivalenza di metriche, dove g è equivalente a [}g, Q essendo una funzione scalare positiva che modifica la scala delle distanze da posto a posto). In §2.2, abbiamo visto come l'intero piano iperbolico può essere rappresentato, in modo conforme, in una regione finita del piano euclideo (fig. 2.11, fig. 2.12, fig. 2.13). Videa di un diagramma conforme dello spaziotempo è fondamentalmente la stessa, ma adesso è la metrica lorentziana (non definita positiva) dello spaziotempo che è rappresentata in modo conforme. La nuova caratteristica cruciale si basa sul fatto che, nella geometria lorentziana, i coni nulli di per sé definiscono la geometria conforme. In due dimensioni, il cono nullo consiste in una coppia di direzioni nulle, e questo determina la 2-metrica fino a un fattore.conforme locale. Una circostanza in cui una simile rappresentazione 2-dimensionale è particolarmente preziosa è quando vi è simmetria sferica in tutto il 4-spazio; possiamo allora pensare che questo 4-spaziotempo sia un 2-spazioternpo «fatto ruotare», così che ciascun punto del 2-spazio rappresenti tutta una S2 nel 4-spazio. Per spazitempo di que[27.19] La soluzione di «polvere» di Friedmann per K > O, A= O può essere espressa nella forma R = C(l - cos !; ), t = C( !;- sin !;), dove C è una costante e !; è un opportuno parametro. Mostrate che questa è l'equazione di una cicloide la curva tracciata da un punto della circonferenza di un cerchio che rotola su una retta orizzontale. Sapete vedere come passare dal caso K > O a quello K < O impiegando un «trucco» simile a quello usato in § 18.1, e al caso K = Oprendendo un opportuno limite (implicante tm cambiamento di scala per le coordinate)? 723
L,\ 'TR,\ll-\ CHE PORTA ALLA REALTÀ
sto tipo, i diagrammi conformi possono essere resi molto precisi, e per questi farò uso della nozione di diag,,unma conforme esatto. I diagrammi conformi che non sono esatti vengono chiamati schematici. I punti di un diagramma conforme esatto rappresentano davvero intere sfere (metriche) S2. (Oppure (n - 2)-sfere S11 - 2, nel caso di uno «spaziotempo» lorentziano n-dimensionale del tipo impiegato nella teoria delle stringhe, eccetera - vedi §§31.4, 7). I punti eccezionali, quei punti del diagramma che rappresentano singoli punti dello spaziotempo, si trovano su quella parte della frontiera del diagramma che descrive un asse di simmetria; queste parti sono denotate da linee tratteggiate, e pertanto dovete pensare che il diagramma sia ruotato attorno a queste linee tratteggiate.l27·20l Le parti della frontiera che rappresentano infinito sono indicate da linee piene, mentre quelle parti che rappresentano singolarità sono indicate da linee dentellate. Vedi fig. 27 .16a. Vi sono anche certi angoli dove diverse linee di frontiera di un diagramma confanne s'incontrano; quelli che sono indicati da piccoli cerchietti aperti O devono essere pensati come rappresentanti intere 2-sfere (come la frontiera del 3-spazio iperbolico; vedi §2.4 e §18.4), mentre è meglio pensare che quelli indicati da punti pieni• rappresentino punti (sfere di raggio nullo). La fig. 27.16b è il diagrmmna conforme esatto per lo spazio di Minkowski, mentre la fig. 27.16c è quello per il collasso gravitazionale in un buco nero di Schwarzschild (il collasso sfericamente simmetrico descritto in §27.11 ). In fig. 27.17, ho raffigurato i modelli cosmologici di fig. 27.13P 721 l I diagrammi conformi sono utili perché rendono particolarmente evidenti le proprietà di causalità degli spazitempo; si noti, per esempio, che nel collasso sfericamente simmetrico in un buco nero, raffigurato in fig. 27.16b, l'orizzonte del buco nero giace a 45°. Qualunque linea d'universo di una particella materiale non può inclinarsi di più di 45° rispetto alla verticale, di modo che non può sfuggire dalla regione interna dietro l'orizzonte una volta che lo ha attraversato; inoltre, una volta dentro quella regione è costretto ad andare nella singolarità (fig. 27.1 Sa). Sembra che la singolarità sia una frontiera futuro di tipo spazio per la parte interna dello spaziotempo, una cosa piuttosto controintuitiva dal punto di vista più convenzionale di fig. 27.11. La situazione mostrata dal Big Bang svolge un ruolo simile all'inversione temporale di questo, agendo come una frontiera passato di tipo spazio per lo spaziotempo (fig. 27.18b). Questo è di nuovo controintuitivo, poiché abbiamo la tendenza a pensare che il Big Bang sia un punto (singolare). 40 [27 .20] Vedete se potete ottenere esplicitamente il 4-spazio di Minkowski di fig. 27.16a, prendendo la metà destra della metrica del 2-spazio di Minkowski (ds 2 = dt 2- dr2, con r ;e: O) e ruotandola attorno all'asse verticale in questo modo. Esprimete la metri.ca del 4-spazio, usando opportune funzioni di t, re gli angoli polari sferici 0, O, A> O), ottenendo ancora un analogo caos di entropia enormemente alta (S"" 10 123) di buchi neri in coagulazione. (c) Un generico Big Bang apparirebbe simile all'inverso temporale di un generico collasso di questo tipo (illustrato per K > O e o A= O oppure A> O). (d) La situazione più «probabile» (come la curva di fig. 27.Sa) - illustrata, per motivi di chiarezza, nel caso K > O, A= O - non ha alcuna somiglianza con il reale universo, nello stadio primordiale.
barioni, a prescindere da A> O. Per l'inverso temporale dell'universo desc1itto da fig. 27.13d è una soluzione delle equazioni dinamiche tanto quanto quella descritta dalla stessa fig. 27. l 3d (poiché stiamo considerando leggi dinamiche che dovrebbero essere temporalmente reversibili). Se prendiamo in esame perturbazioni di questo universo, possiamo trovare modelli in cui buchi neri già formati si riuniscono e producono un genere di «caos» simile alla coagulazione di buchi neri che avevamo prima. (Vedi fig. 27.20b.) Di nuovo raggiungiamo un valore dell'entropia che, per il medesimo ragionamento di prima, è del1' ordine di 10 123 • (Questo tipo di ragionamento sarà di nuovo importante per noi quando arriveremo a esaminare la cosmologia inflazionaria in §28.5.) Siamo così condotti a una ragionevole stima del volume totale di 'Pu (che è essenzialmente uguale al volume E della celletta & di massima entropia di fig. 27.4), vale a dire l'esponenziale di questo valore dell'entropia: E = e10"'"" 1010"'
con una buona approssimazione.l 27 ·23 l (Questo valore è ottenuto impiegando la formula di Boltzmann, S = log V, in unità naturali.) Come si paragona questo valore con quello che sappiamo del volume N della celletta 1t per l'entropia attuale e con il volume B della celletta g'per l'entropia al momento del [27.23] Perché queste cifre - entro la precisione espressa dal numero «123» - sono virtualmente uguali? Perché il valore reale di B non compare nelle conclusioni di sotto? 729
LA STRADA CHE PORTA ALLA REALTÀ
-'
I'~
' '
'-
··-
'-"
.
I
" ~--"
Fig. 27.21 - La creazione dell'universo: una fantasiosa descrizione! Lo spillo del Creatore deve trovare uria minuscola celletta, solo una parte sull'intero volume dello spazio delle fasi, per creare un universo con un Big Bang così speciale come quello che realmente osserviamo.
Big Bang (assumendo, per ora, che viviamo in un universo con 1080 barioni)? Prendendo la stima, data prima, per l'entropia dei buchi neri, come valore attuale dell'entropia e prendendo il valore di 108 per l'entropia per barione nella radiazione a 2. 7 K, troviamo
B: N: E= 10 10'": 10 10"": 10 10 '". Da qui segue che ogni B e ogni N è soltanto una parte su 10 10 '" del volume totale E. Inoltre, il volume B è soltanto una parte su I 0 10 '°' del volume N dello spazio delle fasi dell'attuale universo. Per apprezzare il problema posto dall'assurdamente piccolo volume dello spazio delle fasi relativo a ?J, possiamo immaginare il Creatore che cerca d'impiegare uno spillo per localizzare questo minuscolo puntino nello spazio 'Pu, così da dare inizio all'universo in un modo che assomigli a quello che oggigiorno conosciamo. In fig. 27.21, ho disegnato una fantasiosa rappresentazione di questo importantissimo evento! Se il Creatore non dovesse riuscire a centrare questo puntino, senza il minimo errore, e immergesse lo spillo, realmente a caso, nella regione S di massima entropia, il risultato sarebbe un universo inabitabile come quello di fig. 27.20d, nel caso A= O, K >O , ma sotto altri aspetti piuttosto simile al caso di continua espansione di fig. 27.20c, in cui non vi è nessuna seconda legge per definire una direzione temporale statistica (come in fig. 27.8a). (Le cose non sarebbero spiegate molto meglio se immaginassimo che il Creatore avesse semplicemente lo 730
Il Big Bang e il suo retaggio termodinamico
scopo di costruire un universo con esseri senzienti come noi. Ciò solleva la questione del «principio antropico», su cui ritornerò in §§28.6, 7 e in §34.7.) D'altra parte, può essere che l'universo sia spazialmente infinito, forse come i modelli FLRW con K = O o K < O. Ciò non invalida il ragionamento di prima; possiamo immaginare di applicarlo solo all'universo osservabile (al momento attuale) invece che a tutto l'universo. Supponendo che l'universo attualmente osservabile contenga circa 1080 barioni, è difficile vedere come le considerazioni di prima possano essere seriamente alterate. D'altra parte, se applichiamo i ragionamenti di prima a tutto l'universo (supponendo ancora che il modello FLRW sia una buona approssimazione), otteniamo semplicemente una richiesta di precisione infìnita da parte del Creatore, anziché di una precisione solo assurdamente grande. Non vedo come ciò potrebbe, in un modo qualsiasi, risolvere l'enigma presentato dalla «sintonizzazione» straordinariamente precisa inerente al Big Bang - una cosa essenzialmente correlata alla seconda legge. Quale messaggio ricaviamo da queste considerazioni? Abbiamo imparato non solo che l'origine dell'universo dal Big Bang è stata straordinariamente speciale, ma anche qualcosa d'importante sulla natura di questo suo essere speciale. Finché ci si interessava alla materia (l'elettromagnetismo incluso), sembra che la descrizione «equilibrio termico», nel contesto di un universo in espansione, sia stata molto appropriata. Questa è la descrizione di successo «Big Bang caldo», che è un importante ingrediente del modello standard della cosmologia. Dopo circa 1o- 11 secondi, sembra che l'universo abbia avuto una temperatura di circa 10 15 K, mentre dopo un 102 secondi, questa era scesa a 109 K. Questa diminuzione di temperatura sarebbe stata in accordo con il ritmo di espansione di Tolman-Friedmann, e molti dettagli osservativi (per esempio, i rapporti idrogeno/deuterio/elio) sono coerenti con i processi nucleari che avrebbero avuto luogo a quelle temperature posteriori. Nel caso della gravitazione, tuttavia, le cose sono state del tutto diverse per il fatto che i gradi di libertà gravitazionali non sono stati affatto «termalizzati». L'uniformità stessa (cioè la natura FLRW) della geometria dello spaziotempo iniziale è stata la caratteristica speciale del Big Bang. Il fatto che uno stato iniziale singolare per l'universo «non avrebbe dovuto essere così» è illustrato in fig. 27.20b - o nell'opposto temporale del fisicamente appropriato Big Crunch di fig. 27.20a. Sembra che la gravità abbia una posizione molto speciale, diversa da quella di qualsiasi altro campo. Invece di condividere la termalizzazione che nell'universo primordiale avvenne per tutti gli altri campi, la gravità rimase in disparte, con i suoi gradi di libertà in attesa: la seconda legge entrerebbe quindi in gioco quando questi gradi di libertà iniziano a essere impegnati. Questo non ci dà soltanto una seconda legge, ma ce ne dà una nella forma particolare che osserviamo in Natura. Sembra proprio che la gravità sia stata diversa! Ma perché è stata diversa? Quando cerchiamo una risposta a questo tipo di domanda, entriamo in aree più' speculative. Nel prossimo capitolo, vedre731
LA STRADA CHE PORTA ALLA REALTÀ
mo alcuni processi con cui i fisici hanno cercato di scendere a patti con questo e altri enigmi collegati, riguardanti 1'origine dell'universo. A mio parere, nessuno di questi affronta dettagliatamente l'enigma trattato nel paragrafo precedente. Di conseguenza, dovremo tornare a esaminare (nel capitolo 29) le basi stesse della meccanica quantistica, poiché sono fermamente convinto che questi problemi siano profondamente connessi. Poi, nel capitolo 30, tenterò di presentare una buona parte delle mie opinioni su questi argomenti fondamentali.
Note 1. Tutto questo ritenendo che la dinamica sia interamente classica. Dal punto di vista tecnico, un «sistema caotico» è un sistema classico in cui una piccola variazione nello stato iniziale può dare come risultato un comportamento che si differenzia in modo esponenziale col tempo, invece che, per esempio, in modo lineare. Questa «imprevedibilità» è, naturalmente, una questione di grado e non di «principio» che qualche volta le viene attribuita rispetto al determinismo. 2. Questo assume che i calori specifici siano positivi, una cosa che avviene normalmente. Ma, nel caso dei buchi neri, solitamente questa ipotesi non è vera; vedi §31.5. 3. Vi è tuttavia il curioso «paradosso» per cui nella vita ordinaria le cose si svolgono in maniera opposta! Si fanno spesso accurate «retrovisioni» semplicemente ricordando quello che è avvenuto in passato, mentre non abbiamo nulla d'analogo per il futuro. Le ricerche archeologiche, inoltre, possono estendere tali «memorie» a epoche molto precedenti ali' esistenza di esseri umani. Questa retrovisione non implica comunque l'evoluzione di equazioni dinamiche, e i dettagli della sua connessione con la seconda legge mi rimangono ancora oscuri. (Vedi Penrose 1979a). 4. Vedi Pais (1986). 5. Vedi Gibbs (1960); Ehrenfest e Ehrenfest (1959); Pais (1982). 6. In realtà, Boltzmann non ha mai impiegato questa costante, perché non s'interessò mai alle unità di misura effettivamente usate nella pratica; vedi Cercignani (1999). Sembra che la formula S = k log V, implicante questa costante, sia stata scritta esplicitamente per la prima volta da Planck; vedi Pais (1982). 7. Da Eddington (1929a). 8. Vedi Hawking e Ellis (1973); Misner e altri (1973); Wald (1984); Hartle (2002). 9. Vedi Gold (1962); vedi Tipler (1997) per queste idee portate a una conclusione abbastanza fantasiosa. 10. Vedi Penrose (1979a). 11. Alcuni anni prima di Hubble, nel 1917, l'astronomo americano Vesto Slipher aveva già trovato qualche indicazione dell'espansione dell'universo. Vedi Slipher (1917). Anche se raramente gli è dato credito per queste osservazioni, ha anche il merito di avere scoperto Plutone! 12. Questa radiazione fu teoricamente predetta, per la prima volta, da George Gamow nel 1946, sulla base del modello del Big Bang; poi più esplicitamente da 732
li Big Bang e il suo retaggio termodinamico
13. 14.
15. 16. 17. 18. 19. 20.
21. 22. 23. 24. 25. 26. 27.
28. 29.
Alpher, Bethe e Gamow nel 1948; poi ancora, in modo indipendente, da Robert Dicke nel 1964. Nel 1965, è stata osservata sperimentalmente (in modo accidentale) da Arno Penzias e Robert Wilson, e immediatamente interpretata da Dicke e i suoi colleghi. Vedi Alpher e altri ( 1948); Dicke e altri ( 1965), e naturalmente Penzias e Wilson ( 1965), probabilmente l'articolo scientifico col titolo più modesto di tutti i tempi! Per ulteriori discussioni, vedi Penrose (1979a, 1989). In realtà, la Terra manda indietro, globalmente, più dell'energia che riceve. A parte la questione della combustione umana dei «combustibili fossili», che infine restituisce parte dcli' energia ricevuta dal Sole e immagazzinata nella Terra molti milioni di anni fa (e, d'altra parte, trascurando il corrispondente 1iscaldamento globale che risulta «dall'effetto serra», per il quale la Terra cattura un po' più di energia del Sole di quello che faceva prima), vi è il riscaldamento dell'interno della Terra, dovuto al decadimento radioattivo, che viene gradualmente perso nello spazio tramite l'atmosfera. Vedi §34.8. Vedi Michell (1784); Tipler e altri (1980). Vedi Penrose (1978). Vedi van Kerkwijk (2000) per lo stato dell'arte su tale questione. Vedi Schwarzschild (1916) o la presentazione moderna in Wald (1984). Vedi Narayan (2003) per prove recenti. La presenza di quella che è nota come «superficie intrappolata» è un'utile caratterizzazione di un simile «punto di non ritorno». Una superficie intrappolata è una 2-superficie Scompatta di genere spazio con la proprietà per cui le due famiglie di normali nulle a S convergano entrambe nel foturo. (In termini più «colloquiali», questo significa che, se un lampo di luce ha origine inS, le aree sia della parte uscente che della parte entrante inizieranno a diventare più piccole.) Ci attendiamo di trovare superfici intrappolate dentro l'orizzonte ~di un buco nero. Il merito del criterio della superficie intrappolata è che non dipende da alcuna ipotesi di simmetria ed è «stabile» rispetto a piccole perturbazioni della geometria. Una volta che si è formata una superficie intrappolata le singolarità sono inevitabili (assumendo certe condizioni molto deboli e ragionevoli riguardanti la causalità e la positività dell'energia nella teoria di Einstein). Risultati di questo tipo si applicano alla singolarità cosmologica del Big Bang. Vedi Penrose ( 1965b); Hawking e Penrose ( 1970). Vedi Penrose ( 1965b); Hawking e Penrose (1970). Wald ( 1984) riesamina questi teoremi in un contesto pedagogico. Vedi Penrosc (1969, 1998); Belinsk:ii e altri (1970). Vedi Penrose (1969, 1998). Vedi Reeves e altri (2002) per il punto di vista più aggiornato su tali questioni, e Cheng e Wang ( 1999); Hansen e Murali ( 1998) per la teoria delle collisioni. Vedi Israel (1967). Vedi Kerr (1963); Newman e altri (1965) nel caso carico. Wald (1984) dà una presentazione pedagogica. Come le ellissi di Keplero, cui si è fatto riferimento all'inizio di questo capitolo, la metrica di Kerr fornisce un altro di quei casi eccezionali in cui abbiamo la fortuna di trovare configurazioni geometriche relativamente semplici che nascono effettivamente dalle leggi dinamiche. Vedi Chandrasekhar ( 1983), p. I. ln realtà (come vedremo in §27.9), vi è un ulteriore parametro che descrive la carica elettrica totale (poiché questa è una grandezza conservata; vedi § 19.3). Ma per buchi neri astrofisici realistici, questa può essere ignorata nella geo733
LA STRADA CHE PORTA ALLA REALTÀ
30. 31. 32. 33. 34. 35. 36. 37. 38.
39. 40.
41. 42.
metria del buco nero, poiché è minuscola in confronto a m e a, a causa della forte tendenza di un buco nero alla neutralità elettrica. Si dovrebbe naturalmente stare attenti a non confondere questa «e» con la base dei logaritmi naturali e= 2.7182818285 ... , vedi §5.3. Vedi Smoot e altri ( 1991) per le prove COBE; Spergel e altri (2003) per WMAP. Liddle (1999) è una superba introduzione alla cosmologia. Wald (1984) copre questa topica a un livello più sofisticato. Vedi Bondi (1961); Rindler (2001); Dodelson (2003). Il termine «concordance model» è emerso per descrivere la situazione per cui K= Oe A> O, dove è anche inclusa l'inflazione. Vedi Blanchard e altri (2003); Bahcall e altri (1999). Vedi §28.1 Oper la mia valutazione. Una possibilità piuttosto insolita è che gli antichi Greci avessero ragione(§ 1.1) e l'universo sia realmente un dodecaedro (o piuttosto una sua versione «incollata»). Vedi Luminet (2003). Il termine ipersuperficie fa riferimento a una sottovarietà (n - I)-dimensionale di una n-varietà, in questo caso una 7,. Vedi Killing (1893); Wolf(1974). Questi sono chiamati anche «diagrammi di Penrose» o «diagrammi di CarterPenrose», a causa del loro impiego nel mio seminario di Varsavia (1962); la nozione sistematica di diagramma confonne esatto è stata introdotta da Carter (1966). Vedi Penrose (1962); Carter (1966); Penrose (1963, 1964, 1965a). Hawking e Penrose (1996) fanno uso dei diagrammi e forniscono alcune istruzioni per la loro interpretazione. Certi modelli ipotetici in cui il Big Bang è davvero conformemente (vale a dire casualmente) un punto - chiamato «il punto Q» trovano favore presso alcuni teorici; vedi Tipler (1997). Non sono, tuttavia, al corrente di alcuna discussione compatibile con i ragionamenti del capitolo 27 che renda fisicamente plausibili questi modelli. Vedi nota 36 per il termine «ipersuperficie». In questo caso, vediamo che il Big Bang, nella sua rappresentazione conforme, è 3-dimensionale. (Possiamo mettere questa rappresentazione a confronto con altre, vedi Rindler 2001.) Si ritiene spesso che il fenomeno in ultima analisi responsabile di tali irregolarità sia la presenza di «fluttuazioni quantistiche» nella densità iniziale di materia nel Big Bang. (Questo sarà discusso in §30.14.)
CAPITOLO
28
TEORIE SPECULATIVE SULL'UNIVERSO PRIMORDIALE
28.1 La rottura spontanea di simmetria nell'universo primordiale Le nostre riflessioni sono rimaste fino a questo punto nell'ambito della teoria fisica saldamente accertata, in cui impressionanti dati osservativi hanno offerto un poderoso appoggio alle idee teoriche, alcune volte apparentemente strane, che sono entrate in gioco. Alcuni dei miei ragionamenti sono stati presentati in modo un po' diverso rispetto a ciò che si trova in letteratura, ma non penso che vi sia in questo qualcosa di discutibile. In questo capitolo, tenterò di trattare alcune delle idee più speculative che si interessano di problemi sollevati dalla speciale natura del Big Bang. Prenderò in considerazione in particolare le idee della cosmologia inflazionaria, insieme ad altre che hanno attinenza con la rottura spontanea di simmetria nell'universo primordiale (vedi §25.5). Alcuni lettori, già a conoscenza di alcune idee di uso comune in cosmologia, possono trovare sconcertante il fatto che io ponga in modo così deciso la cosmologia inflazionaria nel campo delle «speculazioni». In effetti, spesso le divulgazioni sembrano considerare ben accertato il fatto che nei primissimi stadi dell'universo ci fu un periodo di espansione esponenziale, nel corso del quale l'universo si è espanso di un fattore 1030, o forse persino 1060 o più. Altri lettori ben informati potrebbero persino essere più allarmati dal fatto che reputo il fenomeno generale di rottura spontanea di simmetria nell'universo primordiale un'idea speculativa. Nonostante ciò, le nozioni che desidero trattare in questo capitolo per ora non hanno molto (se pur ne hanno) supporto significativo dalle osservazioni, e non è ancora chiaro se sono idee che possono o meno avere genuina rilevanza per la Natura. Iniziamo con l'idea generale di rottura spontanea di simmetria. Si ricordi la forza di questa idea per produrre QFT rinormalizzabili, in cui la rinormalizzabilità sfrutta una simmetria («nascosta») più grande di quella direttamente mostrata nel comportamento osservato. Questa mancanza della simmetria completa è attribuita alla scelta del sistema di uno «stato di vuoto» che non condivide la simmetria completa della teoria dinamica. In partico735
LA STRADA CHE PORTA ALLA REALTA
lare, questa idea è stata un ingrediente cruciale della parte elettrodebole del modello standard della fisica delle particelle. Inoltre, questo tipo d'idea, che implica molti possibili «vuoti>>, è un ingrediente essenziale anche dell'inflazione. Questi concetti di rottura spontanea di simmetria e di «falsi vuoti» sono comunemente invocati anche dai fisici teorici in cerca di scherni sempre più unificati. Dovrei tuttavia chiarire che la rottura spontanea di simmetria, in sé e per sé, non è un'idea speculativa. Ha indubbia rilevanza per molti autentici fenomeni fisici (la superconduttività ne è un eccellente esempio). Si applica sicuramente in parecchi fenomeni ben acce1iati, spesso in modo elegante e soddisfacente. Non ho alcuna intenzione di mettere in dubbio l'idea in sé, ma temo che sia talmente attraente da indurre i fisici a impiegarla troppo spesso, magari anche in circostanze non appropriate. eidea di rottura spontanea di simmetria è spesso introdotta in riferimento al fenomeno deljèrromagnetismo. Immaginate una palla sferica di ferro; possiamo pensare che i suoi atomi siano piccoli magneti che, a causa delle forze agenti tra loro, tendono ad allinearsi parallelamente ai loro vicini, con il medesimo orientamento nord/sud. Quando la temperatura è abbastanza elevata, e precisamente sopra un valore c1itico, che è circa 770 °C ( 1043 K), la frenetica agitazione termica degli atomi soverchia questa tendenza all'allineamento magnetico e il materiale non manifesta più una propensione a diventare un magnete su grande scala, poiché vi è una effettiva disposizione casuale delle orientazioni dei magnetini atomici. Ma a una temperatura più bassa di 770 °C (il cosiddetto «punto di Cmie»), la disposizione più favorevole, dal punto di vista dell'energia, è quella in cui i magnetini sono allineati e il ferro diventa magnetizzato. 1 Immaginiamo adesso che la nostra palla di ferro sia inizialmente riscaldata a una temperatura superiore a 770 °C (ma non a una temperatura tale da provocarne la fusione), perciò inizialmente è una palla sferica non magnetizzata. e ambiente in cui si ritrova è poi gradualmente raffreddato fino ad arrivare sotto la temperatura critica di 770 °C. Che cosa avviene? La tendenza naturale per la palla è di trovare uno stato di minima energia, poiché l'energia delle vibrazioni interne dei suoi atomi è trasferita nell'ambiente esterno più freddo. A causa delle interazioni tra atomi vicini, l'energia minima è quella dello stato in cui tutti gli atomi sono allineati, così che la palla si magnetizza, con una direzione definita per l'asse magnetico, ma nessuna di queste direzioni è favorita rispetto alle altre. Avviene la cosiddetta degenerazione negli stati di minima energia (confronta con §22.6). Non essendoci alcuna direzione privilegiata nel suo stato iniziale non magnetizzato, la direzione della magnetizzazione finale è puramente casuale. Questo è un esempio di rottura spontanea di simmetria: lo stato iniziale, sfericamente simmetrico, si sistema in uno stato con simmetria inferiore, vale a dire la sola simmetria di rotazione attorno al risultante asse magnetico nord/sud. Uno stato con simmetiia SO(3) (la palla calda di ferro inizialmente non magnetizzata) evolve in uno stato con simmetiia SO(2) (la palla fredda e magnetizzata; vedi §§ 13. I, 2, 3, 8, IOper il significato di questi simboli). 736
Teorie speculative sull'universo primordiale
Fig. 28.1 - Rottura spontanea di simmetria con potenziale «a cappello messicano» per gli stati ammissibili di un sistema, dove l'altezza misura l'energia. Lo stato del sistema è rappresentato come una pallina, vincolata a rimanere sulla superficie del cappello. Quando la temperatura ambiente è abbastanza alta (punto di Curie), lo stato di equilibrio del sistema è rappresentato dalla pallina a riposo sulla punta del cappello e ha una simmetria rotazionale completa S0(2), in questo modello semplificato. Ma quando la temperatura scende, la pallina rotola in basso, raggiungendo infine un arbitrario punto di equilibrio nel bordo del cappello, rompendo questa totale simmetria sferica.
La rappresentazione usata per descrivere questo genere di situazione è il potenziale «a cappello messicano» illustrato in fig. 28.1. Il «cappello» rappresenta la famiglia di stati permessi del sistema (poiché la temperatura ambiente è stata raffreddata a zero), e la sua «altezza» rappresenta l'energia del sistema. Scopriamo che vi è uno stato d'equilibrio (vale a dire che ha il piano tangente orizzontale) rappresentato dalla cima del cappello che possiede tutta la simmetria del gruppo originario - poiché questo gruppo è rappresentato nella figura come rotazione attorno all'asse verticale. (Supponiamo che questa simmetria rotazionale S0(2) sia analoga alla completa simmetria S0(3) della palla di ferro, ma che abbiamo dovuto perdere una dimensione. spaziale per rendere la figura visualizzabile. La cima del cappello rappresenta la completa perdita di magnetizzazione globale da parte della palla.) Ma questo equilibrio - che rappresenta lo stato non magnetizzato - è instabile e non rappresenta il minimo dell'energia disponibile. I minimi sono gli stati rappresentati dalle parti orizzontali - un intero cerchio - giusto all'interno del bordo del cappello (i diversi punti rappresentano differenti direzioni della magnetizzazione totale della palla di ferro). Possiamo immaginare che lo stato iniziale sia quello sulla cima, rappresentato da una «pallina» posta in bilico su quel punto; ma la mancanza di stabilità significa che la pallina rotolerà giù da quel punto (assumendo l'esistenza di disturbi casuali) e infine si sistemerà sul bordo del cappello. Ogni punto del bordo in cui la pallina potrebbe sistemarsi rappresenta una diversa direzione della magnetizzazione che alla fine la palla potrebbe acquisire. Questa posizione della pallina rappresenta lo stato fisico finale; ma, a causa della degenerazione rotazionale, non vi è alcuna posizione di riposo privilegiata per la pallina. Tutte queste posizioni di equilibrio sul bordo del cappello sono sullo stesso piano. La scelta della pallina è considerata casuale e, una 737
LA STRADA CHE PORTA ALLA REALTÀ
volta effettuata la scelta, la simmetria viene rotta - secondo qualche direzione scelta a caso. Un fenomeno di questo genere, in cui una riduzione della temperatura ambiente induce un improvviso grande cambiamento globale nella natura dello stato di equilibrio stabile del materiale, è noto come transizione di fase. Nel nostro esempio della palla di ferro, la transizione di fase avviene quando la palla passa dallo stato non magnetizzato (quando la temperatura è sopra i 770 °C) a quello uniformemente magnetizzato (temperatura sotto i 770 0 C). Più familiari sono il fenomeno di congelamento (dove, all'abbassarsi della temperatura, lo stato passa da liquido a solido) e quello di ebollizione (dove, al crescere della temperatura, lo stato passa da liquido a gas). Una transizione di fase, che avviene quando la temperatura è abbassata, è spesso accompagnata da una riduzione di simmetria, ma questo non è essenziale. Nei processi della QFT, una transizione di fase spesso sarebbe descritta in termini di una nuova scelta dello stato di vuoto (come il I O sul valore di K? Dovrei menzionare, per prima cosa, i motivi alla base del precedente convincimento per cui l'evidenza cosmologica favorì un valore negativo di K. II problema essenziale è il contenuto totale di massa-energia dell'universo, perché se questo è troppo piccolo non sarà in grado di chiudere l'universo con curvatura positiva, o (nei modelli di Friedmann) di trascinarlo indietro di nuovo, dopo l'espansione iniziale, per produrre una fase di collasso (vedi fig. 27.15a, b, c). Era stato noto a lungo che la densità dell'ordinario materiale barionico visi772
Teorie speculative sull'universo primordiale
bile (vedi §25.6) nelle galassie è insufficiente per questo scopo, poiché è solo circa un trentesimo del valore critico che rappresenta la divisione tra i va-. lori positivi e negativi di K, poiché la densità critica è quella che ci dà K = O. La grandezza Q" è comunemente introdotta per denotare quella frazione della densità critica di massa-energia che è ottenuta con la normale materia barionica. Perciò, se Q" = 1, la materia barionica fornirebbe proprio la densità critica, e qualsiasi altra significativa (positiva) massa-energia condurrebbe a un universo K> O. Tuttavia, come sopra menzionato, sembra che abbiamo invece un Qb = 0.03, che ha dato una forte indicazione per K < O. Tutto questo non tiene .comunque conto della forte indicazione in base alla quale nell'universo vi è molta più materia del materiale barionico che è direttamente osservato nelle stelle. Nel corso di molti anni, fu acclarato che la dinamica delle stelle entro le galassie non ha molto senso, secondo la teoria standard, 42 a meno che in prossimità di una galassia non vi sia molto più materiale di quello che è direttamente visto nelle stelle. Un commento analogo vale anche per la dinamica di singole galassie negli ammassi. Sembra che, complessivamente, vi sia circa 10 volte più materia di quella percepita nell'ordinaria forma barionica. Questa è la misteriosa materia oscura sulla cui vera natura non vi è ancora accordo tra gli astronomi, e che potrebbe essere persino di materiale diverso da tutti quelli noti ai fisici delle particelle - anche se attualmente vi sono molte congetture intorno a ciò. 43 Poiché sembra che la materia oscura contribuisca alla massa-energia circa 1Ovolte il contributo dell'ordinaria materia barionica, la densità fornita dalla materia oscura, come frazione Qd della densità critica, è approssimativamente data da Qd = 0.3 (e le incertezze sono tali che possiamo includere la barionica Qb = 0.03 in questa cifra, se lo desideriamo). Tutto questo ci lascia ancora molto al di sotto del valore critico; inoltre, diversi tipi di osservazione (inclusi gli effetti di lente gravitazionale che come ricordiamo da§ 19.8 forniscono una misura diretta della presenza di massa) cominciavano a mostrare, in modo abbastanza convincente, che non vi poteva essere alcuna altra significativa concentrazione di massa nell'universo. Quindi, la conclusione K < Osembrava abbastanza sicura, e di conseguenza gli inflazionisti e i seguaci di Hartle-Hawking cominciavano a cercare modi di incorporare K < O nelle loro rispettive visioni del mondo. Poi arrivò la notizia bomba della costante cosmologica. Ricordiamo da § 19.7 che Einstein aveva considerato l'introduzione di A il suo «più grande errore» (soprattutto perché forse contribuiva al suo fallimento di predire l'espansione dell'universo). Anche se da allora i cosmologi l'avevano ritenuta una possibilità, sembra che pochi di loro si aspettassero di trovare che A fosse diversa da zero nel nostro universo reale. Un problema aggiuntivo era il fatto che i calcoli di «energia del vuoto» dei teorici dei campi quantistici (fondamentalmente un effetto di rinonnalizzazione come quelli di §26.9) avevano dato un risultato assurdo: vi dovrebbe essere realmente una costante cosmologica efficace circa 10 120 ( o almeno 1060 con ipotesi diverse) volte 773
LA STRADA CHE PORTA ALLA REALTÀ
più grande di quella che è vista. Questo divenne noto come «il problema della costante cosmologica». Potrebbe essere stato plausibile che qualche cancellazione o principio generale sconosciuto potesse dare il valore Oper questa energia del vuoto, ma trovare un piccolissimo residuo potenzialmente rilevante per la cosmologia dell'epoca presente non era in nessun modo anticipato. (Bisognerebbe menzionare che questa «energia del vuoto» dovrebbe essere proporzionale alla metricag,b, per l'invarianza locale di Lorentz, ecosì la forma Agab è anticipata, per una costante A, che contribuisce all'equazione di Einstein proprio come Einstein aveva suggerito nel 1917. Il solo guaio è che il valore di A risulta completamente errato!) Ciononostante, quando nel 1998 due team che osservavano supernove molto lontane - uno guidato da Saul Perlmutter, in California, e l'altro guidato da Brian Schmidt in Australia e Robert Kirschner negli Stati Uniti orientali - giunsero alla notevole conclusione che l'espansione dell'universo aveva cominciato ad accelerare, come è coerente con la svolta verso l'alto nel grafico di fig. 27.15d, che è il segno distintivo di una costante cosmologica positiva! Quanto è grande questa A che sembra essere osservata? Vi è ancora qualche incertezza rispetto a questo (e alcuni teorici hanno sostenuto che le tesi a favore di una A positiva non sono ancora convincenti), 44 ma la notevole conclusione è che la densità efficace .QA di massa-energia, che A fornisce, come frazione della densità critica, è data approssimativamente da .QA = 0.7, in modo che ci sembra di avere, per la densità totale efficace .Q"" .Qd+ .QA""
0.3 + 0.7
= I.
In altre parole, sembra che adesso le osservazioni siano coerenti con K = O. Gli inflazionisti (almeno quelli che hanno avuto fiducia nelle loro opinioni) sono, naturalmente, giubilanti, e può certamente essere ritenuto un successo della loro teoria il fatto che, contro alcune prove apparentemente forti a favore del contrario, la predizione K = O sembri aver vinto. Le incertezze, tuttavia, sono ancora troppo grandi per sostenere con convinzione questa conclusione, ed è significativo che altri tipi di recenti osservazioni abbiano anche una potente influenza su tale questione. Come menzionato in §28.5, vi sono state parecchie misurazioni delle dettagliate variazioni di temperatura nella radiazione di fondo a microonde, iniziando con il satellite COBE, lanciato nel 1989, mentre la più recente rassegna (al momento della scrittura di questo libro) è quella condotta dal!' esploratore spaziale WMAP. Queste variazioni di temperatura sono di solito analizzate decomponendo la distribuzione sopra il cielo in armoniche sferiche, secondo i procedimenti discussi in §22.11. Ricordiamo che le varie armoniche sferiche sono etichettate da un intero positivo ee un intero m variante nell'intervallo da-fa f. (Nel caso quantistico, e è di solito indicato con}, e sia} che m possono essere seminteri.) La grandezza m è meno importante, perché dipende da una direzione arbitrariamente scelta nel cielo, così che l'intensità generale per ciascun valore di 774
Teorie speculative sull'universo primordiale
8.wHM
[
gradi l
10
I
O.I
6000 5000 Fi"'
],
4000
~
~ 3000 ~ +
'.:::,
""'
2000 1000
o 10
e
100
1000
Fig. 28.19 - Gli anticipati «picchi acustici» nell'analisi armonica della radiazione di fondo a microonde (la linea continua) e i punti dei dati osservati (le croci con le barre di errore). Assicuratevi di notare la discrepanza molto significativa al quadrupolo (f = 2), quasi nascosta (accidentalmente?) dall'asse verticale.
è ritenuta la grandezza di maggior interesse. In fig. 28.19, ho mostrato i risultati di questa analisi. Fate attenzione al fatto che la curva, dopo aver raggiunto il suo massimo intorno a f = 200, comincia a oscillare. Questi massimi locali sono chiamati «picchi acustici» poiché riflettono una chiara predizione teorica che, in uno stadio iniziale dell'universo, concentrazioni locali di materia avrebbero iniziato a cadere verso l'interno e poi o a rimbalzare o a cadere attraverso esse stesse (che è quello che ci si aspetterebbe per la materia oscura), dando come risultato una specie di oscillazione sonora. La tipica scala a cui avverrebbe questa oscillazione sarebbe controllata dalla grandezza dell'orizzonte al decoupling (vedi fig. 28.Sa, e si immagini che i punti u e v si muovano sulla superficie di decoupling finché i loro passati si tocchino; questa è la grandezza dell'orizzonte). 45 È a questa scala che si trova il picco principale. Tuttavia, vi è un problema riguardo a quale separazione angolare nel cielo corrisponda una determinata separazione di distanza locale nell'universo al momento della ricombinazione, ed è qui che la curvatura spaziale dell'universo svolge un ruolo importante, poiché i picchi acustici vengono spostati in un senso o nell'altro secondo il valore di K (verso valori più bassi per K positivo e più grandi per K negativo). Il problema non è però abbastanza chiaro, perché anche il ritmo di espansione dell'universo ha un ruolo in ciò, e pertanto sono necessari calcoli dettagliati. In conclusione, questo genere di f
775
LA STRADA CHE PORTA ALLA REALTÀ
analisi della radiazione di fondo è generalmente coerente con K = O, ma vi è ancora posto per un valore positivo o negativo di K che sarebbe di significato osservativo. I risultati per valori elevati di sembrano così essere coerenti con le previsioni dell'inflazione (e vi è anche un'invarianza di scala nelle fluttuazioni di temperatura osservate che fu anche una predizione di alcuni modelli inflazionari). Ma per quanto riguarda i valori bassi di€? Il valore O non è molto illuminante, poiché descrive solo l'intensità globale. Che cosa dire di 1 (il «momento di dipolo»)? Questo non ci dice alcunché circa l'universo distante, perché il moto della Terra attraverso la radiazione di fondo conduce a uno spostamento Doppler asimmetrico (vedi esercizio [27.10]), che dà origine a una distribuzione di temperatura di = I con una temperatura percepita legge1mente più alta nella direzione di moto e leggermente più bassa nella direzione opposta. Il primo valore significativo, dal punto di vista cosmologico, è 2 (il «momento di quadrupolo»). In realtà, a questo punto si vede una discrepanza con le predizioni di invarianza di scala dell'inflazione, discrepanza che è confermata da alcune armoniche successive. La discrepanza è piccola, ma sembra essere ragionevolmente chiara. L'implicata rottura dell'invarianza di scala può essere interpretata come qualcosa che sulle scale più grandi differisce dalla geometria K = O, probabilmente indicando che o K > O o K < O, poiché il «raggio di curvatura» fornisce una simile scala. Queste riflessioni ci lasciano in uno stato affascinante ma decisamente non definito. Si dovrebbe però tenere a mente che il grafico di fig. 28.19 fa realmente un uso molto limitato delle informazioni che sono contenute nella mappa delle temperature di WMAP. Per ciascun valore di vi sono 2 l diversi valori di m, ognuno con unparametro reale. La maggior parte di quella informazione è ignorata in questa analisi, e vi devono essere enormi quantità di dati nascosti che ci dicono qualcosa, probabilmente di grande importanza, sull'universo primordiale. Qui, cito soltanto un modo alternativo di analisi di questi dati, dovuto principalmente a Vahe Gurzadyan (1992, 1994, 1997, 2002, 2003, 2004) che sembra avere straordinarie conseguenze. In questo approccio, non è impiegata un'analisi armonica; si esaminano, invece, le distorsioni nella forma di regioni distanti di ciascuna particolare temperatura, dovute all'intercorrente curvatura spaziale. Se immaginiamo che la forma non distorta di una simile regione sia effettivamente circolare, gli effetti di curvatura potrebbero far sì che diventi ellittica (si ricordi fig. 28.15). Naturalmente, in pratica, non conosciamo la forma della regione che osserviamo, ma vi possono essere effetti statistici che fanno sì che le regioni di una temperatura specifica diventino più (o meno) allungate e sottili di ciò che altrimenti sarebbero. Questa è chiaramente una parte delicata di analisi statistica, ma la conclusione a cui Gurzadyan e i suoi colleghi sono giunti è che vi è davvero una significativa quantità di ellitticità nelle mappe di microonde (inizialmente COBE, poi
e
e=
e=
e
e=
e,
776
e+
Teorie speculative su/l'universo primordiale
BOOMERANG e successivamente WMAP). Che cosa significa questo? L'analisi teorica di questa situazione ci dice che soltanto con K < O possiamo aspettarci questo grado di ellitticità - come risultato di «mescolamento geodetico». Questi risultati sono recenti e perciò si dovrà attendere per vedere se verranno rivolte significative obiezioni a questa notevole conclusione. Questa analisi fornisce anche prove indipendenti per una costante cosmologica positiva con circa la stessa grandezza fornita dai dati sulle supernove. Quindi si conclude che la curvatura negativa è piccola, nel senso che Qd + QA non può essere molto diverso da uno, avendo forse un valore di circa 0.9. Ciò mette in risalto un enigma che ha angustiato molti cosmologi. Le grandezze D1, , Qd e QA non sono costanti nel tempo. Nei primi stadi dell'universo Qb e Qd sarebbero state molto più grandi e QA molto più piccola. Negli ultimissimi stadi dell'universo Dz, e Dc1 diventerebbero trascurabili, mentre QA dominerebbe la densità efficace di massa-energia. L'apparente coincidenza in base alla quale QA e Q" sono dello stesso ordine di grandezza assomiglia a una sconcertante coincidenza. Curiosamente, sembra che il termine «costante cosmologica» sia quasi andato fuori moda non appena è stato scoperto dalle osservazioni, nonostante fosse la terminologia standard utilizzata dalla sua introduzione teorica da parte di Einstein, nel 1917. Adesso invece A è chiamata «energia oscura», o «energia di vuoto», o alcune volte «quintessenza», forse perché il termine «costante cosmologica» non è abbastanza misterioso, o forse, più razionalmente, perché la presenza della parola «costante» implica che A non possa variare col tempo! Probabilmente molti cosmologi sarebbero più felici con una A variante, ritenendo che l'attuale «A» rappresenti l'inizio di una «nuova fase inflazionaria», in cui evidenziano la somiglianza con la presunta primissima fase inflazionaria dell'universo. Si ricordi, da §28.4, che si ritiene che questa sia stata dominata da un «falso vuoto» in cui vi era una costante cosmologica efficace così grande da dominare completamente tutta la (già enormemente densa) materia ordinaria. Se all'universo in quei giorni era stato permesso di avere una «A» efficace che era così tanto diversa dal valore che troviamo oggigiorno - così prosegue il ragionamento - dovremmo senz'altro ammettere una A «variabile» con la conseguenza che il termine «costante cosmologica» non sarebbe appropriato. Questa idea, tuttavia, per quanto a molti possa sembrare attraente, incontra difficoltà con la matematica, poiché il termine «costante cosmologica» era stato introdotto per buoni motivi. La costanza di A è una diretta conseguenza dell'equazione di conservazione dell'energia vaT 1, =Odi §§19.5-7, poiché l'aggiunta di un multiplo di g 0 b a T0 b può lasciare indisturbata quella equazione di conservazione solo se quel multiplo è una costante.l2 8· 13 l In que0
[28. I 3] Perché? 777
LA STRADA CHE PORTA ALLA REALTÀ
sto modo, la non costanza di «A» dovrebbe essere accompagnata da una compensante non conservazione della massa-energia della materia. È certamente molto più comodo, dal punto di vista teorico, avere A costante - coerentemente con le osservazioni. Dove ci lascia tutto ciò? Certamente in una posizione interessante. Io non trovo che la cosmologia inflazionaria sia «confermata» da queste osservazioni e, anche se lo fosse, questo non risolverebbe il problema cosmologico che a mio parere oscura tutti gli altri, ossia lo straordinariamente «speciale» Big Bang - almeno fino a una parte su 10 10 "' - che è alla base della seconda legge della termodinamica. Alcuni cosmologi riterrebbero inaccettabile la «sintonizzazione fine» implicata in questo (vedi fig. 27.20), tentando di «spiegarla» in termini di inflazione o del principio antropico (§§28.5,7), anche se, come abbiamo visto, tali procedure ci lasciano molto lontano dalla verità. Difatti, vi è un problema fondamentale che io trovo con qualsiasi proposta (per esempio l'inflazione o la proposta di Hartle-Hawking) che tenti di affrontare il problema delle singolarità spaziotemporali entro una fisica chiaramente simmetrica rispetto al tempo. Nella cosmologia inflazionaria non vi è alcuna asimmetria temporale e, per quanto ne so io, neppure nella proposta di Hartle-Hawking, e quindi questa proposta dovrebbe essere applicata anche alle singolarità finali di collasso (in buchi neri, o nel Big Crunch se ve n'è uno) così come al Big Bang. Hawking (1982) ha sostenuto che questo può essere, ma in un modo decisamente esotico, poiché lo spazio in prossimità di una singolarità finale è «chiuso senza frontiera», riportando l'universo indietro al Big Bang, poiché «l'euclidizzazione» è applicata soltanto là (fig. 28 .18) ! Il suo ragionamento si basa sul fatto che la proposta «senza frontiera» afferma soltanto che vi è qualche modo di chiudere le cose senza frontiera, definendo «l'inizio» (che determina il senso del tempo nell'universo) come l'estremità in cui avviene la chiusura. Devo dire che ho grandi difficoltà con questo argomento - e, in verità, con qualunque argomento in cui non vi è alcuna esplicita asimmetria temporale nelle stesse leggi fisiche. (Vargomento «esotico» di Hawking, per esempio, supporrebbe ancora l'esistenza di una «frontiera», alla singolarità finale di collasso, anche se vi è stata una chiusura liscia senza alcuna frontiera soltanto «dall'altro lato» dello spaziotempo. Mi sembra che ci si sia occupati soltanto di metà del problema riguardante l'eliminazione della frontiera.) Dobbiamo allora affrontare la possibilità di una fisica fondamentale realmente asimmetrica temporalmente come sto affermando? Nel capitolo 30 mi confronterò direttamente con questo problema! Scopriremo che è collegato con qualcosa di profondamente misterioso che abbiamo lasciato in sospeso nei capitoli sulla meccanica quantistica. Nel prossimo capitolo, quindi, avrò bisogno di riprendere questo importante enigma quantistico; poi, nel capitolo 30, presenterò le mie idee riguardo la via giusta per la sua risoluzione e, 778
Teorie speculative sull'universo primordiale
quindi, anche per la risoluzione finale del problema dell'asimmetria temporale della singolarità. Devo comunque rivolgere nuovamente al lettore il solito dovuto avvertimento: molti fisici potrebbero non essere d'accordo con la posizione che assumerò.
Note 1. Vedi, per esempio, Weinberg (1992), p. 195, in cui viene impiegato l'esempio del ferromagnetismo, che sembra essere quasi universale nelle esposizioni popolari degli esperti. Dobbiamo tenere a mente, tuttavia, che questa è una notevole idealizzazione, per un corpo di vero ferro, in cui gli effetti dettagliati delle forze possono essere molto complicati. Mentre per regioni abbastanza piccole dentro il ferro questa tendenza alla magnetizzazione può essere una buona approssimazione, queste regioni tendono a essere, in pratica, orientate a caso, così che il ferro come un tutto non fornisce un magnete efficace. Inoltre, affinché il ferro diventi significativamente magnetizzato, il raffreddamento attraverso il punto di Curie dovrebbe essere estremamente lento, e non è quindi facile realizzare la situazione ideale. Nel caso della nostra discussione teorica è appropriato ignorare queste complicazioni e accettare l'idealizzazione che è descritta. 2. I.;effetto tunnel quantistico avviene quando un sistema quantico compie spontaneamente una transizione da uno stato a un altro di energia inferiore (con emissione dell'eccesso di energia), quando una barriera energetica impedisce che questo avvenga classicamente. 3. In questo esempio, è stata esclusa la riflessione, a causa della «S» in SO(2). 4. Questo «gruppo appropriato» sembra essere il gruppo SU(3) x SU(2) x U(l)/Z 6 • 5. Vedi nota 1. 6. Vedi Vilenkin (2000); Gangui (2003); Sakellariadou (2002). 7. Questa teoria è principalmente associata all'astrofisico britannico Sir Martin Rees. Vedi Haehnelt (2003) per una rassegna e ulteriori referenze. 8. Vedi Chan e Tsou (1993). 9. La collaborazione MACRO ha posto limiti stringenti alla frequenza di queste particelle. Vedi MACRO (2002). 10. Questa connessione sarebbe inizialmente considerata come una connessione di gauge V sul fibrato più piccolo ~ su ?lt, le cui fibre sono gli spazi U(2)-simmetrici o di leptoni in ciascun punto. Ma, proprio nello stesso modo con cui, come in §14.3, nell'ordinario calcolo tensoriale, la conoscenza di come V agisce sui vettori fissa completamente come agisce su tensori generali, la conoscenza del1' azione di V su ~ determina completamente la sua azione sui «tensori» definiti da.è'. Possiamo ritenere che lj, sia.è'* ® L (un «indice» in basso, uno in alto). 11. Il «red shift» z è definito in modo che 1 + z misuri il fattore con cui la lunghezza d'onda è aumentata. Liddle (1999) è il testo più accessibile; Dodelson (2003) è una trattazione più avanzata. 12. Si potrebbe pensare a un possibile ruolo per una connessione di tipo quanglement (vedi §23 .1 O) tra q e r; vale certamente la pena di prenderlo in considerazione, ma va al di là delle attuali idee di «rottura spontanea di simmetria». Il mio modo di pensare su tali questioni è stato influenzato da conversazioni con George Sparling e Bikash Sinha. 779
LA STRADA CIIE PORTA ALLA REALTA
13. Vedi Llewellyn Smith (1973). 14. Vedi Schrodinger ( 1956). 15. Vedi Guth (1997). Dodelson (2003) o Liddle e Lyth (2000) sono fonti tecniche. Per una scrupolosa e critica rassegna, Borner (2003) è caldamente raccomandato. 16. Vedi Barbour (2001 a, 200 I b ); Sciama ( 1959); Smolin (2002). Un esempio di approccio fisico interamente «machiano» è quello delle reti di spin, brevemente descritto in ~32.6. 17. Vedi Ozsvath e Schi.icking ( 1962, 1969). 18. Vi sono prospettive più nuove su questi problemi, che possono forse essere interpretate come sostegno al fatto che la teoria di Einstein sia, dopo tutto, «machiana)). Vedi Barbour (2004); Barbour e altri (2000); Raine (1975). 19. Questi desiderata estetici sono sostenuti, in modo specifico, nel popolare resoconto di Mario Livio. Vedi Livio (2000). 20. Vi è stato un precursore di questo punto di vista nella cosiddetta «cosmologia caotica)), proposta indipendentemente negli anni Sessanta eia Charles W. Misner e eia Yakov B. Zeldovich, in cui era immaginato uno stato iniziale casuale, e nonostante l'apparente conflitto fondamentale con la seconda legge, processi termici sono invocati nel tentativo di lisciare l'universo. Vedi Misncr (1969) per il lavoro originario. 21. La migliore proposta per una struttura probabilmente caotica in questa generica singolarità viene dal lavoro del 1970 cli Belinskii e altri ( 1970). 22. Vedi nota 21 del capitolo 27, che fornisce le referenze rilevanti. 23. Credo cli aver udito per la prima volta di questa idea antropica «debole)) nel corso cli conversazioni radiofoniche di Fred Hoyle alla BBC negli anni Cinquanta. Sono venuto a conoscenza per la prima volta della forma più forte ciel principio antropico, che affronta la questione ciel ruolo «antropico» delle costanti fisiche fondamentali, da una delle conferenze a Cambridge di Hoyle sul tema «Religione come Scienza», che faceva riferimento al fatto che la formazione degli elementi pesanti nelle stelle esige uno specifico livello energetico nucleare nel carbonio. 24. Vedi Dicke (1961) e Carter (1974). 25. Vedi Dirne (1937). 26. Vedi Dirne ( 1938); Buckley e Peat ( 1996); Guenther e altri (1998). Per una recente idea di «costante variabile» vi è un divertente resoconto in Magueijo (2003). 27. li mio uso qui del termine «principio antropico forte)) segue quello cli Carter (I 974). Barrow e Tipler ( 1988) lo spezzano in categorie differenti. 28. Vedi Hoyle e altri (1956); Burbiclge e altri (1957). 29. Vedi Hawking e Penrose (1970). 30. Vedi Smolin ( 1997). 31. Nel mio saggio Adams Prize del 1966, vedi Penrose (I 966), ho proposto una simile idea (ma senza il riaggiustamento delle costanti fisiche) in modo non serio! Forse anche altri lo hanno fatto in precedenza. 32. Vedi Penrose (1989). 33. Un punto di vista alternativo mi è stato rivelato da Abhay Ashtekar: vi potrebbe essere qualcos'altro, diverso dalla «gravità quantistica)), che determina la natura straordinariamente speciale del Big Bang. Può essere, ma sono colpito dal fatto che quello che era speciale al Big Bang era la gravità, e apparentemente soltanto la gravità. 34. In realtà, soltanto la parte a traccia nulla del tensore di Ricci, R"1, - ', Rg 1,, è qui rilevante, mentre la costante cosmologica non svolge alcun ruolo. 35. Vedi Penrose ( 1998) per una visione d'insieme generale della censura cosmica. 11
780
Teorie speculative sull'universo primordiale
36. Vedi Newman (1993); Claudel e Newman (1998); Tod e Anguine (1999a, 1999b); Anguine (1999). Una versione particolarmente attraente dell'ipotesi di curvatura di Weyl è quella proposta da K. P. Tod, che asserisce semplicemente che, in qualunque singolarità iniziale, vi è una geometria conforme regolare con frontiera. 37. Vedi Wick (1956) per il primo impiego di questa tecnica, che è utilizzata in Zinn-Justin (1996) con grandi e frequenti effetti. 38. Vedi Hartle e Hawking (1983). 39. Un recente lavoro di Renate Loll suggerisce che vi possono essere profonde differenze tra l'uso di metriche riemanniane nell'integrale sui cammini, come nella proposta di Hawking, e metriche lorentziane più direttamente appropriate. Vedi Ambjorn e altri (1999). 40. Vedi Hawking e Turok (1998). 41. Vedi Bucher e altri (1995) e Linde (1995). 42. Mordehai Milgrom ha avanzato l'affascinante suggerimento che non vi sia alcuna materia oscura, ma che, invece, la dinamica gravitazionale di Newton necessiti di cambiamenti in un modo diverso da quello di Einstein, dove per accelerazioni molto basse l'effetto della gravità è aumentato in modo specifico. Anche se sembra che questa idea sia in notevole accordo con i fatti, non vi è ancora alcuna teoria coerente e sensata. Ritengo che queste idee non convenzionali non debbano essere solo liquidate, perché potrebbe valere la pena di vedere se questo schema possa entrare a far parte di un più ampio punto di vista coerente. (Io non sono stato in grado di capire come farlo!) 43. Vedi Krauss (2001) per un'accessibile discussione della materia oscura (e anche della «energia oscura» -vale a dire una possibile A variante). 44. Vedi Blanchard e altri (2003). Per una interpretazione più «convenzionale», vedi Perlmutter e altri (1998); Bahcall e altri (1999). 45. Dodelson (2003) spiega come fare questo e la collegata analisi dei dati CMB.
CAPITOLO
29
IL PARADOSSO DELLA MISURA
29.1 Le ontologie convenzionali della meccanica quantistica La meccanica quantistica è stata senza alcun dubbio una delle massime conquiste del ventesimo secolo. Spiega moltissimi fenomeni che erano considerati profondamente sconcertanti nel secolo precedente, come l'esistenza delle linee spettrali, la stabilità degli atomi, la natura dei legami chimici, le forze e i colori dei materiali, le transizioni di fase solido/liquido/gas, il ferromagnetismo e i colori dei corpi caldi in equilibrio termico con l'ambiente (radiazione di corpo nero). Persino alcune enigmatiche questioni della biologia, come la straordinaria affidabilità dell'eredità, devono la loro origine ai principi quantistici, come è stato ora accertato. Questi fenomeni - così come molti altri scope1ii nel ventesimo secolo, come i cristalli liquidi, la superconduttività e la superfluidità, il comportamento dei laser, i condensati di Bose-Einstein, la strana non località degli effetti EPR e il teletrasporto quantistico - sono attualmente compresi ottimamente sulla base del formalismo matematico della meccanica quantistica. Questo formalismo ha prodotto in effetti una rivoluzione nella nostra rappresentazione del mondo fisico reale che è molto più grande persino di quella provocata dallo spazio curvo della relatività generale di Einstein. È proprio così? Molti fisici sostengono che la meccanica quantistica non ci fornisca affatto una rappresentazione della «realtà»! In base a questa concezione, il formalismo della meccanica quantistica viene considerato solo un fonnalismo matematico. Questo formalismo non ci dice nulla riguardo un'effettiva realtà quantistica del mondo, ma ci consente soltanto di computare probabilità per realtà alternative che potrebbero avvenire. C ontologia di questi fisici quantistici - per quanto potrebbero essere preoccupati da questioni di «ontologia» rappresenterebbe il punto di vista in base al quale (a) non vi è semplicemente alcuna realtà nel formalismo quantistico. All'altro estremo, vi sono molti fisici quantistici che assumerebbero il punto di vista (all'apparenza) diametralmente opposto in base al quale (b) lo stato quantico in evoluzione unitaria descrive completamente l'effettiva realtà, con l'allarmante implicazione per cui praticamente tutte le alternative quantistiche devono sempre continuare a coesistere (in 782
Il paradosso della misura
sovrapposizione). Come già accennato in §21.8, la difficoltà fondamentale che incontrano i fisici quantistici e che porta molti di loro a tali opinioni è il contrasto tra i due processi quantistici U e R, dove (§22.1) U è il processo deterministico di evoluzione unitaria (come può essere descritto dall'equazione di Schrodinger) e R è la riduzione dello stato quantico che avviene quando è effettuata una «misurazione». Il processo U, quando fu scoperto, era familiare ai fisici: la chiara evoluzione temporale di una definita grandezza matematica, e precisamente il vettore di stato Il/1), detenninata da un'equazione differenziale (alle derivate parziali)- poiché l'evoluzione temporale dell'equazione di Schrodinger è molto simile a quella delle classiche equazioni di Maxwell (vedi §21.3 ed esercizio [19.2)). D'altra parte, per questi fisici il processo R era anche qualcosa di completamente nuovo: un salto discontinuo e casuale di questa stessa Il/1), dove sono determinate soltanto le probabilità dei diversi risultati. Se la fisica del mondo osservato fosse stata semplicemente descritta da una grandezza Il/1), agente soltanto secondo U, i fisici non avrebbero avuto alcuna seria difficoltà ad accettare che U fornisca un processo «fisicamente reale» di evoluzione per un vettore di stato Il/1) «fisican1ente reale» Ma questo non è il modo con cui si comporta il mondo osservato; sembra invece che vi sia una curiosa combinazione di U con l'intromissione, di tanto in tanto, del diversissimo processo R! (Si ricordi fig. 22.1.) Ciò rese molto più difficile ai fisici credere che Il/1) potesse, dopo tutto, essere effettivamente una descrizione della realtà fisica. Lo sconcertante problema che riguarda il modo in cui R possa verificarsi, mentre si suppone che lo stato si stia evolvendo secondo U, è il problema della misura o, come preferisco chiamarlo, il paradosso della misura - della meccanica quantistica (brevemente discusso in §23.6 e accem1ato in §21.8 e §22.1). Il punto di vista (a) è fondamentalmente l'ontologia della interpretazione di Copenaghen come specificamente formulata da Niels Bohr, che riteneva che Il/1) non rappresentasse una realtà di livello quantistico, ma semplicemente un qualcosa che desc1iveva la «conoscenza», da parte dello sperimentatore, di uno stato quantico. Il «salto», secondo R, doveva allora essere considerato semplicemente come un mezzo, da paiie dello sperimentatore, per acquisire una maggiore conoscenza del sistema, e perciò il salto è realizzato dalla conoscenza, non dalla fisica del sistema. Secondo (a), non si dovrebbe chiedere che una qualche «realtà» sia assegnata ai fenomeni di livello quantistico, poiché la sola realtà riconosciuta è quella del mondo classico in cui si trova l'apparato dello sperimentatore. Come variante di (a), si potrebbe assumere il punto di vista per cui questo «mondo classico» non intervenga al livello di qualche pezzo di «strumentazione macroscopica» che costituisce l'apparato di misurazione dell'osservatore, ma al livello della consapevolezza dell'osservatore stesso. Tra poco discuterò queste alternative più dettagliatamente. I sostenitori dell'alternativa (b ), d'altra parte, considerano proprio che Il/1) rappresenti la realtà, ma negano del tutto che avvenga R. Essi sostengono che, quando ha luogo una misurazione, tutti i risultati alternativi in realtà coesisto783
LA STRADA CHE PORTA ALLA REALTÀ
no, in una grande sovrapposizione quantistica lineare di universi alternativi. Questa grande sovrapposizione è descritta da una funzione d'onda Ilfl) per l 'intero universo. Spesso viene chiamata «multiverso», 1 ma io credo che omnium 2 sia un tennine più appropriato. Infatti, nonostante questa opinione in termini colloquiali sia espressa solitamente come credenza nella coesistenza parallela di differenti mondi alternativi, questo è fuorviante. I mondi alternativi non «esistono» realmente in modo separato, secondo questa opinione; soltanto l'ampia sovrapposizione particolare espressa da Ilfl) è considerata reale. Perché, secondo (b ), l'omnium non è percepito come vera «realtà» da uno sperimentatore? L'idea è che anche gli stati mentali dello sperimentatore coesistano nella sovrapposizione quantistica, poiché questi diversi stati mentali individuali sono entangled con i diversi risultati possibili della misurazione in corso di effettuazione. Perciò si ritiene che vi sia effettivamente un «mondo diverso» per ciascun diverso risultato possibile della misurazione, e che vi sia una «copia» distinta dello sperimentatore in ciascuno di questi diversi mondi, che coesistono tutti in sovrapposizione quantistica. Ciascuna copia dello sperimentatore registra un diverso risultato del!' esperimento, ma poiché queste «copie» abitano mondi diversi, non vi è comunicazione tra loro e ciascuno pensa che vi sia stato un solo risultato. Spesso i sostenitori di (b) affermano che la richiesta in base alla quale uno sperimentatore abbia un coerente «stato di consapevolezza» dà l'impressione che vi sia soltanto «un unico mondo» in cui R sembra aver luogo. Tale prospettiva è stata proposta esplicitamente per la prima volta da Hugh Everett III nel 19573 (sospetto che molti altri, non sempre con convinzione, abbiano assunto questo punto di vista in precedenza - come ho fatto io stesso a metà degli anni Cinquanta senza avere però il coraggio di dirlo apertamente!). Nonostante la loro natura diametralmente opposta, i punti di vista (a) e (b) hanno alcuni significativi punti in comune riguardo al modo con cui si ritiene che Ilfl) sia collegato alla «realtà» effettivamente osservata - con ciò intendo il mondo apparentemente reale che, su scala macroscopica, tutti percepiamo. In questo mondo osservato, si pensa che un esperimento abbia un solo risultato, e noi possiamo giustamente ritenere che il compito della fisica sia spiegare o modellare ciò che normalmente chiamiamo «realtà». Né secondo (a), né secondo (b ), si ritiene che il vettore di stato Ilfl) descriva questa realtà; e, in ogni caso, dobbiamo far intervenire le percezioni di qualche sperimentatore umano per comprendere come il fonnalismo sia connesso a questo mondo reale osservato. Nel caso (a) si suppone sia lo stesso vettore di stato llfl) a essere definito in termini delle percezioni dello sperimentatore mnano, mentre nel caso (b) la «ordinaria realtà» che viene in qualche modo delineata in termini delle percezioni dello sperimentatore, poiché il vettore di stato Ilf/) rappresenta ora qualche tipo di realtà dominante più profonda (l'omnium) che non è direttamente percepita. In entrambi i casi si ritiene che il «salto» R non sia fisicamente reale, perché è, in un certo senso, «tutto nella mente»! 784
li paradosso della misura
Spiegherò le personali difficoltà che incontro con entrambe le posizioni (a) e (b) a momento debito, ma prima di farlo vorrei menzionare un'altra possibilità per l'interpretazione della meccanica quantistica convenzionale. Per quanto ne so, questa interpretazione è la più diffusa tra i punti di vista quantistici - la decoerenza ambientale (c) - sebbene sia forse più una posizione pragmatica che ontologica. !.;idea di (c) si basa sul fatto che in qualsiasi_misurazione il sistema quantico in considerazione non può essere ritenuto isolato da quello che gli sta vicino. Perciò, quando viene effettuata una misurazione, ciascun risultato diverso non costituisce uno stato quantico per conto proprio, ma deve essere considerato parte di uno stato entangled (§23.3), dove ciascun risultato alternativo è entangled con un differente stato dell'ambiente. !.;ambiente consiste di un grandissimo numero di particelle, effettivamente in moto casuale, per cui si deve ritenere che i dettagli completi delle loro posizioni e movimenti siano in pratica totalmente inosservabili.4 Vi è una procedura matematica ottimamente definita per trattare questo genere di situazione in cui vi è una fondamentale mancanza di conoscenza: si «somma sm> gli stati incogniti dell'ambiente per ottenere una descrizione dello stato fisico in considerazione nota come matrice densità. Le matrici densità sono importanti per la discussione generale del problema della misura nella meccanica quantistica (e sono importanti anche in altri contesti), ma la loro posizione ontologica è difficile da chiarire. Spiegherò molto brevemente (in §29.3) che cos'è una matrice densità; tuttavia, più avanti vedremo perché è importante per la posizione (c) che l'ontologia della matrice densità non sia completamente chiarita! I sostenitori del punto di vista ( c) tendono a considerarsi «positivisti» che non s'interessano di «insulsi» problemi di ontologia, asserendo di non avere alcun rapporto con ciò che è «reale» e con ciò che «non è reale». Come ha detto Stephen Hawking: 5 Non chiedo che una teo1ia conisponda alla realtà perché non so cosa sia la realtà. La realtà non è qualcosa che potete misurare con la cartina di tornasole. Tutto ciò che mi interessa è che la teoria preveda risultati delle misurazioni.
Io ritengo, d'altra parte, che il problema dell'ontologia abbia un'importanza cruciale in meccanica quantistica, sebbene sollevi alcune questioni che attualmente sono ben lungi dall'essere risolte.
29.2 Ontologie non convenzionali per la teoria quantistica Prima di scendere nei dettagli, prenderò in esame altri tre punti di vista generali riguardo alla meccanica quantistica. Non si deve ritenere che la mia lista sia in qualche modo esauriente, e neppure che questi punti di vista siano completamente indipendenti da quelli che ho riportato nella sezione prece785
LA STRADA CHE PORTA ALLA REALTÀ
dente. La lista (a), (b), (c), (d), (e), (t) che qui considero rappresenta le opinioni che si trovano più di frequente in letteratura, ma non rivendico alcun tipo di completezza, indipendenza o specificità della mia lista. Le altre tre ontologie che qui esamino rappresentano effettivi cambiamenti nel solito formalismo quantistico, ma per due di esse, (d) e (e), non si prevedono distinzioni sperimentali tra il formalismo proposto e quello standard della meccanica quantistica. Il punto di vista (d) è l'approccio delle «storie coerenti», dovuto a Griffiths, Omnès e Gell-Mann/Hartle, mentre quello (e) è l'ontologia della «onda pilota» di de Broglie e Bohm/Hiley. 6 L'ultima possibilità (t) si basa sul fatto che l'attuale meccanica quantistica sia soltanto un'approssimazione a qualcosa di meglio e che- in questa teoria migliorata - U e R abbiano luogo oggettivamente come processi reali. Inoltre, fa parte del punto di vista (t) la prospettiva in base alla quale alcuni esperimenti futuri dovrebbero permettere di distinguere una simile teoria dalla meccanica quantistica convenzionale. Appena avremo gli strumenti necessari, tenterò di esprimere le mie valutazioni delle varie alternative; tuttavia, affinché il lettore possa assumere un adeguato atteggiamento obiettivo su queste valutazioni, è meglio che io «sia sincero» fin da ora sulla mia posizione. Io sono un forte sostenitore del fatto che siano necessari alcuni sviluppi in linea con (t), affinché la meccanica quantistica possa acquistare un senso completamente coerente. Nel prossimo capitolo, proporrò effettivamente la particolare versione di (f) che mi sembra la più naturale. Facciamo ora una lista di queste alternative, per aiutare il lettore a ricordarle esplicitamente. (a) «Copenaghen» (b) molti mondi (c) decoerenza ambientale (d) storie coerenti (e) onda pilota (t) nuova teoria con un R oggettivo Per prima cosa vorrei fare alcune osservazioni su (d) ed (e), poiché non le ho spiegate realmente. Lo schema (d) delle «storie coerenti» fornisce una generalizzazione della struttura standard della teoria quantistica. Alcuni suoi sostenitori hanno dato a (d) un'ontologia molto simile a quella dei molti mondi (b ), sebbene sotto un certo aspetto sia persino più stravagante - ma, per quanto posso vedere, una simile ontologia stravagante può decisamente essere non necessaria. Sia in (b) sia in (d) possiamo assumere la posizione che abbiamo, come ingredienti fondamentali, uno spazio di Hilbert H, uno stato di partenza Ilf/o) appartenente a H e una hamiltoniana -;?I, 7 Nel caso (b) dei molti mondi, la posizione ontologica ritiene che la realtà (dell'omnium) 786
Il paradosso della misura
sia descritta da una famiglia continua a un parametro di stati (elementi di H con parametro temporale t), partendo con I!fio) a t = O e completamente governata, per t > O, dall'evoluzione di Schrodinger determinata da -;;?I, Non vi è qui alcun R, soltanto U; ma nel caso (d) delle storie coerenti consideriamo anche storie d'universo in cui anche «procedure di tipo R» sono incorporate nella sua «evoluzione» - sebbene non si ritenga che queste siano necessariamente associate in alcun modo a reali misurazioni. Per comprendere la natura matematica di queste procedure, dobbiamo per prima cosa ricordare, da §§22.5, 6, in che modo viene descritta una misurazione quantistica dal punto di vista matematico (anche se per (d) non pensiamo a queste procedure come misurazioni), in termini dell'azione di un operatore Q hermitiano (o normale). Se, appena prima della misurazione, lo stato del sistema è 11/1), subito dopo la misurazione si ritiene che «salti» nell'autostato di Q corrispondente all'autovalore di Q, che la misurazione produce. Per quanto riguarda il suo effetto su 11/1), possiamo rimpiazzare Q con un «insieme completo di proiettori ortogonali» E 1, E2 ,E3, .. . , E,. (dove supponiamo che Q abbia solo r autovalori distinti, assumendo per comodità che lo spazio di Hilbert H sia finito dimensionale). Allora, se la misurazione produce l'autovalore q1, troviamo che 11/1) salta in uno stato proporzionale a Ej ilfl) (postulato della proiezione). Guardiamo tutto ciò più dettagliatamente. Ricordiamo da §22.6 che un proiettore è un operatore E hermitiano il cui quadrato è se stesso, vale a dire
E2 =E=E*. L'affermazione per cui i proiettori E 1, •• • , E,. sono ortogonali tra loro è
E; Ej = O quando i -:f. j e la loro completezza è data dal fatto che la loro somma sia l'operatore identità I su H:
E 1 + E2 + E3 + ... +E,.= I. Un insieme di E che soddisfa tutte queste condizioni è chiamato semplicemente insieme di proiettori. La connessione tra Q e il relativo insieme di proiettori è data dal fatto che per ciascun autovalore qj di Q, il corrispondente spazio di autovettori consista dei vettori della forma E)~;:t = Elx>,
ili
at> = Elcp),
e ciascuna ci dà un autostato dell'energia con autovalore E. Se la sovrapposizione è rappresentata come lo stato
IP)= wlx> + zl
t
~
riflessioni m u l t i p l e ~ , •:.:,',',', ,
~,
\
,,
-~'"" 11
( ., cavtta
~
Fig. 30.26 - Una versione più pratica di «FELIX» non utilizza raggi X, ma richiede circa 106 impatti sul minuscolo specchio da parte di un fotone della luce visibile, al posto del singolo impatto da parte di un fotone X. 859
LA STRADA CHE PORTA ALLA REALTÀ
ciamo circa 10-33 di joule - sia sufficiente per dare un tempo di collasso così «ragionevole» come questo decimo di secondo o meno. La piccolezza degli effetti gravitazionali ha generalmente indotto molti fisici a trascurarli completamente. Tuttavia, vediamo che l'effetto dell'introduzione di considerazioni gravitazionali nella nostra rappresentazione quantistica potrebbe avere profonde conseguenze osservative. Si dovrebbe notare che la scala temporale n/E0 implica il quoziente delle due piccole grandezze 1ì e G, e così non necessita di essere una grandezza piccola nel comune senso umano. Questo è in netto contrasto con le grandezze caratteristiche della gravità quantistica, la lunghezza e il tempo di Planck (§27.1 O, §31.1 ), che hanno valori assurdamente piccoli di 10--33 cm e 10-43 s, provenienti dal prodotto di 1ì e G. Immaginiamo che un esperimento per testare lo OR gravitazionale sia stato realizzato con successo; se la coerenza di fase non è persa nelle scale temporali predette dallo schema OR gravitazionale prima delineato, allora questo schema dovrà essere abbandonato - o almeno seriamente modificato. Se però avviene che i risultati di questi esperimenti supportano le previsioni del processo OR gravitazionale? Possiamo allora concludere che la riduzione dello stato quantico è davvero un effetto gravitazionale oggettivo? Temo che molti potrebbero ancora preferire di restare fedeli a uno dei punti di vista più «convenzionali» riguardo tale questione. Potrebbero ancora sostenere, per esempio, che la rigorosa unitarietà (U) è preservata, mentre parte dello stato diventa inaccessibile-forse perso in «fluttuazioni quantistiche nel campo metrico» (vedi §29.6 e §30.15). Personalmente non ho questo desiderio di resistere a cambiamenti fondamentali di una teoria fisica precedentemente accettata, poiché credo che, nel caso della meccanica quantistica, un cambiamento fondamentale sia davvero necessario - come ho argomentato a lungo prima. Ma forse non è troppo fantasioso fare un paragone con le opinioni di molti fisici stimati, come Lorentz, che preferirono ritenere gli effetti della relatività speciale semplici «correzioni» da applicare entro una visione del mondo del diciannovesimo secolo che accettava uno stato assoluto di riposo. Non vi è alcun dubbio che molti fisici famosi potrebbero essere altrettanto riluttanti ad abbandonare la loro visione del mondo del ventesimo secolo sulla meccanica quantistica, se realmente succedesse che le predizioni del gravitazionale OR fossero supportate da un esperimento di tipo FELIX compiuto con successo. A mio parere, una simile posizione sarebbe retrograda, e rinuncerebbe alla possibilità di compiere nuovi ed efficaci progressi, sulla base di una nuova descrizione quantistica del mondo che potrebbe veramente essere ragionevole! Chi tra noi aspetta che il gravitazionale OR rafforzi i nostri punti di vista meno convenzionali deve naturalmente essere preparato all'eventualità alternativa per cui le nostre opinioni possano essere contraddette da un simile esperimento. Personalmente rimarrei sconcertato di fronte a ciò, nonostante molti fisici quantistici con cui ho parlato di questo argomento abbiano espresso la ferma previsione in base alla quale la meccanica quantistica con860
Il ruolo della gravità nella riduzione dello stato quantico
venzionale ne uscirà ancora una volta indenne. Il mio personale sconcerto sarebbe principalmente dovuto alla convinzione che l'attuale meccanica quantistica non abbia alcuna ontologia credibile, così da dover essere seriamente modificata affinché la fisica del mondo sia ragionevole. Questo, in sé, non implica che sia il gravitazionale OR a venire in nostro soccorso, e neppure che la particolare proposta gravitazionale qui evidenziata debba essere quella corretta. 44 Ciononostante, ho la sensazione che la determinatezza e la capacità di recupero della moderna teoria quantistica non permetteranno che essa venga facilmente mutata. Penso che qualsiasi mutamento di tale genere richieda l'intervento di qualcosa di altrettanto formidabile, e nella fisica nota nulla ha la stessa statura della teoria generale della relatività di Einstein e dei profondi principi che la ispirano. Sono queste le cose che mi spingono ad anticipare uno schema OR gravitazionale come quello che ho suggerito in precedenza. Qualunque sia il risultato finale di tali considerazioni, anticipo che molti efficaci e affascinanti nuovi problemi quantistici verranno sollevati e risolti nel corso del ventunesimo secolo!
30.14 Origine delle fluttuazioni nell'universo primordiale Prima di chiudere il capitolo, desidero sollevare solo uno dei numerosi e importanti problemi che potrebbero essere davvero profondamente influenzati da un cambiamento nelle regole della meccanica quantistica, in accordo con le considerazioni di questo capitolo. In §27.13, ho focalizzato l'attenzione sullo stato straordinariamente speciale nel quale sembra aver avuto inizio l'universo. Fu la sua esatta isotropia e omogeneità spaziale il modo principale in cui questo stato era speciale, e che gli ha dato la sua assurdamente bassa entropia, e perciò la geometria dello spaziotempo dell'universo è (ancora) in notevole accordo con uno degli standard modelli cosmologici FLRW (§27.11). Naturalmente, come spesso si sostiene, l'universo non può essere stato, in modo assoluto ed esatto, un simile modello simmetrico. Se una volta vi fu una tale alta simmetria, sarebbe dovuta rimanere per sempre. Questo perché la dinamica della relatività generale di Einstein - e del resto della fisica classica - preservano esattamente una simile simmetria. Ma per quanto riguarda la fisica quantistica? La «casualità» intrinseca nei processi di evoluzione quantistica permette che nascano deviazioni da questa esatta simmetria? A questo punto è spesso invocata la nozione di «fluttuazioni quantistiche» come mezzo per fornire le necessarie piccole deviazioni dall'esatta simmetria. Videa è che tali «fluttuazioni» possano iniziare come piccolissime, per poi agire come semi di irregolarità nella distribuzione di massa che gradualmente aumenterebbero per agglomerazione gravitazionale, così che infine stelle, galassie e ammassi di galassie sarebbero in grado di svilupparsi - in accordo con le osservazioni. Ma cosa sono le fluttuazioni quantistiche? Una caratteristica delle relazioni 861
LA STRADA CHE PORTA ALLA REALTÀ
d'indetem1inazione di Heisenberg (§21.11), applicate a grandezze di campo (vedi §26.9), è che, se si tenta di misurare con grande precisione il valore di un campo quantistico in qualche piccola regione, questo conduce a un'indeterminazione molto grande in altre grandezze del campo (canonicamente) collegate, e quindi a un valore rapidamente variabile della grandezza che viene misurata. In questo modo, l'atto stesso di accertare il valore preciso di qualche grandezza del campo dà come risultato che quella grandezza fluttua selvaggiamente. Questa grandezza potrebbe essere una componente della metrica spaziotemporale, così vediamo che qualsiasi tentativo di misurare con precisione la metrica risulta in variazioni enormi di questa metrica. Sono state riflessioni di questo genere a condurre John Wheeler, negli anni Cinquanta, a sostenere che la natura dello spaziotempo alla scala di Planck di I 0-33 cm sarebbe una «schiuma» selvaggiamente fluttuante (vedi fine di §29.6 e fig. 29.6). Per chiarire questo quadro, dobbiamo ricordare con cura ciò che le relazioni di indeterminazione di Heisenberg affermano veramente. Esse non ci dicono che vi è qualcosa di intrinsecamente «nebuloso» o «incoerente» nel modo con cui la natura si comporta alle scale più piccole. L'indeterminazione di Heisenberg limita, invece, la precisione con cui possono essere eseguite due misurazioni non commutanti. Si rammenti che, nel caso di una singola particella, la componente della sua posizione e del suo momento in qualche direzione, poiché sono grandezze non commutanti, non possono essere determinate con precisione allo stesso istante, dato che il prodotto dei loro rispettivi errori non deve essere inferiore a (§21.11). Tuttavia, vi è uno stato quantico perfettamente definito e, se non viene eseguita alcuna vera misurazione, lo stato della particella si evolverà precisamente secondo l' equazione di Schrodinger (assumendo che valga la meccanica quantistica standard). In modo analogo, nella meccanica quantistica standard, non possono essere determinate assieme tutte le variabili che definiscono uno stato dello spaziotempo. La descrizione quantistica dello spaziotempo dovrebbe, ciononostante, essere perfettamente definita; il principio di Heisenberg ci dice però che questa descrizione non può rassomigliare a una classica varietà (pseudo )riemanniana, poiché grandezze geometriche spaziotemporali differenti non commutano l'una con l'altra. Invece, in accordo col modello di Wheeler, lo stato consisterebbe in una vasta sovrapposizione di geometrie differenti, la maggior parte delle quali devierebbe selvaggiamente dalla piattezza, avendo così il carattere «simile a schiuma» da lui immaginato. Vediamo adesso come tutto ciò si applica allo stato dell'universo primordiale. Possono le deviazioni dall'esatta simmetria essere davvero attribuite a «fluttuazioni quantistiche», se l'intero stato iniziale possiede l'esatta simmetria cosmologica FLRW? La U evoluzione di questo stato deve continuare a mantenere questa esatta simmetria FLRW, a prescindere da «fluttuazioni quantistiche» o da qualsiasi altra manifestazione dell'indeterminazione di Heisenberg.[30 -141 In che modo questo è coerente con la geometria altamente
¾n
862
Il ruolo della gravità nella riduzione dello stato quantico
irregolare, «tipo schiuma», che Wheeler immagina? Non è necessaria, in questo caso, l'assenza di contraddizioni perché l'intero stato è una sovrapposizione di geometrie irregolari di questo tipo, non una singola geometria. La sovrapposizione può possedere, per proprio conto, una simmetria non posseduta dalle singole geometrie di cui è composta. Se una geometria irregolare contribuisce, così fanno pure tutte le altre ottenute da quella con l'applicazione di ciascuna simmetria FLRW 45 In che modo si suppone allora che questa vasta FLRW simmetrica sovrapposizione quantistica di geometrie irregolari dia origine a qualcosa di somigliante a uno specifico, «quasi FLRW simmetrico» universo che è perturbato solo in un modo molto piccolo, coerente con le osservazioni? Al lettore dovrebbe essere chiaro che non vi è alcun modo che questo possa avvenire interamente entro la U evoluzione della meccanica quantistica standard, poiché questa deve preservare esattamente la simmetria. Deve aver luogo qualcosa della natura di un processo R, che trasformi questa vasta sovrapposizione di geometrie in una singola geometria o, piuttosto, in una sovrapposizione più piccola di geometrie, che rassomigli di più a una singola geometria. Il punto cruciale è che irregolarità provenienti da «fluttuazioni quantistiche» non possono verificarsi senza qualche azione di tipo R, con cui il singolo stato quantico iniziale in qualche modo si trasforma in una miscela probabilistica di stati differenti. Questo ci riporta ai problemi affrontati nel capitolo 29, dove sono stati discussi atteggiamenti differenti rispetto alla «realtà» di R. Dovremmo tenere a mente che ci stiamo occupando del primissimo universo dove la temperatura sarebbe forse stata circa 1032 K. A quel tempo non vi erano in giro sperimentatori a compiere «misurazioni», così che è difficile comprendere come il punto di vista (a) standard di «Copenaghen» di §29.1 possa essere applicato. E per quanto riguarda il punto di vista (b) dei molti mondi di §29 .1? In quello non vi è alcun reale R, quindi lo stato FLRW simmetrico dell'universo sarebbe mantenuto fino a oggi, poiché questo stato è rappresentabile come una grande sovrapposizione di molte geometrie spaziotemporali. Soltanto quando osservatori coscienti tentano di comprendere il mondo, secondo questo punto di vista, sarebbe giudicata appropriata la trasformazione in geometrie alternative dello spaziotempo - essendoci ora una sovrapposizione di osservatori coscienti, ciascuno dei quali percepisce un singolo «mondo». 46 Dal punto di vista «FAPP» (c) di §29.1 -, la presenza di una (sufficiente) decoerenza ambientale è considerata il segnale per cui la nostra sovrapposizione quantistica di geometrie differenti può essere ritenuta un miscuglio probabilistico di geometrie differenti. È illuminante fare un confronto con un esempio nell'ordinaria meccanica quantistica. 47 Immaginiamo un nucleo radioattivo a riposo, in uno stato con [30.14) Siete in grado di capire perché il mantenimento di questa simmetria segue solo dalla deterministica unicità della U evoluzione, assieme a un'ipotesi generale, molto debole, circa la U evoluzione? 863
LA STRADA CHE PORTA ALLA REALTÀ
simmetria sferica (vale a dire, spin O, vedi §22.11) in un punto O, posto nel centro di una camera a bolle48 (fig. 30.27). Supponiamo che, per fissione nucleare, si spezzi in due parti A e B, che sono espulse in direzioni opposte rispetto a O. Possiamo supporre cheA e B siano elettricamente cariche, in modo da lasciare tracce nella camera a bolle. In questo esempio, siamo partiti con uno stato a simmetria sferica, centrato in O; tuttavia, dopo la scissione, la simmetria sferica è rotta dall'asse lungo cui le parti A e B sono emerse. Come dobbiamo comprendere questo in termini dell'evoluzione U dello stato iniziale? Chiaramente, come è stato affermato prima, la simmetria sferica deve essere preservata, ma lo stato realizza ciò essendo composto da una sovrapposizione di tutte le possibili situazioni date da differenti direzioni del1'asse. La funzione d'onda ha la forma di un'onda sferica con centro in O anche se dobbiamo tenere a mente che lo stato è uno stato entangled implicante sia A sia B, in cui ciascuna direzione di A è correlata a una direzione di B (quella agli antipodi). Quando l'influenza delle cariche su A e B comincia a ionizzare il materiale nella camera a bolle, e si formano bolle, lo stato diventa entangled con questo materiale, quindi troviamo che l'intero stato consiste in una sovrapposizione, in cui ciascun componente implica una coppia di tracce in direzioni opposte, una corrispondente al passaggio di A e l'altra a quello di B. La situazione appena descritta non è sostanzialmente diversa da quella nell'universo primordiale. Qualche versione di R è necessaria affinché la sovrapposizione quantistica simmetrica possa essere rimpiazzata da una miscela probabilistica di alternative meno simmetriche. Sembra che, in pratica, i teorici abbiano la tendenza ad adottare qualche fonna dell'interpretazione FAPP - (c) di §29.1 -, in cui si ritiene che la grandezza dell'orizzonte cosmologico arbitrariamente· (e illogicamente) fornisca una qualche specie di «cut-off» per gli entanglement quantistici. La sovrapposizione quantistica è allora considerata una miscela probabilistica- anche se quasi mai questa posizione viene assunta chiaramente. Per esempio, nel loro libro di livello uni-
Fig. 30.27 - Rottura di simmetria tramite OR. Un nucleo (sfericamente simmetrico) di spin O si spezza in due parti, che all'osservazione occupano una specifica coppia di cammini diretti in senso opposto. I.:evoluzione U dello stato iniziale preserva la simmetria sferica, ma questa consiste in una sovrapposizione quantistica (entangled) di coppie di cammini opposti (Mott). R dà il risultato per cui soltanto uno di questi è percepito. Si ritiene che questo esempio sia un modello illustrativo di ciò che potrebbe avvenire nella creazione di fluttuazioni di densità in uno stato dell'universo primordiale, inizialmente ad alta simmetria. 864
Il ruolo della gravità nella riduzione dello stato quantico
versitario avanzato, The Early Universe, i famosi cosmologi inflazionari Kolb e Turner (1994) asseriscono: Quando ciascun modo passa al di fuori dell'orizzonte, si disaccoppia dalla microfisica e «si congela» come fluttuazione classica.
Il «modo» qui fa riferimento a un componente della sovrapposizione quantistica, quindi comprendiamo che gli autori tentano d'impiegare l'orizzonte come qualcosa che in qualche maniera permette un passaggio da un'ampiezza quantistica a qualche probabilità di una reale alternativa classica. Sembra che ciò sia qualcosa in linea con una proposta FAPP (vedi §29.6) e, come è stato sostenuto in §§29.6, 8, è, a rigor di termini, illogico. 49 A mio parere, è chiaro che l'introduzione di scostamenti dall'esatta simmetria FLRW tramite fluttuazioni quantistiche richieda inevitabilmente qualche teoria di riduzione oggettiva dello stato. Tuttavia, la proposta «minimalista» per il gravitazionale OR che è stata esposta in §§30.9-12 non è allo stato attuale abbastanza forte. Occorre qualche proposta OR più generale, in cui possano essere trattate sovrapposizioni quantistiche di moltissime geometrie spaziotemporali, dove le singole geometrie non hanno bisogno di essere stazionarie, come erano in §30.10. Quando un tale schema sarà a disposizione, sarà immediatamente messo a confronto con una crescente mole di dati osservativi, con cui deve reggere il confronto o cadere. Già le osservazioni BOOMERANG, WMAP e altre hanno fornito enormi quantità di dati riguardanti fluttuazioni di densità/temperatura nell'universo primordiale, e ve ne saranno ancora di più da altri esperimenti in via di realizzazione. Un commento finale su questa situazione è opportuno. Abbiamo osservato come lo stato simmetrico nel nostro precedente esempio di fissione nucleare fosse molto entangled. Questo sarebbe anche vero, e persino di più, per le riduzioni di stato che ci portano da uno stato inizialmente FLRW simmetrico a un universo soggetto a «fluttuazioni quantistiche». In questo modo, in accordo con la nostra discussione degli stati EPR in §§23.3-6, abbiamo «violazioni della disuguaglianza di Bell» che forniscono correlazioni tra eventi distanti che sembrano violare la causalità classica. Non occorre che una simile violazione apparente della causalità sia indicativa di un meccanismo come l'inflazione che servirebbe a p01iare in contatto causale questi eventi separati, ma potrebbe nascere come risultato di qualunque schema appropriato di riduzione oggettiva dello stato (OR). Vediamo, tuttavia, dalla discussione appena fatta 50 che persino entro le cosmologie FLRW standard può avvenire una simile apparente «violazione della causalità», senza che ci sia bisogno di alcuna inflazione, se le fluttuazioni iniziali si verificano attraverso qualche schema di riduzione oggettiva dello stato. È evidente che siamo lontani da una teoria capace di affrontare in modo affidabile tutti questi problemi. Ma spero almeno di essere stato capace di persuadere il lettore dell'importanza fondamentale di avere una meccanica 865
LA STRADA CHE PORTA ALLA REALTÀ
quantistica con un'ontologia fattibile. Le questioni che sono state affrontate nei capitoli 29 e 30 non sono solo materia d'interesse filosofico. L'importanza di avere una meccanica quantistica (migliorata) ontologicamente coerente non può, a mio parere, essere sopravvalutata. In questa sezione, ho appena sfiorato solo uno dei problemi fondamentali che possono essere profondamente influenzati dalla conoscenza di una simile teoria. Ve ne sono molti altri, che includono situazioni della biologia (vedi §§34.7, 10) in cui, come nel caso dell'universo primordiale, l'attuale punto di vista di «Copenaghen» non può realmente essere applicato, poiché non vi è alcuna chiara divisione in un sistema quantistico e un apparato classico di misura.
Note 1. Vedi Roseveare (1982). 2. Vedi Penrose (1980). 3. Non vi è alcun impedimento teorico o tecnico a ciò, almeno se non esigiamo il 100% di accuratezza. Per esempio, si potrebbero sistemare le cose in modo che il fotone finale sia sempre un membro di una coppia (prodotta per conversione parametrica - vedi §23.10), il cui altro membro dà l'avvio alla registrazione. 4. Trovo sorprendente quanta difficoltà le persone abbiano spesso con questo ragionamento. La questione può forse essere chiarita se immaginiamo di avere molti di questi esperimenti, che hanno luogo in vari posti in tutto lo spaziotempo. Vi sono da considerare quattro percorsi alternativi per il fotone, SBD, SBC, FBD e FBC; per vedere quali sono le varie probabilità, chiediamo la proporzione di SBD, dato S (tempo in avanti), o la proporzione di SBD, dato D (tempo a ritroso). La regola del modulo al quadrato dà correttamente l'effettiva risposta (50%) nel primo caso, ma non dà 1'effettiva risposta (circa l 00%) nel secondo caso. 5. Esse dipendono, tuttavia, dal fatto che lo stato iniziale sia quello supposto e non faccia parte di qualche stato entangled (§23.3) che potrebbe includere anche qualcosa nel rivelatore. Potremmo sollevare la questione se l'inverso temporale di simili correlazioni potrebbe essere responsabile del fatto che la regola, temporalmente invertita, del modulo al quadrato dia delle risposte completamente sbagliate; ma io non sono in grado di comprendere come costruire qualche plausibile spiegazione secondo questa linea. Forse qualche lettore intraprendente riuscirà a fare meglio. 6. Vedi Aharonov e Vaidman (1990). 7. Per una discussione di questo problema, vedi Aharonov e altri ( 1964). 8. Vedi Aharonov e Vaidman (2001); Cramer (1988); Costa de Beauregard (1995); e Werbos e Dolmatova (2000). 9. Vedi Unruh (1976); vedi anche Wald (1994). 10. Vedi Penrose (1968b, 1987b) e Bailey e altri (1982). 11. Vedi Kay (2000); Kay e Wald (1991); Haag (1992). 12. Vedi Wald (1984). 13. Vedi Wald (1984); Kruskal (1960); Szekeres (1960). 14. Vi è una discrepanza leggermente ambigua tra l'interpretazione di «'Z>> come vero tempo nel caso di Schwarzschild, qui preso in esame, mentre è r0 r che misura il tempo dell'osservatore in accelerazione nel caso piatto (Rindler) di fig. 30.5a, b. 15. Vedi Newman e altri (1965). 16. Questo rapporto giromagnetico si riferisce a una «pura particella di Dirac», per
866
Il ruolo della gravità nella riduzione dello stato quantico
17. 18. 19. 20. 21. 22. 23. 24. 25. 26.
27.
28. 29.
30. 31.
32. 33. 34. 35. 36.
37.
la quale l'elettrone è un'eccellente approssimazione, ma un elettrone reale è soggetto a correzioni radioattive dovute alla teoria quantistica dei campi; vedi fine di §24.7. Un protone o un neutrone sono ancora più lontani dall'essere particelle di Dirac, ma questa nozione è molto più strettamente valida per i quark che li costituiscono. Vedi Novikov (2001); Thorne (1995); Davies (2003). Davies (2003) presenta una discussione divertente e leggibile di tali possibilità. Vedi Penrose (1969); Floyd e Penrose (1971). Vedi Blanford e Znajek (1977); Begelman e altri (1984). Vedi anche Williams (1995, 2002, 2004). Vedi Hawking (1974, 1975, 1976a, 1976b); Kapusta (2001). Vedi Preskill (1992). Vedi Preskill (1992), o, per un'altra prospettiva, Kay (1998a, 1998b). Vedi Preskill (1992); Susskind e altri (1993). Vedi Gottesman e Preskill (2003) per una critica di Horowitz e Maldacena (2003). Vedi anche Susskind (2003). Hawking ha introdotto una generalizzazione dell'evoluzione unitaria in cui la descrizione con la matrice S dell'ordinaria QFT (§26.8) è generalizzata a quello che chiama un operatore di «superscattering» (non collegato con la supersimmetria; vedi §26.8) denotato da«$». Questo opera tra stati di matrice densità, invece che tra gli stati puri trattati dalla matrice S. Vedi Hawking (1976b). Il principale disaccordo tra Stephen Hawking e me si è centrato, nel corso di circa venti anni, su questo problema dell'asimmetria temporale. Egli ha sempre avuto fede salda in una fisica simmetrica rispetto al tempo e nell'immutabilità del processo U della meccanica quantistica, ammettendo soltanto quelle deboli generalizzazioni sopra riferite (nota 26). Come spiegherò, la mia posizione rispetto a questi argomenti è del tutto diversa. Vedi Hawking (1976b); Preskill (1992); Penrose (1979a). L'ipotesi della curvatura di Weyl fa riferimento alla geometria classica, e così dice qualcosa su quello che avviene solo al punto dove la «geometria quantistica» cristallizza in uno spaziotempo classico. Vedi Hawking (1976a, 1976b) e Gibbons e Perry (1978). Forse, a questo punto, è richiesta qualche nozione generalizzata di spazio di Hilbert, che potrebbe anche assumere alcune delle proprietà di uno spazio delle fasi (curvo); per esempio Mielnik (1974); Kibble (1979); Chernoff e Marsden (1974); Page (1987); Brody e Hughston (2001). Questi potrebbero essere stati coerenti come chiamati in §26.6. Tenete presente che gli indici di -«:x e -«:,.,I ,,
essere»
Fig. 31.17 - Un punto di vista alternativo a quello di fig. 31.3, spesso espresso nel contesto delle D-brane, si riferisce al fatto che un «essere» nello spazio di dimensione più elevata non ha bisogno di stare a cavalcioni su tutte le dimensioni extra, ma si può pensare che «viva» in un sottospazio, forse su una D-brana. 925
LA STRADA CHE PORTA ALLA REALTÀ
siano del tipo convenzionale, in modo che i valori iniziali su qualche 3-spazio siano sufficienti per determinare il comportamento in tutto il 4-spazio. Questo non è molto probabile generalmente, e così ci si può aspettare di nuovo un'eccessiva cx/"1"''. Il problema non è ancora scomparso! Questa teoria delle D-brane è stata impiegata anche per tentare di risolvere il «problema della gerarchia», riferito in §31.1. Questo problema riguarda il perché le interazioni gravitazionali siano così piccole rispetto alle altre forze importanti della Natura o, in modo equivalente, il perché la massa di Planck, di fondamentale importanza gravitazionale, sia così più grande (un fattore di circa 1020) delle masse delle particelle elementari della Natura. I.:approccio di Dbrana a questo problema sembra richiedere l'esistenza di più di una D-brana, una delle quali è «grande» e l'altra «piccola». Vi è un fattore esponenziale implicato nel modo con cui la geometria si distende da una D-brana all'altra e ciò viene considerato utile per affrontare la discrepanza di 1040 (più o meno) volte tra l'intensità della forza gravitazionale e le altre forze. 79 Si può far notare che un quadro di questo genere di uno spazio a dimensionalità più elevata, che si estende da una D-brana a un'altra, è uno dei tipi di geometria suggeriti per le teorie 11-dimensionali, come la M-teoria, in cui l'undicesima dimensione ha la forma di un segmento aperto, poiché ciascuna geometria di contorno ha la forma topologica (per esempio 'il( x f) dei 1O-spazi considerati in precedenza. In altri modelli l'undicesima dimensione è topologicamente S 1•
31.18 Qual è lo stato fisico della teoria delle stringhe? Cosa dobbiamo pensare di tutto questo in relazione allo stato fisico della teoria delle stringhe in quanto teoria fisica del futuro? La situazione mi sembra possedere alcuni aspetti molto enigmatici e notevoli, come pure alcuni veramente poco plausibili, e quindi sarebbe sbagliato tentare di essere completamente dogmatici a questo stadio. Tuttavia, molte affermazioni dei teorici delle stringhe vengono presentate con grande decisione e con apparente sicurezza. Indubbiamente devono essere annacquate e condite con un pizzico di buon senso prima di essere prese seriamente in considerazione. Penso sia giusto dire che alcune delle affermazioni più forti (per esempio che la teoria delle stringhe ha fornito una completa e coerente teoria della gravità quantistica) possano essere totalmente ignorate; ma, ciò detto, devo ammettere che pare ci sia qualcosa di genuinamente significativo «che avviene dietro le quinte» in alcuni aspetti della teoria delle stringhe e della M-teoria. Come il matematico Richard Thomas, dell'Imperia! College di Londra, mi ha fatto osservare in una e-mail: Non riesco a chiarire abbastanza quanto siano profonde alcune di queste dualità; ci sorprendono continuamente con nuove predizioni. Svelano una struttura che non era mai stata considerata possibile. Molte volte i matematici hanno predetto
926
LA STRADA CHE PORTA ALLA REALTÀ
gluoni (§25.7). Questo è particolarmente importante dalla mia prospettiva orientata verso i twistor (vedi il capitolo 33) e potrebbe condurre a qualche nuovo sviluppo. Non vi sono dubbi sulla straordinaria qualità delle realizzazioni intellettuali di Witten: ne posso parlare per esperienza diretta. Quando ho frequentato i seminari nell'istituto matematico di Oxford (nella serie di geometria e analisi), in numerose occasioni è stato annunciato un nuovo approccio molto originale a qualche problema: si scopriva che l'idea embrionale era effettivamente dovuta, totalmente o almeno in parte, a Witten. Spesso questi approcci hanno aperto un nuovo campo, in cui queste inaspettate intuizioni hanno gettato nuova luce su difficili problemi matematici, apparentemente intrattabili (almeno in precedenza). Io stesso non ho dubbi chè Witten possieda un intuito matematico veramente notevole e vaste conoscenze in questo campo. (Non per nulla, nel 1990 ha vinto una Fields Medal, che è l'equivalente, per i matematici, di un premio Nobel. Questo è certamente un risultato straordinario per un fisico.) Credo, tuttavia, che Witten stesso negherebbe che la sua abilità sia soprattutto matematica. Per quanto ne so, i suoi successi sono de1ivati da un'attenta osservazione delle vie della Natura, dalla comprensione della struttura della QFT con i suoi integrali sui cammini e i suoi spazi infinito-dimensionali di funzioni, dalle idee della supersimmetria e dalla stessa natura della teoria delle stringhe e delle sue generalizzazioni. Se ha ragione, questo è forse uno dei più convincenti motivi per accettare le sue affermazioni secondo le quali la supersimmetria e la teoria delle stringhe godono di grande favore presso la Natura. D'altra parte, forse è un matematico più bravo di quello che lui stesso ammetta di essere! In che modo sono impressionato dalla possibilità che le sconcertanti relazioni matematiche che Witten e i suoi colleghi hanno scope1io indichino una stretta attinenza alla Natura? Non so come giudicare tale questione e certamente non mi ha ancora convinto. Rammentate il notevole risultato del matematico Andrew Wiles, che Iiuscì a dimostrare il famoso «ultimo teorema di Fermat» dopo tre secoli e mezzo di tentativi falliti (§ 1.3). Ciò che Wiles realmente accertò fu che, in un caso importante, due computi apparentemente molto differenti davano effettivamente lo stesso risultato; la fonna generale di questa notevole asserzione era nota come congettura di Taniyama-Shimura. (In realtà, la dimostrazione di Wiles stabilì soltanto parte della completa congettura di T-S - una parte sufficiente a dimostrare l'asserzione di Fermat - ma i suoi metodi hanno fornito un input essenziale per la dimostrazione finale, completata in seguito da Breuil, Conrad, Diamond e Richard Taylor.) Vi è forse qualche vaga analogia tra questa congettura e le relazioni di «simmetria speculare» tra spazi di Calabi-Yau sopra menzionate (§31.14); in ciascun caso si hanno due liste infinite di numeri che misteriosamente risultano essere le stesse. Questo genere di cosa è ben lungi dall'essere unica in matematica e, in qualunque caso particolare, può richiedere un considerevole numero di anni prima che siano evidenziati i motivi di base per I' egua928
Supersimmetria, sopradimensionalità e stringhe
glianza delle due liste. Per quanto ne so io, molte delle relazioni ottenibili impiegando le «simmetrie speculari» sono state ora dimostrate da ragionamenti puramente matematici. 82 Misteriose relazioni di questo tipo, per quanto è finora a mia conoscenza, non sono normalmente avanzate per appoggiare proposte per teorie scientifiche (in confronto a teorie matematiche). Questo tipo di problema sarà ripreso in §34.9. Abbiamo visto il medesimo genere di «coincidenza» nelle argomentazioni della teoria delle stringhe per l'entropia dei buchi neri, avanzate in §31.15 (e persino in quelle «non di stringa» molto precedenti di §30.5). Queste sono solo coincidenze matematiche, o riteniamo che tali argomentazioni forniscano vere derivazioni? Lasciatemi finire questo capitolo 1iportando un altro esempio di una sconcertante coincidenza matematica, questa volta presa dalla fisica. Nel 1912, Woldemar Voigt costruì una teoria delle linee spettrali, basata su un modello errato di oscillatore. Quindici anni più tardi, Heisenberg e Jordan trovarono quello che oggi riterremmo l'approccio corretto a questo problema; vale la pena di citare le reminiscenze di Heisenberg sul lavoro di Voigt: 83 Fu in grado di fissare l'accoppiamento degli oscillatori tra loro e con il campo esterno, in modo tale che, in campi magnetici deboli, era rappresentato correttamente anche l'effetto Paschen-Back. Per le regioni intermedie di campi moderati, ottenne, per le frequenze e le intensità, lunghe e complesse radici quadrate; formule, cioè, che erano largamente incomprensibili, ma che ovviamente riproducevano gli esperimenti con grande esattezza. Quindici anni più tardi, Jordan e io ci prendemmo il disturbo di risolvere il medesimo problema con i metodi della teoria quantistica delle perturbazioni. Con nostra grande sorpresa, ottenemmo esattamente le formule di Voigt, per quanto riguardava sia le frequenze sia le intensità, e questo anche nell'area complessa dei campi moderati. Più tardi fummo in grado di capire che il motivo di ciò era puramente formale e matematico.
Ritornerò, nel capitolo 34, su questo sconcertante problema di relazioni matematiche in quanto forze che guidano la teoria delle stringhe e altre proposte per lo sviluppo di una teoria fisica fondamentale.
Note l. Si dovrebbe naturalmente stare attenti a non confondere questo e con la base dei logaritmi naturali: e= 2.718281828459 ... ; vedi §5.3. 2. e enorme discrepanza tra le forze delle diverse interazioni - forte, elettromagnetica, debole e, in particolare, gravitazionale, così come sono grossolanamente caratterizzate dalle rispettive costanti d'accoppiamento: 1, 1/137, ~ 10-6, ~ 10- 39 - è detta anche «problema della gerarchia». eUniversità di Stato della Georgia ha un sito che spiega i punti più delicati del confronto di questi accoppiamenti; vedi http://hyperphysics.phy-astr.gsu.edu/hbase/forces/couple.html. 3. Il relativamente «piccolo» fattore di rinormalizzazione per la carica potrebbe essere dovuto alla natura logaritmica della divergenza elettrodinamica. Il letto-
929
Supe1·simmetria, sopradimensionalità e stringhe
24. 25. 26. 27. 28. 29. 30.
31. 32. 33.
34.
35. 36.
37. 38. 39. 40. 41. 42.
natura matematica e non fornì un punto di vista fisico unificato; vedi Shaw e Hughston (1990) e nota 76. Citato in Greene (1999), p. 139, da un'intervista a Michael Green, da parte di B1ian Greene, 1O dicembre 1997. Vedi Witten (1996). Vedi Greene (1999). Lavori autorevoli che sono più dettagliati e tecnici si trovano in Green e altri (1987); Polchinski (1998); Green (2000). Vedi Green e altri (1987); Polchinski (1998); o Green (2000) per un ragionamento che porta a 26 dimensioni. Il numero rilevante che compare, in modo anomalo, nei commutatori quantistici (e deve essere posto a zero) è 24- a, dove aè il numero di dimensioni spaziali meno il numero di dimensioni temporali. Nel caso della supersimmetria, l'anomalia è ora eliminata quando 8 - aè posto uguale a zero, con a come nella nota precedente. Una stringa adronica esibisce una differenza minore da una comune striscia di gomma per il fatto che quest'ultima ha una lunghezza naturale finita per cui la tensione si annulla. Per una stringa adronica questa «lunghezza naturale» sarebbe essa stessa zero. Molte di queste affermazioni possono essere trovate in Greene (1999). Citato da Abhay Ashtekar in una conferenza al NSF-ITP Quantum Gravity Workshop all'università della California, Santa Barbara (1986). Anche se non tutta la comunità relativistica sarebbe interamente d'accordo con me nel ritenere che la cercata unione tra gravità e teoria quantistica debba implicare un mutamento nelle regole della QFT, essa non lesina incoraggiamenti a questa mia posizione. La risposta della comunità dei teorici della QFT ha tendenza a essere molto meno favorevole! Il termine «dilatone» non è un errore di ortografia per «dilatazione», ma si riferisce a una sua versione quantistica, nascente dai gradi di libertà disponibili in un cambiamento di scala della metrica. Si rammenti, dal capitolo 26, che secondo le regole della QFT, gradi di libertà quantizzati possono manifestarsi come un genere di particella. Citato in Greene (1999), p. 210, da un'intervista a Edward Witten da parte di Brian Greene, 11 maggio 1998. Il numero 70 viene dalla formula n(n - 3) per il numero di componenti indipendenti per punto di una superficie iniziale (11 - 1)-dimensionale in un 11-spazio Ricci-piatto; vedi Wald (1984); Lichnerowicz (1994); Choquet-Bruhat e DeWitt-Moreite (2000). Vedi Penrose (2003); Bryant e altri (1991); Gibbons e Hartnoll (2002). Vedi Penrose (2003). Vedi Dine (2000) per riflessioni sui moduli. Si potrebbe preferire rimanere in uno schema di QFT e impiegare uno stato coerente (§26.6) invece di una descrizione classica. Questo, tuttavia, non evita i problemi qui sollevati. Anche se dubito che molti teorici delle stringhe sarebbero entusiasti di rendere R un processo dinamico, vi sono alcune notevoli eccezioni; vedi Ellis e altri (1997a, 1997b). Gli eccitoni si comportano come bosoni in una descrizione da teoria quantistica dei campi delle vibrazioni del tubo di gomma (§22.13, §23.8, §26.2), così vi possono essere molti quanti in qualsiasi modo particolare di f. Un sistema fisico reale per il quale una simile descrizione quantistica può essere appropriata sarebbe una guida d'onda ottica, lunga e sottile (per esempio una fibra ottica). 931
LA STRADA CHE PORTA ALLA REALTÀ
43. Vedi Hawking e Penrose (1970). 44. La condizione è che ogni geodetica di tipo tempo o nulla incontri una curvahira «generica», nel senso che, in un punto lungo ognuna di queste geodetiche, k[,/?.bJcdfc k11 :f:- O, dove il vettore nullo k' è tangente alla geodetica. Una semplice valutazione diretta dei gradi di libertà mostra che questa condizione è certamente soddisfatta in qualunque spaziotempo «gene1ico». Si dovrebbe menzionare che il teorema si applica in circostanze più generali della piattezza di Ricci. Abbiamo solo bisogno che il tensore di Ricci soddisfi un'opportuna «condizione di energia non negativa» (vedi §27.9, specialmente la nota 20, e §28.5). 45. Vi sono casi eccezionali di un f con curvatura nulla con la topologia di un «ipertoro» S 1 x S 1 x S 1 x S 1 x S 1 x S 1• Questi non sono, tuttavia, i modelli per f preferiti dai teorici delle stringhe di oggi (§31.14). Inoltre, la maggior parte delle perturbazioni dell'ipertoro non sarebbero piatte. 46. Questa conclusione è conseguenza di un'altra applicazione del sopraccitato teorema delle singolarità, che si applica direttamente all'intero spaziotempo '»t. In questa applicazione, la condizione che vi sia un'ipersuperficie compatta di tipo spazio è rimpiazzata dall'esistenza di qualche punto p il cui cono di luce futuro e «si raggomitoli e incontri se stesso» in hitte le direzioni. Il luogo di punti e è quello spazzato dalla famiglia di raggi luminosi f (vale a dire le geodetiche nulle - vedi §28.8) con estremità p nel passato e che si estendono indefinitamente nel futuro. La condizione richiesta, dal punto di vista tecnico, è soddisfatta se ciascuno di questi f contiene un punto q per cui vi è una curva rigorosamente di tipo tempo nel futuro da p a q. Nei modelli esatti 'mx f appena descritti, la condizione viene meno (come deve, perché 7ft X f può essere non singolare), ma viene meno soltanto per poco. Sostanzialmente quello che succede è che, nella famiglia 8-dimensionale di raggi luminosi f, vi è soltanto una piccola sottofamiglia 2-dimensionale che non vaga dentro e fuori della «parte~> dello spaziotempo, arrotolandosi quindi nell'interno di e. Si può dimostrare che, con una geneiica ma piccola pe1turbazione incontrata da e, questa proprietà è distrutta e si applica davvero il sopramenzionato teorema delle singolarità. I dettagli di questa argomentazione saranno presentati altrove. 47. Vedi, per esempio, Minassian (2002), che fa riferimento ad altre importanti ricerche. 48. Vedi Smolin (2003) e Nicolai (2003). 49. Vedi Smolin (2003); Grosse Periwal (1988); Nicolai (2003). 50. La serie l + 22 + 24 + 2 6 + 2 8 + ... non è neppure sommabile secondo Bore], persino se il «valore euleriano» -- l/3 per questa somma non è ambiguo, come si può vedere con l'impiego del prolungamento analitico (§7.4). Non so se simili procedimenti siano stati applicati alle ampiezze totali delle stringhe. 51 . Questa osservazione non si applica alle stringhe eterotiche, a cui arriveremo tra poco, per cui la struttura fondamentale è già chirale. 52. Sembra che la referenza più recente sia Grosse altri (2003). Smolin (2003) fornisce ulteriori referenze a queste varietà nella teoria delle stringhe; anche Polchinski (1998) le discute. 53. Ho una certa difficoltà con ciò, poiché i campi spinoriali hanno effettivamente un'interpretazione geometrica. Essi non possono essere «ruotati» ( e quindi, a rigor di termini, «gauged» -- vedi § 15 .2,7) senza che questo si applichi allo stesso spazio ambiente; vedi Penrose e Rindler ( 1984). 54. Applicando una «rotazione di Wiclrn per ottenere una superficie di Riemann, la distinzione è, come è stato menzionato in §31.13, tra olomorfo e antiolomorfo. 55. Greene ( 1999); Smolin (2003) elenca virtualmente tutte le dualità note, il loro stato e le referenze. 932
Supersimmetria. sopradimensionalità e stringhe
56. Questa nozione di «simmetria speculare» è completamente differente dalla simmetria per riflessione dello spazio (parità), denotata con P, che è stata discussa in §25.4. 57. Vedi Cox e Katz (1999), che fornisce un'eccellente resoconto di tali idee. 58. Vedi, per esempio, Kontsevich ( 1994 ); Strominger e altri ( 1996); per alcuni degli sviluppi più recenti, vedi Yui e Lewis (2003). 59. Queste varietà paiiicolari sono 3-superfici complesse chiamate «quintics», il che significa che sono di «ordine 5». Cardine di una 11-supe1ficie complessa in ICP111 è il numero di punti in cui incontra un generale (m -11)-piano complesso in ICP111 • 60. Per «ordine» di una curva complessa, vedi la nota precedente. Qui Il= l. 61. Vedi Cox e Katz ( 1999); Candelas e altri ( 199 l ); Kontsevich ( 1995). 62. Vedi Smolin (2003), in particolare la reforenza 171; Witten ( 1995); per un resoconto popolare, Greene (1999). 63. Vedi Vafa (1996); o Bars (2000). 64. Vedi Bryant e altri (1991 ); nota 37. 65. Per un'argomentazione suggestiva, tuttavia, vedi Thorne ( 1986). 66. Vedi Strominger e Vafa (l 996). 67. Vedi Greene (1999). 68. Il lettore potrebbe chiedersi come mai un campo di Maxwell senza sorgenti possa condurre a una carica non nulla. Non vi è qui alcuna incoerenza, poiché il buco nero potrebbe aver avuto origine dal collasso di un corpo carico, in cui tutte le sorgenti di carica sono scomparse nel buco. 69. Per una rassegna abbastanza leggibile di queste materie, vedi Horowitz (1998). 70. Il conteggio implica strutture chiamate «D-brane» che esamineremo in §31.17. 71. Vedi nota 11 del capitolo 22. 72. Segnalatomi da Abhay Ashtekar. 73. Vedi Kasper e Feller (2001) per una referenza sugli ologrammi «reali». 74. Questo è un insieme di idee abbastanza difficile. Per una chiarificazione, vedi Maldacena (1997) e Witten (1998). 75. Gary Gibbons ha segnalato qualche affascinante geometria associata a questa rappresentazione che sembra persino avere delle connessioni con la teoria dei twistor. Questioni rilevanti per tale costruzione possono essere trovate in Penrose (1968). 76. Vedi Nair (1988); Witten (2003); Cachazo e altri (2004). 77. Vedi Ashtekar e Das (2000) per un esempio di questo fenomeno. 78. Uno «spazio quoziente» è come lo spazio base di un fibrato; vedi §§ l 5.1, 2. 79. Vedi Randall e Sundrum (1999a); vedi anche Randall e Sundrum (1999b) per riflessioni più generali su questi problemi. Jolmson (2003) è la referenza standard per la «tecnologia» delle D-brane. Una delle applicazioni più fantasiose di questa tecnologia è stato il modello «ekpyrotic» dell'origine dell'universo, avanzato da Steinhardt e Turok (2002) in cui si propone che il Big Bang sia nato dalla collisione di due D-brane in una fase precedente dell'universo. Nonostante il ricorso a elementi così esotici, gli autori di questo modello non fanno il minimo tentativo di spiegare il mistero principale presentato dal Big Bang, e precisamente la sua straordinaria particolarità, descritta in §27 .13. 80. Vedi nota 74. 81. Vedi note 18 e 76. 82 .. Vedi note 57 e 58. 83. Questa citazione è tratta dal discorso di Heisenberg alla German Physical Society, «Che cos'è una pa1iicella elementare?» (Sono grato a Abhay Ashtekar per questo esempio.) Vedi Heisenberg (1989).
CAPITOLO
32
IL CAMMINO PIÙ RIGOROSO DI EINSTEIN; LE VARIABILI DI LOOP
32.1 La gravità quantistica canonica Nonostante la popolarità della teoria delle stringhe, sarebbe assurdo assumere il punto di vista, come hanno fatto alcuni, 1 secondo il quale questa sia «l'unica possibilità» (vedi §31.8). Molte altre idee interessanti sono state inseguite, tutte con diverse virtù e difficoltà. Sfortunatamente, non mi è qui possibile discutere moltissime delle idee alternative per unire la teoria quantistica con la struttura dello spaziotempo; mi concentrerò invece, in questo capitolo e in quello successivo, su alcune delle aree di ricerca attiva che sono più vicine al mio punto di vista riguardo quali possano essere le linee fruttuose nella ricerca della vera unione tra relatività generale e meccanica quantistica. Come può essere desunto dai miei commenti nel capitolo precedente, ritengo che dobbiamo assumere un atteggiamento più strettamente controllato rispetto a quelli che ammettono un aumento della dimensionalità dello spaziotempo o si avventurano nella supersimmetria (anche se sono meno prevenuto verso quest'ultima rispetto alla prima che, come abbiamo osservato in §§31.11, 12, incontra seri problemi di stabilità). Di conseguenza, in questi due capitoli, vedremo alcune idee specificamente collegate al 4-dimensionale spaziotempo lorentziano, dove è inteso che la vera equazione di campo di Einstein,2 senza supersimmetria, debba essere trattata in qualche contesto genuinamente quantistico. Vedremo che, persino in questo caso, le «rappresentazioni della realtà fisica» che incontreremo sono, per alcuni aspetti, ancora molto lontane da ciò che ci è familiare. In questo capitolo, vedremo alcune idee che supportano le variabili di Ashtekar, le variabili di loop e le reti di spin. Nel capitolo seguente, faremo conoscenza con la teoria dei twistor. In questi due capitoli, si accennerà brevemente anche ad alcune altre idee che hanno acquistato credito, in particolare lo spaziotempo discreto, le strutture q-deformate («i gruppi quantistici») e la geometria non commutativa. Uno dei modi più diretti per affrontare la quantizzazione della teoria di Einstein è metterla in una forma hamiltoniana, per poi tentare di applicare le procedure di quantizzazione canonica che sono state descritte in §§21.2, 3. 934
Il cammino più rigoroso di Einstein; le variabili di loop
Vi sono molte difficoltà in ciò, e io non voglio entrare nei dettagli. Molte di queste difficoltà hanno origine dal fatto che la teoria di Einstein è «completamente covariante»(§ 19 .6), così che le particolari coordinate impiegate non hanno nessun significato. Si rammenti, dalla discussione di §21.2, che la «prescrizione standard di quantizzazione» per cui il momento p a è rimpiazzato dall'operatore i hòlòx dove r è la variabile di posizione (classicamente) coniugata, non è sempre corretta persino in uno spaziotempo piatto, se usiamo coordinate curvilinee. Bisogna quindi fare molta attenzione quando si effettua questo genere di procedura di quantizzazione. Un'altra difficoltà è la complicata natura non polinomiale dell'hamiltoniana standard per la relatività generale. Dovremmo anche tenere conto del fatto che, oltre ad avere equazioni di evoluzione che ci allontanano da una iniziale 3-superficie S di tipo spazio, poiché queste equazioni sono rette dall'hamiltoniana, vi sono altre equazioni che agiscono entro S che sono chiamate vincoli. 3 Queste ci forniscono equazioni di consistenza per i dati su S, il cui soddisfacimento è condizione necessaria ( e sufficiente) per una coerente evoluzione dai dati su S (almeno localmente) e questa evoluzione allora preserva il soddisfacimento dei vincoli. l;approccio canonico alla quantizzazione della relatività generale ha una lunga e nota storia, risalente al 1932, quando Dirac dovette sviluppare un nuovo schema di quantizzazione per trattare i complicati vincoli che si trovano nella teoria di Einstein. 4 Per molti anni questo genere d'approccio fu seguito da un certo numero di ricercatori, con crescente sofisticazione,5 ma la complicata natura non polinomiale dell'hamiltoniana rese difficili i progressi. Poi, nel 1986, il fisico indiano-americano, Abhay Ashtekar, fece un importante passo in avanti. Con un'astuta scelta delle variabili impiegate nella teoria (parzialmente collegata a idee avanzate in precedenza da Amitabha Sen), 6 con cui i vincoli potevano essere ridotti a forma polinomiale, fu in grado di semplificare drammaticamente la struttura delle equazioni e di arrivare, con l'eliminazione degli imbarazzanti denominatori nella hamiltoniana, a una struttura polinomiale relativamente semplice. 0
,
32.2 Uinput chirale alle variabili di Ashtekar Una delle caratteristiche sconcertanti delle originarie «nuove variabili» di Ashtekar, come sono (ancora) chiamate, è il fatto che sono asimmetriche rispetto al loro trattamento delle parti destrorsa e sinistrorsa del gravitone (il quanto gravitazionale ).7 Ricordiamo da §§22.7, 9 che una particella (non scalare) priva di massa ha due stati di spin, uno destrorso e l'altro sinistrorso attorno alla sua direzione di moto; questi sono chiamati, rispettivamente, stati di elicità positiva e negativa. 11 gravitone deve essere una particella non massiva di spin 2, così che i suoi due stati di elicità dovrebbero essere s = 2 e s = - 2 (prendendo n = 1), 935
LA STRADA CHE PORTA ALLA REALTÀ
dove s sta per l'elicità (vedi anche §22.12). I.:originario approccio di Ashtekar tratta questi due stati in modo diverso. Quindi, il formalismo è asimmetrico rispetto a destra e sinistra! A questo punto è opportuno fare un commento sul perché si ritiene che il gravitone sia un ente di spin 2, mentre il fotone ha spin I (vedi §22.7, §32.3). Che cosa significa ciò? Il valore dello spin di una particella quantistica ha a che fare con le simmetrie (e le equazioni di campo) della grandezza di campo che la descrive (e, come vedremo in §34.8, è più manifesto con equazioni scritte in forma di 2-spinori). È bene però avere una maniera direttamente geometrica per vedere la differenza tra la natura di spin 2 della gravità in confronto alla natura di spin I dell'elettromagnetismo. Esaminiamo le onde appropriate per ciascun campo, vale a dire le onde elettromagnetiche che costituiscono la luce da un lato e quelle gravitazionali dall'altro. Nel caso dell'elettromagnetismo, abbiamo visto la natura geometrica delle onde in fig. 22.12, §22.9. Il punto cruciale è che i vettori elettrico e magnetico sono proprio grandezze vettoriali, così che una rotazione di n(vale a dire 180°) dell'onda intorno alla sua direzione di moto manda la grandezza di campo nel suo opposto, per cui occorre una rotazione di 2.n-per riportarla al valore originario. Nel caso della gravità, l'onda sarebbe un'onda di distorsione dello spaziotempo, come è illustrato in fig. 17.8a e fig. 17.9a. Una rotazione di ;r del1' onda la manda in se stessa, mentre occorre una rotazione di ½;r per mandarla nel suo opposto. Possiamo notare che ciò risulta dal fatto che la curvatura di Weyl è un'entità di tipo quadntpolo, come è illustrato dalle ellissi di distorsione in fig. 17.8a e fig. 17.9a, e in §31.9 abbiamo osservato che questo corrisponde a un ente di spin 2. Quando il valore dello spin è a; una rotazione di Jr/ :>o
o
-.~ ~
it--
z
RiO!flID•
I
• 2
~ - R- - -
.,___--~
rappresentazione twistoriale !PN
spaziotempo lw!I
Fig. 33.5 - Un raggio luminoso nello spaziotempo M di Minkowski è rappresentato da un singolo punto Z nello spazio twistoriale !PN (spazio proiettivo dei twistor nulli); un singolo punto Rin M è rappresentato da una sfera di Riemann Rin !PN (questa sfera rappresentando la «sfera celeste» dei raggi luminosi in R). (Per la corrispondenza completa, ciò richiede lo spazio compattificato di Minkowski M 11 descritto in fig. 33.9.)
964
Prospettive più radicali; teoria dei twistor
Lo spazio dei twistor qui considerato, i cui singoli punti rappresentano raggi luminosi in M, è denotato 16 con !PN. (Questa notazione è in accordo con la terminologia di §33.5.) Perciò, il punto Z di !PN corrisponde al luogo Z in M (un raggio luminoso) e il punto R di M corrisponde al luogo Rin !PN (una sfera di Riemann; vedi § 18.5). Una parte essenziale della filosofia dei twistor è che le ordinarie nozioni fisiche, che normalmente sono descritte in termini di spaziotempo, debbano essere tradotte in una descrizione equivalente (ma non collegata localmente) nello spazio dei twistor. Vediamo che la relazione tra Me IPN è davvero una corrispondenza non locale, e non una trasformazione punto per punto. Lo spazio IPN, tuttavia, ci fornisce soltanto l'inizio di una tale traduzione. La piena ricchezza della geometria dei twistor - che risulta essere straordinaria - è svelata solo gradualmente, quando la corrispondenza tra concetti spaziotemporali e geometria dello spazio dei twistor è sviluppata in ulteriore dettaglio. Questo luogo Rin IPN descrive la «sfera celeste» (il campo visivo totale) di un osservatore in R, quando la sfera celeste di R è considerata come la famiglia di raggi luminosi per R. Come è stato fatto notare prima, questa sfera è naturalmente una 4era di Riemann che è uno spazio complesso I -dimensionale (una curva complessa; vedi il capitolo 8). Quindi, pensiamo che i punti dello spaziotempo siano oggetti olom01ji nello spazio !PN dei twistor, in accordo con la filosofia dei numeri complessi alla base della teoria dei twistor. Vedremo esplicitamente in §§33.5, 6 come questa «filosofia olomorfa» può essere estesa a uno spazio l dei twistor più completo, e in §§33.8-12 come ci permette di codificare, in un modo notevole, l'informazione di campi non massivi, lineari e non lineari. Lo spazio IPN dei raggi luminosi, in sé e per sé, non s'inserisce immediatamente nella «filosofia olomorfa», perché non è uno spazio complesso. IPN non può essere una varietà complessa perché ha cinque dimensioni reali,[ 33 •1l e cinque è un numero dispari, mentre qualunque n-varietà complessa deve avere un numero pari, 2n, di dimensioni reali (vedi §12.9). Vedremo tra poco (in §33.6) che, se rendiamo i nostii «raggi luminosi» un po' più simili a particelle fisiche non massive, assegnando loro sia spin (in realtà, elicità vedi §22.7) sia energia, otteniamo allora uno spazio IPl sei-dimensionale, che può effettivamente essere interpretato come uno spazio complesso -- di tre dimensioni complesse. Lo spazio !PN si trova entro !Pl, dividendolo in due varietà complesse, IJJll+ e !Pl-, dove si può pensare che IPJ+ rappresenti particelle non massive di elicità positiva e IPl-particelle non massive di elicità negativa; vedi fig. 33.6. Non sarebbe tuttavia corretto pensare che i twistor siano particelle non massive; essi forniscono invece le variabili in termini delle quali devono essere espresse particelle non massive. (Ciò è paragonabile al comune impiego di un 3-vettore di posizione x per etichettare un punto dello spazio. Anche se una particella po(33.1) Perché i raggi luminosi hanno cinque gradi di libertà? 965
LA STRADA CHE PORTA ALLA REALTÀ
t
~
IPlf+
-------
-·L ·------·
.i~
~
•
IPlf-
Fig. 33.6 - La 5-varietà reale IPN divide lo spazio proiettivo IPlrdei twistor in due 3-varietà complesse [Plf+ e IPlr-, che rappresentano particelle non massive di elicità positiva e negativa, rispettivamente.
trebbe occupare il punto etichettato da x, non sarebbe corretto identificare la particella con il vettore x.) La prospettiva twistoriale ci conduce a un punto di vista sullo «spaziotempo quantizzato» che è molto diverso da quello che viene spesso avanzato. Un punto di vista «convenzionale» molto comune è che le procedure della teoria quantistica (dei campi) debbano essere applicate al tensore metrico gab, poiché questo è pensato come un campo tensoriale sullo spaziotempo (una varietà). È opinione che la metrica quantizzata mostrerà aspetti di «fuzziness» (sfocatura) a causa del principio d'indetenninazione di Heisenberg. Viene presentata l'immagine di qualche specie di spazio 4-dimensionale che possiede una «metrica fuzzy», e quindi, in particolare i coni nulli- e di conseguenza la nozione di causalità - diventano soggetti a «incertezze quantistiche» (vedi fig. 33. 7a). Non vi è più quindi alcuna nozione, classicamente definita, per dete1minare se un vettore spaziotemporale è di tipo spazio, tempo o nullo. Questo problema ha posto difficoltà di base per qualsiasi «teoria quantistica della gravità» troppo convenzionale, poiché una caratteristica fondamentale della QFT è che le richieste di causalità esigono che gli operatori di campo definiti in eventi separati da intervalli di tipo spazio devono commutare (§26.11 ). Se la nozione stessa di «di tipo spazio» è soggetta a ince1iezze quantistiche (o è diventata essa stessa una nozione quantistica), le procedure standard della QFT - che implicano la specificazione di relazioni di commutazione per gli operatori di campo (§§26.2, 3) non possono essere applicate direttamente. La teoria dei twistor suggerisce un quadro molto differente: infatti, di qualunque genere siano le procedure di «quantizzazione» appropriate, esse devono essere applicate entro lo spazio dei twistor e non entro lo spaziotempo (come sarebbe stato nel caso con il punto di vista «convenzionale»). In analogia al modo con cui nell'approccio convenzionale gli «eventi» sono lasciati intatti mentre i «coni nulli» diventano fuzzy, nell'approccio basato sui twistor sono lasciati intatti i «raggi luminosi» mentre gli «eventi» diventano fuzzy (vedi fig. 33.7b). La teoria dei twistor, come abbiamo appena visto, sfrutta inizialmente una manifestazione della magia dei numeri complessi diversa da quelle trovate in teoria quantistica, e precisamente quella caratteristica classica della geometria dello spaziotempo per cui la sfera celeste può essere reputata una sfera di Rie966
Prospettive più radicali; teoria dei twistor
'
,,·.
,I ~,:,-,,
. . :.
.
;_?
'
' 1."'' _
_,, . '~!- - ...
(a)
...;.
..•
·'< •. '
(b)
Fig. 33.7 - (a) La possibile natura di uno «spaziotempo quantizzato» è stata comunemente pensata come una specie di spaziotempo con una metrica «fuzzy», conducente a qualche tipo di cono di luce «fuzzy», dove la nozione in base alla quale una direzione in un punto sia nulla, di tipo spazio o di tipo tempo, sarebbe soggetta a incertezze quantistiche. (b) Una prospettiva più «twistoriale» sarebbe assumere che lo spazio dei twistor (in questo caso IJl'N) mantenga qualche specie d'esistenza (in modo che vi sarebbero ancora raggi luminosi), ma la condizione della loro intersezione diverrebbe soggetta a incertezze quantistiche. Di conseguenza, sarebbe la nozione di «punto dello spaziotempo» a diventare «fuzzy».
mann, che è una varietà complessa I-dimensionale. I.;idea è che ciò ci offre indicazioni sull'effettivo schema delle cose di Natura, che infine dovranno unificare la struttura spaziotemporale con le procedure della meccanica quantistica. È significativo che questa caratteristica della geometria dello spaziotempo sia specifica della particolare dimensione e segnatura che il nostro spaziotempo fisico effettivamente possiede. In verità, il fatto che la sfera di Riemann svolga un ruolo importante in quanto sfera celeste nella teoria della relatività(§ 18.5) esige che lo spaziotempo sia 4-dimensionale e lorentziano, in netto contrasto con le idee di base della teoria delle stringhe e di altri schemi alla Kaluza-Klein. I.;intera magia complessa della teoria dei twistor è molto specifica alla geometria dello spaziotempo 4-dimensionale dell'ordinaria teoria (speciale) della relatività, mentre non ha questa stessa stretta relazione con le «geometrie di spazitempo» di dimensione maggiore (vedi §33.4). Per procedere ulteriormente, ritorniamo all'originaria rappresentazione delle reti di spin, osservando che la cosa principale che vi mancava era qualche riferimento a spostamenti spaziali. In questa teoria, angoli euclidei hanno origine come una specie di «limite geometrico» della pura teoria delle reti di spin. Tuttavia, in questa teoria non nascono distanze. Nello schema delle variabili di loop, l'aspetto «distanza» delle cose è trattato con i numeri (n = 2}) sulle linee che si riferiscono ad aree e non a spin; questo, però, è diverso dall'interpretazione nella originaria teoria delle reti di spin, dove non vi è alcuna misura di distanza perché lo spin è un momento angolare, che ha a che fare solo con rotazioni e angoli. Avremmo bisogno di un corrispondente ruolo per la quantità di moto in quella teoria per essere in grado d'includere traslazioni e distanze reali. Di conseguenza, sembrerebbe che abbiamo bisogno di passare dal gruppo delle rotazioni al gruppo completo dei moti euclidei e, per uno schema appropriatamente relativistico, al gruppo di Poincaré (§ 18.2). 17 967
LA STRADA CHE PORTA ALLA REALTÀ
Negli ultimi anni Cinquanta e nei primi anni Sessanta del secolo scorso, quando stavo attivamente riflettendo su queste cose, la teoria delle variabili di loop non era stata ancora sviluppata e presi davvero in considerazione una generalizzazione delle reti di spin in cui il gruppo di Poincaré figurasse direttamente. Fui però preoccupato da un aspetto poco maneggevole del gruppo di Poincaré- non è un gruppo semisemplice (vedi §13.7)- il che ha spiacevoli conseguenze per le sue rappresentazioni. Ero dell'opinione, allora, che un'estensione del gruppo di Poincaré a quello che è noto come il gruppo coriforme (che è semisemplice) potesse rendere il rilevante analogo della teoria delle reti di spin una struttura matematicamente più soddisfacente. Il gruppo conforme estende il gruppo di Poincaré richiedendo semplicemente che siano preservati i coni luce, invece della metrica dello spazio di Minkowski. In realtà, il gruppo conforme ha un posto importante nella teoria dei twistor, poiché è anche il gruppo di si1mnetria dello spazio [Pll\J dei raggi luminosi (idealizzati). (La parte non riflessiva del gruppo conforme è anche il gruppo di simmetria di ciascuno degli spazi [Pllf+ e [Pllf-, prima menzionati, che descrivono particelle non massive con elicità e energia.) Nelle prossime due sezioni vedremo più esplicitamente quale è il ruolo di questo gruppo.
33.3 Gruppo conforme; spazio compattificato di Minkowski Ho accennato prima al gruppo conforme dello spaziotempo; cerchiamo ora di esplorare il ruolo di questo gruppo più completamente. Esso ha una particolare importanza in fisica in relazione a campi non massivi (per esempio il campo di Maxwell), poiché risulta che le equazioni di campo per questi campi sono invarianti rispetto a questo gruppo allargato, non solo rispetto al gruppo di Poincaré.18 Si può assumere la posizione secondo la quale al livello fondamentale particelle e campi non massivi siano gli ingredienti di base, poiché la massa è qualcosa che entrerà in gioco in un ulteriore stadio. In verità, sembra che questo sia proprio il punto di vista implicito nel modello standard, descritto nel capitolo 25, in cui la massa è introdotta tramite il bosone di Higgs ed è supposta arrivare soltanto attraverso un meccanismo di rottura di simmetria (§25.5). Sia come sia, una delle importanti motivazioni alla base della teoria dei twistor è stata davvero la fede nell'importanza basilare di campi non massivi e del gruppo conforme. Scopriremo (§33.8) che particelle e campi non massivi hanno una descrizione notevolmente concisa nella teoria dei twistor, poiché questo fatto costituisce una delle pietre angolari della teoria. Cos'è esattamente il gruppo conforme? In termini rigorosi, questo gruppo agisce non sullo spazio M di Minkowski, ma su una sua piccola estensione nota come spazio compattificato fMI# di Minkowski. Questo spazio fM!# è una varietà chiusa simmetrica che, sotto molti aspetti, ha ùna geometria più elegante di quella dello stesso spazio di Minkowski. Non dobbiamo pensare 968
Prospettive più radicali; teoria dei twistor
però che sia un «vero spaziotempo», ma solo una comodità matematica; è un utile intermediario per la comprensione della geometria dei twistor e la sua relazione con la geometria dello spaziotempo fisico. Una buona immagine da tenere in mente è la sfera di Riemann e la sua relazione con il piano complesso. Rammentiamo, da §8.3, che la sfera di Riemann è ottenuta dal piano complesso aggiungendo a esso un «elemento infinito», precisamente il punto etichettato=, e agendo in questo modo otteniamo una struttura geometrica con una simmetria- persino più grande di quella del piano da cui siamo partiti. In modo analogo, lo «spazio compattificato di Minkowski» tMJ# è ottenuto aggiungendo all'ordinario spazio di Minkowski M un «elemento infinito» che, questa volta, risulta essere un intero cono luce al! 'infinito. Lo spazio risultante ha una simmetria maggiore (quella del gruppo conforme) dello spazio stesso di Minkowski. Vediamo come funziona tutto ciò. Lo spazio tMJ# risulta essere una varietà reale compatta 4-dimensionale con una metrica conforme lorentziana; ricordiamo, da §27.12, che una metrica conforme lorentziana è in effetti proprio la famiglia di coni nulli specificata sullo spazio. Questa struttura è più comunemente definita in termini di una classe di equivalenza di metriche, dove una metrica g è ritenuta essere equivalente a una metrica g' se g' = Q 2g, per qualche campo scalare liscio Q che è ovunque positivo. Questo cambiamento di scala preserva davvero i coni nulli (fig. 33.8). Per passare ora da M (considerato come una varietà confonne) alla varietà conforme compatta tMJil, aggiungiamo la 3-superficie . O) e lf- (dei twistor negativi: Zaza < O). Le rispettive plessi lf+ (dei twistor positivi: versioni proiettive di questi spazi sono il 5-dimensionale IPN reale (che rappresenta i raggi luminosi in M#) e le due 3-varietà complesse IPlf+ (che rappresenta particelle non massive con elicità positiva) e IPlf- (che rappresenta particelle non massive con elicità negativa).
z,,za z,,za
Questa equazione definisce anche, nello spazio vettoriale lr, il sottospazio reale 7-dimensionale N dei twistor nulli non proiettivi. QuandoZaza > O, otteniamo lo spazio 7r+ dei twistor positivi e, quando Z aza < O, quello dei twistor negativi, ir-. In modo analogo, sono definiti gli spazi proiettivi IJJllf+ e !Plr-. Vedi fig. 33.11 (e confronta con fig. 33.6). Esploriamo la relazione geometrica tra !PN e M, illustrata in fig. 33.5, in quanto conseguenza della fondamentale relazione d'incidenza data all'inizio di questa sezione. Da questa relazione si può vedere direttamente che due punti P, R di M (due eventi) che sono incidenti con il medesimo twistor diverso da zero Z (necessariamente un twistor nullo) devono essere separati da un intervallo nullo (cioè, ciascuno di essi giace sul cono luce dell'altro). Ne consegue che Z definisce un raggio luminoso - una retta nulla in M - poiché tutti i punti di M che sono incidenti con Z devono avere una separazione reciproca di tipo nullo. Vedi fig. 33.12. Il twistor Z, inoltre, rappresenta il medesimo raggio luminoso se rimpiazziamo za con ;i.za, dove ,1, è un qualunque numero complesso diverso da zero. Il luogo degli eventi incidenti con un twistor proiettivo nullo (diverso da zero) è proprio un raggio luminoso; nella particolare situazione in cui Z2- = Z 3 = O, dobbiamo però interpretare questa cosa in modo appropriato, poiché non otteniamo alcun effettivo punto di M incidente con za, ma possiamo ritenere che un simile twistor nullo descriva un raggio luminoso al! 'infinito (un generatore di !fi, giacente in tw1J#, invece che in M)P 312l [33.12] Dimostrate esplicitamente le affermazioni di questo paragrafo.
976
Prospettive più radicali; teoria dei twistor
Esaminiamo ora il caso opposto. Fissando l'evento R, con coordinate reali t, x, y, z, troviamo che lo spazio dei twistor Z incidenti con R è definito da due relazioni lineari omogenee tra le componenti z0 , Z1, Z2 , Z3 ; ciascuna di queste relazioni lineari definisce un piano in [Pllre la loro intersezione (l'insieme dei punti di [Pllrche soddisfano entrambe queste relazioni) ci dà una linea proiettiva Rin [Pllr(una C[Pl 1) - in realtà, giacente in [PlN - che è perciò una sfera di Riemann, come è richiesto (§§15.4, 6). In questo modo, i punti di M (gli eventi) sono rappresentati, nello spazio dei twistor, da linee proiettive in [PlN. Nella situazione particolare in cui Z 2 =O= Z3, otteniamo in [PlN una particolare linea proiettiva, che chiamiamo I; questa linea speciale rappresenta il punto i che è il vertice del cono luce !Ji all'infinito. Qualsiasi altro punto Q di !Ji è rappresentato, in PN, da una linea proiettiva Q che incontra J.[33 ·131 Questa situazione è illustrata in fig. 33.12. Il modo con cui queste strutture complesse rappresentano la geometria dello spazio di Minkowski (col numero standard di dimensioni spaziali e temporali) è veramente notevole. Possiamo reinterpretare lo spazio di Minkowski come lo
r;.;----IP'N
due piani in IP'lf
Q ·.,...
I - - - ~ __ .
L
(a)
1 ___-_ _ _J (b)
Fig. 33.12 - La geometria dei luoghi fondamentali in lw1J# e IP'N, data dalla relazione d'incidenza della corrispondenza twistoriale. (a) Fissiamo un punto (un twistor proiettivo nullo) Z in IP'N. I punti di lw1J# (per esempio, P, R) che sono incidenti con Z formano un raggio luminoso, poiché tutti questi punti sono separati da un intervallo nullo l'uno dall'altro. (b) Fissiamo un punto Rin lw1J#. I punti di IP'N (per esempio, Z, X) che sono incidenti con R (giacenti sull'intersezione di due piani complessi in IP'lr) costituiscono una linea proiettiva complessa, che è una sfera di Riemann. Punti P e R in lw1J# con separazione nulla lungo il raggio luminoso Z hanno le corrispondenti sfere di Rieman11 P e R, che s'intersecano nel singolo punto Z. (Ho tracciato queste sfere di Riemann molto allungate, come compromesso con il fatto çhe sono anche linee rette proiettive nella geometria proiettiva di IP'lr!) Una particolare sfera tra queste sfere di Riemann è I, che rappresenta il punto i in lw1J#. Il punto i specifica l'infinito di tipo spazio e di tipo tempo; è il vertice del cono luce!} all'infinito. Qualsiasi altro punto Q di!} è rappresentato in ltDN da una linea proiettiva Q che incontra I. [33.13] Perché? 977
LA STRADA CHE PORTA ALLA REALTA
spazio delle linee complesse giacenti in !PN (o in !PN - J,, se vogliamo solo i punti al finito dello spaziotempo), assumendo !PN come struttura primaria e lw1I come secondaria. Ciò equivale a ritenere che i raggi luminosi siano più primiti".i degli stessi punti dello spaziotempo. I',intersezione dei raggi luminosi Z e X è rappresentata dall'esistenza di una linea proiettiva su !PN contenente i corrispondenti punti Z e X di !PN, mentre, come abbiamo visto, la condizione che due punti P e R dello spaziotempo siano separati da un intervallo nullo è rappresentata dalla condizione che le corrispondenti linee proiettive P e R, in !PN, s'intersechino (fig. 33.12). Così vediamo che lo spazio dei twistor offie una prospettiva sulla geometria fisica completamente diversa da quella del normale spaziotempo. I punti dell'ordinario spaziotempo sono rappresentati da sfere di Riemaim in !PN; i punti di !PN sono rappresentati da raggi luminosi nello spaziotempo. In entrambi i modi la corrispondenza non è locale. Tuttavia, possiamo passare da una rappresentazione all'altra con precise regole geometriche.
33.6 Geometria dei twistor come particene non massive con spin Ricordiamo che la più fondamentale delle motivazioni alla base della teoria dei twistor è quella di sfruttare completamente la magia dei numeri complessi. Nonostante contenga un grande (4 parametri reali) sistema di linee proiettive complesse, !PN non è, in sé e per sé, una varietà complessa (il che non potrebbe essere poiché, come fatto notare in §33.2, ha un numero dispati di dimensioni reali). Tuttavia, lo diventa, precisamente IPlr(che è una CIP3), quando viene aggiunta una sola ulteriore dimensione reale. Possiamo interpretare questi ulteriori punti in qualche maniera fisicamente naturale e significativa? Certamente (come è stato suggerito in §33.2). Ricordate che i fotoni liberi reali sono qualcosa di più che semplici raggi luminosi in lwll; un raggio luminoso descrive una particella puntiforme viaggiante alla velocità della luce in una direzione fissata, ma i fotoni reali hanno anche energia e spin. Per il momento, possiamo pensare a questo in modo classico; i due modi fondamentali in cui un fotone può ruotare intorno alla sua direzione di moto sono quello destrorso e quello sinistrorso (elicità positiva e negativa, rispettivamente, definita dalla polarizzazione circolare destrorsa e sinistrorsa; vedi §22. 7). Il valore di questa elicità è proprio Pz, in ciascun . caso. I fotoni di elicità classica positiva possono essere rappresentati come punti di IPlr+, mentre quelli di elicità negativa come punti di !Plr-, dove la dimensione extra è dovuta all'ene,gia del fotone. Questa descrizione è valida anche per qualsiasi altra particella non massiva con spin nn/2 diverso da zero. Come funziona questa cosa? Questo non è il posto per addentrarmi in dettagli, ma le caratteristiche essenziali possono essere tratteggiate come segue. Per prima cosa, è utile rendersi conto che le due prime componenti z0, Z 1 del twistor Z sono in realtà le due componenti di un 2-spinore w, di forma con 978
Prospettive più radicali; teoria dei twistor
indici ID4, dove oi =zie ro 1 = Z 1 (vedi §22.8 e §25.2). Le rimanenti due componenti Z2, Z 3 di Z sono le componenti dello spinore (duale) 1t, con indici con apice 7tA', dove 7t0, = Z2 e 7t 1, = Z3. Qualche volta scriviamo
z = (m, re) e chiamiamo me re le parti spinoriali del twistor Z. Il twistor complesso coniugato Z ha le parti spinoriali in ordine inverso
z = (n, ro), così che la norma del twistor può essere espressa come segue
Zaza=z Z =ft• {JJ+li)• re='ftA @A +fil'4' 1CA'· III
La relazione di incidenza tra il twistor Z e il punto R dello spaziotempo, con coordinate t, x, y, z, è adesso scritta
m= irre, 1
che sta al posto di ùY = i1AA' 1tA,, dover (o ,-AA') è la matrice rOO' ( ,.10'
,.o!') rii'
1
(t +
z
= ✓2 x-iy
x+iy)·
t-z
Lo spinore re è associato alla quantità di moto della particella non massiva, nel senso che il prodotto esterno mr (nessuna contrazione - vedi § 14.3) descrive il suo 4-impulso. Lo spinore mè associato al momento angolare della particella, nel senso che il prodotto simmetrizzato di mcon n descrive la parte antiautoduale del 6-momento angolare della particella (§18.7, §19.2, §22.12, §32.2) e il prodotto simmetrizzato di li) con re descrive la sua parte autoduale. 21 A differenza del caso della quantità di moto, il momento angolare dipende dalla scelta dell'origine O dello spaziotempo, quindi qualche volta parliamo di momento angolare rispetto a O. Questa indipendenza/dipendenza dall'origine si riflette nel comportamento traslazionale delle due parti spinoriali, re e m, di un twistor Z. Nel caso di uno spostamento dell' origine O in un nuovo punto Q dello spaziotempo, con vettore di posizione q relativamente a O, troviamo (con q in forma di matrice, come prima) che le parti spinoriali si trasformano nel seguente modol 33 · 141
re H> re e mH> m- iqre. Vi è anche una quantità scalare indipendente dall'origine, che può essere costruita dalla quantità di moto e dal momento angolare, vale a dire l'elicità s. Risulta che l'elicità è la metà della norma del twistor:
s = -2I z- a za =
z. z
I 2
-
[3 3. 14] Fate vedere che la relazione di incidenza tra un twistor e un punto dello spaziotempo
è preservata in questa trasformazione; dimostrate che la norma twistoriale è preservata.
979
LA STRADA CHE PORTA ALLA REALT,\
(e osserviamo dalle relazioni di prima che questa è proprio la parte reale di ID • n). In effetti, i twistor offrono un formalismo per trattare paiiicelle non massive che è notevolmente più conciso del convenzionale approccio con 4-vettori e 4-tensori di §22.12. Adesso abbiamo una chiara rappresentazione fisica di un twistor non nullo (fino a un fattore di fase Z f-,> ei 0z, con 0reale) come una classica particella non massiva ruotante;r33 .t 5J confrontate con fig. 33.6. Non abbiamo ancora una rappresentazione geometrica molto chiara di un twistor non nullo; possiamo ottenerla se siamo pronti a prendere in considerazione lo spazio di Minkowski compless[fzcato CM (o la sua compattificazione (Cfw11#), dove si assume che le coordinate spaziotemporali t, x, y, z siano ora numeri complessi. Vi è sempre, infatti, un 2-dimensionale luogo geometrico complesso non banale di punti di (Cfw11# incidente con qualunque (diverso da zero) twistor Z'X, chiamato a-piano, che è autoduale nel senso che una 2-forma a esso tangente è autoduale (§32.2). Questo a-piano rappresenta fino a un fattore di proporzionalità; vedi fig. 33 .13. Analogamente, un twistor duale Wa definisce un /J-piano che è un 2-piano complesso antiautoduale in (Cfw11#_( 33 •16l Questo ci dà solo una rappresentazione geometrica spaziotemporale complessa di un twistor; possiamo ottenere una rappresentazione «reale» veramente visualizzabile? La struttura reale di (Cfw'[J# è contenuta nella sua nozione di coniugazione complessa (§ 18.1 ); questa scambia gli a-piani con i /J-piani, in confonnità al fatto che essa scainbia indici di twistor superiori con indici inferiori (vale a dire, twistor con twistor duali) e «autoduale» con «antiautodua-
za
IJJ>lr
Fig. 33.13 - La descrizione dello spaziotempo complesso dei twistor (in generale diversi da zero) e dei twistor duali. Per qualsiasi twistor diverso da zero, vi è sempre in Oìvfl" un luogo complesso 2-dimensionale di punti incidenti con esso, chiamato un o: -piano, che è ovunque autoduale. Per qualsiasi twistor duale W,, diverso da zero, i punti in CM# incidenti con esso costituiscono sempre un piano complesso 2-dimensionale, chiamato ,{3-piano, che è antiautoduale. Solo per twistor o twistor duali nulli vi sono punti reali in questi luoghi, e questi punti reali formano un raggio luminoso, in accordo con fig. 33. I 2.
za
[33.15) Spiegate perché vi è questa libertà di fase e perché, per una particella di data elicità s > O, l'energia della particella è codificata nella posizione del punto in IJJ>lf+. [33.16) Dimostratelo.
980
Prospellive più radicali; teoria dei twistor
Fig. 33.14 - Possiamo ottenere una rappresentazione «reale» di un twistor non nullo Z" passando prima al suo complesso coniugato Z"' definendo così un piano proiettivo complesso in Plr. Questo piano è fissato dalla sua intersezione con PN, che è un luogo reale 3-dimensionale. Questo luogo definisce una famiglia a tre parametri di raggi luminosi in M\ chiamata congruenza di Robinson.
le». In termini della geometria proiettiva di IPlr, la coniugazione complessa scambia punti con piani, poiché un twistor duale detem1ina un piano in [Plf.l 3317l Questo fatto ci permette di ottenere una rappresentazione di un twiin termini di geometria spaziotemporale reale; ciò stor proiettivo non nullo che dobbiamo fare come prima cosa è rappresentare con il suo complesso coniugato Za che, essendo un twistor duale, è associato con un piano complesso in IPT Questo piano è fissato dalla sua intersezione con IPN, che è un luogo 3-dimensionale reale; possiamo 1itenere che questo luogo ci fornisca una famiglia a tre parametri di raggi luminosi in Ml. Perciò, questa famiglia di raggi luminosi rappresenta geometricamente il twistor (fino a un fattore di proporzionalità); vedi fig. 33.14. I raggi luminosi procedono tortuosamente in modo complicato, ma è possibile ottenere una straordinaria rappresentazione della loro configurazione. Consideriamo la sezione euclidea IE3 dello spaziotempo di Minkowski Ml per un ce1io valore del tempo; qualsiasi raggio luminoso in Ml - una particella puntiforme non massiva che si muove in una particolare direzione con la velocità della luce - è rappresentata in IP da un punto con una «freccia» attaccata, che determina la direzione del moto. Per rappresentare il nostro singolo twistor, dobbiamo raffigurare una famiglia a tre parametri di simili raggi luminosi, chiamata congruenza di Robinson. In fig. 33.15, vediamo un sistema di cerchi orientati (e una linea retta) che riempiono l'intero 3-spazio ordinaiio F Vi sarà mm particella della nostra famiglia in ciascun punto di IE3 e si muoverà (con la velocità della luce) nella direzione indicata dalla tangente orientata al cerchio che passa per quel punto. È un fatto piuttosto notevole che, col progredire del tempo, tutta questa configurazione si sposti semplicemente, come un tutto, con la velocità della luce nella direzione (negativa) dell'unica linea retta nella raffigurazione, dato che questa propagazione rappresenta il moto della particella non massiva ruotante, descritta dal twistor. Questa configurazione di cerchi è, in effetti, la proiezione stereografica (§8.3, fig. 8.7a), sull'ordinario 3-spazio euclideo, della configurazione di parallele di Clifford su S3 (§ 15.4).
za
za
za
[33.17] Per quale motivo? 981
LA STRADA CHE PORTA ALLA REALTÀ
Direzione di moto
Fig. 33.15 - Un disegno spaziale che dà una «istantanea» di una congruenza di Robinson. (Parallele di Clifford stereograficamente proiettate su S3, vedi fig. 8.7a, fig. 15.8, che è una famiglia a tre parametri di cerchi e una linea retta - che riempiono l'intero IP.) Immaginiamo una particella in ciascun punto di IP, che si muove in linea retta con la velocità della luce (un raggio luminoso) nella direzione del cerchio (orientato) su cui si trova. L'intera configurazione si propaga con la velocità della luce nella direzione (negativa) della linea retta in figura. Questa rappresenta il moto e il momento angolare della particella non massiva rotante, descritta da
za.
Non dobbiamo pensare che questi «raggi luminosi» siano entità fisiche; ci danno soltanto una realizzazione geometrica di un twistor (proiettivo). Questa configurazione codifica effettivamente la struttura del momento angolare della particella (classica) non massiva ruotante. 22 Essa è certamente una rappresentazione non locale. Vi è, in fig. 33.15, un cerchio minimo, il cui raggio è lo spin diviso per l'energia della particella. Il centro di questo cerchio rappresenta, grosso modo, la «posizione» della particella rotante (ma la storia di questo centro non può essere accuratamente pensata come quella di un raggio luminoso che rappresenti la storia della particella non massiva, perché non si comporta in modo appropriato rispetto a trasformazioni di Lorentz).P 3 ·18l Questa configurazione è quella che ha dato inizialmente origine al nome «twistorn. 23
33. 7 La teoria quantistica dei twistor Questo espone per sommi capi la geometria fondamentale della teoria dei twistor di uno spazio piatto; ma alcuni lettori potrebbero essere comprensibilmente impazienti di sapere come una simile rappresentazione, malgrado tutta la sua bellezza geometrica, ci aiuti a progredire nel campo della fisica. In effetti, cos'ha da dirci la teoria dei twistor riguardo all'unificazione della struttura dello spaziotempo con i principi quantistici? Finora abbiamo visto soltanto alcuni «astuti» modi geometrici e algebrici di descrivere particelle non massive, ma né le idee quantistiche né quelle della relatività generale hanno ancora svolto alcun ruolo. Farei meglio a provvedervi! Ritorniamo all'idea fondamentale della teoria dei twistor: quella di ritenere che tutte le nozioni spaziotemporali siano sussidiarie a quelle dello spazio 7r dei [33.18) Trovate il centro (nelle coordinate di §33.5) e mostrate come si trasforma rispetto a una generale trasformazione di Lorentz delle velocità. ·
982
Prospettive più radicali: teoria dei twistor
twistor. Essendo uno spazio completamente complesso, lf offre la possibilità di sfruttare la magia dei numeti complessi in modi che non si presentano facilmente nella struttura dello spaziotempo standard; di conseguenza, invece d'impiegare descrizioni in termini di coordinate spaziotemporali reali, si impiegano le variabili twistoriali complesse za. Queste variabili twistoriali sono miscugli di variabili di posizione e di momento, per cui dobbiamo chiederci: cosa prende il posto della regola standard di quantizzazione (§21.2)
Pa
·r,.
a
Hln--
dx"
(o altrimenti x" H> - i fìdldpJ? La risposta è che, in analogia con il fatto che x" e Pa sono variabili canoniche coniugate, come è espresso dalla relazione di commutazione operatoriale p 1,x" - x"Pi, = i ti 8,; di §21.2, si assume che le variabili twistoriali za e Za siano operatori canonici coniugati:
zazp-ZjZP= n8ff, mentre, come nel caso di posizione e momento, queste variabili commutano tra loro, zazr3 - ZfJza = o e ZaZfJ-ZaZ/3 = 0_[ 33 .i 91 Come digressione, si può far notare che questa non commutazione quantistica di Za con za solleva affascinanti questioni riguardo al genere di «ge9metria» che potrebbe nascere se prendessimo più seriamente il fatto che le «coordinate» fondamentali per uno spazio quantistico dei twistor potrebbero essere entità non commutanti. Dal punto di vista classico, quando consideriamo la struttura di 8-varietà reale dello spazio dei twistor lf, possiamo impiegare za e Za come variabili commutanti indipendenti (vedi§ 10.1). Ma in questa rappresentazione quantistica za e Za non commutano. Il tentativo di impiegare una simile coppia «quantistica», za eZa, come coordinate indipendenti ci condurrebbe nel campo della geometria non commutativa, che è stata discussa brevemente prima, in §33. I. Può darsi che sia interessante perseguire ulteriormente questa linea, ma, per quanto ne so, nessuno l'ha fatto. Ricordiamo, ora, che in un'ordinaria funzione d'onda ljl(x) per una particella, nella rappresentazione di posizione, le variabili momento p non compaiono, ma sono invece rappresentate in termini degli operatori d/dx" (come prima). Qual è l'analogo di questo per i twistor? Sembra che dovremmo richiedere che la nostra «funzione d'onda twistoriale».f(Za) sia «indipendente daZa» e cheZa debba essere invece rappresentato in termini dell'operatore a;aza. In effetti, questo è corretto, ma cosa signzfica realmente la richiesta per cuif sia «indipendente da Za»? Formalmente, questa «indipendenza» sarebbe espressa come df Id Za = O che (come ricordiamo da § 10.5) sono semplicemente le equazioni di Cauchy-Riemann che stabiliscono che f(Z~ è una funzione olomorfa di za. [33.19] Riuscite a capire da considerazioni generali circa gli operatori degli spazi di Hilbert perché è appropriato che non vi sia nessun «i)) nel commutatore dei twistor? 983
LA STRADA CHE PORTA ALLA REALTÀ
Questo è un fatto straordinario. Le funzioni d'onda dei twistor sono proprio entità olomorfe, così possono stabilire un appropriato contatto con il magico mondo dei numeri complessi. Il ruolo quantistico delle variabili complesse coniugate Za è proprio quello di derivazione
-
a aza'
Z H-tia
che è un operatore olomorfo, così che, al livello quantistico di descrizione, l' olomorfia è preservata. È rassicurante che l'interpretazione dei twistor in termini di quantità di moto e di momento angolare per una particella non massiva sia coerente con le regole di commutazione dei twistor, poiché i commutatori del momento angolare e della quantità di moto (§22.12) vengono fuori in modo corretto e sono inclusi nei commutatori dei twistor dati prima. 24 Una grandezza di particolare interesse è l'elicità s, che ora è considerata un operatore, i cui autovalori sono i vari possibili valori seminteri ( ... , -2ti, - } ti, - ti, - ½ti, O, ½ti, ti, } ti, 2 ti, ...) che sono ammessi per una particella non massiva. Specialmente degno di nota è il fatto che, tenendo correttamente conto della non commutazione, l'operatore di elicità diventa25 ,r33 .2o1
s={(zaza+zaza)H-½{2+za L'operatore
a!a}
Y=za_a_ aza
è chiamato operatore di omogeneità di Euler. (Ricordiamo il nostro vecchio amico Leonhard Euler dai capitoli 5, 6, 7 e, in particolare, 9.) L'operatore Y, come Euler ha dimostrato, ha la notevole proprietà per cui le sue autofunzioni sono omogenee, poiché il grado di omogeneità è l'autovalore. In altri termini, l'equazione
lf= uf, dove u è un numero, è la condizione affinché valgar33 ·21 l la proprietà di omogeneità Ne consegue che una funzione d'onda twistoriale per una particella non massiva con un valore definito S di elicità (così che sf= tiSJ, dove s è l'operatore e S l'autovalore) deve essere omogenea di grado - 2S- 2, oltre a essere olomorfa.P 3·22 l In questo modo, una funzione d'onda twistoriale di un fotone (S = ±I) sarebbe, in particolare, la somma di due parti, una omogenea di grado O, che [33 .20) Verificate l'eguaglianza di queste due espressioni per s. [33.21) Provate a dimostrarlo. [33.22] Perché questo valore?
984
Prospettive più radicali; teoria dei twistor
descrive la componente sinistrorsa (S = - 1), e una di grado-4, che descrive la componente destrorsa (S = 1). Un neutrino, supposto essere una particella priva di massa, avrebbe una funzione d'onda omogenea di grado - 1 (poiché l'elicità è - ½),mentre la funzione d'onda di un antineutrino (non massivo) sarebbe di grado - 3. La funzione d'onda di una particella scalare non massiva sarebbe di grado di omogeneità - 2. Il caso più importante, per le nostre riflessioni, è quello di un gravitone, che supporremo (provvisoriamente) essere una particella non massiva di spin 2 in uno spazio piatto di fondo di Minkowski (S = ±2). La sua parte sinistrorsa (S = - 2) ha una fun·zione twistoriale di grado di omogeneità+ 2, mentre la parte destrorsa (S = 2) ha una funzione twistoriale di grado - 6. Questa asimmetria è straordinaria e illustra la natura essenzialmente chirale della teoria dei twistor. Vedremo tra poco che questa asimmetria incombe particolarmente minacciosa quando tentiamo di portare la relatività generale sotto l'ombrello dei twistor. Per il momento, cerchiamo di capire come devono essere interpretate le funzioni d'onda (lineari) dei twistor; per queste l'asimmetria non causa alcun problema e ogni cosa fila via liscia come l'olio. Vi è, tuttavia, un'importante sottigliezza sul modo in cui la nostra funzione d'ondaj(_Z~ - di solito chiamata/unzione twistoriale - deve essere interpretata. Ci arriveremo tra poco.
33.8 Descrizione twistoriale dei campi non massivi Per la rappresentazione spaziotemporale della funzione d'onda di una particella libera non massiva di spin generico, l'equazione di Schrodinger si traduce in una certa equazione nota come equazione del campo libero non massivo .26 Ne abbiamo visto un esempio, nel caso di spin½, nell'equazione (Dirac-Weyl) per il neutrino non massivo (§25.3). Non è opportuno entrare qui nei dettagli, ma questa equazione è abbastanza semplice da scrivere una volta che abbiamo a disposizione il formalismo dei 2-spinori, come è stato impiegato in §22.8 e §25.2. Nel caso di elicità negativa S = - ½ n, abbiamo una quantità lf/As ... D e, nel caso di elicità positiva S = ½n, una quantità lflA'B' ... D' con indici con apice, ciascuna delle quali è completamente simmetrica rispetto a tutti i suoi n indici, ha frequenza positiva e soddisfa la rispettiva equazione '\JAA' lflAB ... D
= o,
'\JAA' lflA'B'... D'=
O,
dove '\JAA' è proprio la traduzione 2-spinoriale dell'ordinario operatore gra(scritto con indici superiori; vedi § 14.3).l33·23 l Nel caso di spin O, diente
va
[33.23] Scrivete esplicitamente queste equazioni, per elicità ½n, usando la notazione l/f, = l/foo .. oi1...i, dove vi sono 11- r zeri e r "uno", e passando da 'i/" a VAA' nello stesso modo in cui dalle ordinarie coordinate di Minkowski t, x, y, z, si è passati alla quantità ,-4A', come è stato descritto sopra. 985
LA STRADA CHE PORTA ALLA REALTÀ
abbiamo semplicemente l'equazione d'onda Dlf/= O, dove O è il dalambertiano, introdotto in §24.5. In verità, la conveniente notazione 2-spinoriale per queste equazioni mette in luce alcune sottigliezze. Quando n = 2 (spin 1), queste due equazioni diventano semplicemente le equazioni del campo libero di Maxwell nei casi antiautoduale e autoduale, rispettivamente.l33·24l Quando n = 4, diventano le equazioni di Einstein per il campo debole, spezzate nelle parti antiautoduale e autoduale, dove si ritiene che la curvatura sia una perturbazione infinitesimale dello spazio piatto M. 27 Cosa hanno a che fare queste equazioni con le funzioni twistoriali? Risulta, cosa particolarmente notevole, 28 che vi è un'espressione esplicita in forma di integrale sul contorno (§7.2) che dà automaticamente la soluzione generale di frequenza positiva delle equazioni del campo libero non massivo di prima, partendo semplicemente dalla funzione twistoriale/(Za). In realtà, questa espressione funziona perfettamente anche senza questa richiesta di frequenza positiva, sebbene questa richiesta sia facilmente assicurata nel formalismo twistoriale, come vedremo in §33.10. Non è opportuno entrare qui nei dettagli, ma l'idea fondamentale è che, nel caso di elicità positiva, si moltiplica dapprima f(Za) per 7t (§33.6), n volte (ciò fornisce n indici con apice), o, nel caso di elicità negativa, si agisce dapprima su/(Za) con l'operatore èJ!èJro, n volte (ciò fornisce n indici senza apice); il tutto è poi moltiplicato per la 2-forma -r = dn0,/\ dn 1, e integrato su un opportuno contorno 2-dimensionale, dove è dapprima incorporata la relazione d'incidenza ro = i rrc per eliminare m in favore di 1& e r. Questa integrazione elimina 1&, così che finiamo con una grandezza con indici 1/f. .. in qualunque puntoR dello spaziotempo (così che 1/f. .. è una funzione del solo r). II contorno deve giacere entro il luogo ro= i rn:(per ciascun dato r), vale a dire entro (la versione non proiettiva29 del) la linea R di N che rappresenta l'evento R; vedi fig. 33.16. La condizione di frequenza positiva è assicurata dalla richiesta per cui l'integrale sul contorno funzioni ancora quando la linea R ha il permesso d'avventurarsi interamente nella regione twistoriale [Plf+. Le linee in !Plfcorrispondono a «punti spaziotemporali complessi», come abbiamo visto in §33.6, e quelle che giacciono interamente nella sottoregione [Plf+ corrispondono a punti della sottoregione fw1l+ di CM chiamata tubo anteriore (forward tube). 30 Ritorneremo su tale questione in §33.10. Anche campi non massivi di elicità mista come un fotone con polarizzazione piana, che è una somma di una parte sinistrorsa e di una destrorsa - possono essere descritti in questo schema, addizionando semplicemente le funzioni twistoriali per le due differenti elicità. La stessa esistenza di una simile espressione mi dà l'impressione di essere qualcosa di magico. Sembra che le equazioni del campo non massivo spariscano nel formalismo twistoriale, essendo in effetti convertite in «pura olomorfia».
C
[33.24] Provate a dimostrare questo, dove lf/oo = C1 - iC2 , f//01 = - iC3, f//11 = = 2E - 2iB (vedi§ 19.2), e dove espressioni corrispondenti valgono per 'lfA'B'•
986
C 1 - iC2, con
Prospettive più radicali; teoria dei twistor
Fig. 33.16 - !;integrale al contorno twistoriale di base. Una funzione twistoriale/(per elicità n/2), omogenea di grado - n - 2, è moltiplicata n volte per tr(n positivo) o si agisce su di essa - n volte con òlòm (n negativo), poiché queste operazioni forniscono gli indici, ed è poi moltiplicata dalla 2-forma -r= d7t0,A d7tr, Per qualunque scelta particolare del punto R dello spaziotempo, con vettore di posizione r, è poi effettuato un integrale al contorno nella regione R dello spazio dei twistor definita dalla relazione d'incidenza m= irtr. Questo elimina la dipendenza da ,r e ci lascia con una soluzione delle equazioni di campo senza massa. Nel caso illustrato, R è presa nella metà superiore dello spazio dei twistor ifDlf+ ( o lf+) e/è olomorfa nel!' intersezione di 'U 1 e 'U2, dove gli insiemi aperti 'U1 e 'Uz assieme coprono l'intero ifDlf+ (o lf+).
Quando esaminiamo questa espressione con maggior cura, troviamo che vi è un'importante sottigliezza nel modo con cui una funzione twistoriale deve essere interpretata; sottigliezza collegata in modo straordinario alla suddivisione dei campi non massivi in parti di frequenza positiva e negativa (§33.10). Questa sottigliezza è cruciale anche per la maniera con cui le funzioni twistoriali si manifestano in modi attivi e ci danno spazi twistoriali curvi. Di che tipo di sottigliezza si tratta? Si basa sul fatto che le funzioni twistoriali non devono realmente essere viste come «funzioni» nel senso ordinario, ma come quelli che sono chiamati elementi della coomologia olomorfa difasci. 31
33.9 Coomologia twistoriale di fasci Cos'è la coomologia di fasci? Le idee sono alquanto sofisticate dal punto di vista matematico, ma in realtà molto naturali. Qui saremo interessati solo a quella che viene chiamata prima coomologia di fascio. Il modo probabilmente più semplice di visualizzare questa nozione è pensare a come una varietà può essere costruita in termini di un certo numero di carte, come è stato discusso in §10.2, in §12.2, e illustrato in fig. 12.5a. In ogni zona di sovrapposizione tra due carte è definita unafimzione di transizione (che provvede all'incollatura delle carte). Ricordiamo da §12.2, fig. 12.5a, che queste funzioni di transizione sono soggette a certe condizioni di coerenza, nelle sovrapposizioni triple di carte. Immaginiamo ora una varietà costruita in questo modo, ma con funzioni di transizione che differiscono dall'unità solo per una quantità infinitesima. Vedi 987
LA STRADA CHE PORTA ALLA REALTÀ
Fig. 33.17 - Si rammenti ( da fig. 12.Sa) come una varietà è costruita da parecchie carte. (Su ciascuna sovrapposizione tra una coppia di carte è definita una «funzione di transizione», che provvede alla «incollatura» delle carte.) In questo caso, prendiamo in considerazione funzioni di transizione che differiscono dall'unità solo in modo infinitesimo, date quindi da un campo vettoriale F!i su ciascuna sovrapposizione di carte'$(, Uj, che ci dice come ciascuna carta deve essere «spostata» rispetto a quella con cui si sovrappone. (Le «carte» sono insiemi aperti U 1, U 2 , U 3 , ... sullo spazio piatto delle coordinate.)
fig. 33.17. Questa deviazione infinitesima tra una carta 'U; e un'altra carta 'U; sarebbe descritta da un campo vettoriale FiJ sulla parte di 1( che si sovrappone a 'U;, il quale descrive come la carta U; deve essere infinitesimamente «spostata» rispetto a it;. Analogamente, possiamo pensare che 'U; sia spostata rispetto a U;, ma in direzione opposta. Questo è descritto dal campo vettoriale Fu sulla parte di 'U; che si sovrappone a U;, quindi su questa sovrapposizione
Fi;=-Fu (vedi fig. 33.18a). In una sovrapposizione tripla tra le carte U;, Ui e Uk, tro· viamo che deve valere la relazione di coerenzaf33 ·25 l
Fij + Fjk = F;k• Vi sono anche deformazioni infinitesime «banali» che provengono semplicemente da cambiamenti (infinitesimi) del sistema di coordinate in ciascuna carta. Possiamo pensare che questi siano dati da un campo vettoriale H; in ciascuna singola carta U;, che semplicemente «sposta» tutta questa carta lungo se stessa. Ciò ci darebbe una famiglia di «banali» FiJ di forma
Fu=H;-¼ su sovrapposizioni tra coppie di carte, che non cambiano la varietà (fig. 33.18c). Queste idee ci danno essenzialmente le regole della prima coomologia di fascio. 32 Non abbiamo però bisogno d'interessarci solo a campi vettoriali; le funzioni ordinarie servono allo scopo tanto bene quanto i campi vettoriali che abbiamo considerato. Richiediamo solo che ciascunaJ;i sia definita nell'intersezione di U1 con U;, che fu= - Jj;, che fù +Jjk + ftd = O in ciascuna sovrapposizione tripla e che l'intera collezione di {J;J sia ritenuta equivalente [33.25] Mostrate che l'antisimmetria in Fij è una condizione di coerenza della condizione di tripla sovrapposi:z:ione.
988
Prospettive più radicali: teoria dei t11'islor
Fig. 33.18 - I campi vettoriali Fu sono soggetti a certe richieste. (a) Sull'intersezione di 1 su U 2, come mostrato dal vettore F 12 su U 1• Ma il medesimo movimento relativo è realizzato dal!' opposto di questo su U 2 • (b) È illustrata la condizione di sovrapposizione tripla F ij + F;k = Fìk• Sull'intersezione tripla di U 1, U 2, U 3, il moto F 12 di U 1 su U 2 è la somma del moto F 13 di U 1 su U 3 e del moto F 32 di U 3 su U 2 • (e) Se tutte le carte sono individualmente spostate, questo non ha alcun effetto (tranne un cambiamento di coordinate in ciascuna carta). Ciò illustra il fatto che lo spostamento globale Fu= H, - f1i. non conta assolutamente e deve essere «fattorizzato».
U1 con U;, abbiamo F,ì = - Fu. Questo è illustrato come il movimento di U
a un'altra collezione di {g,:i} di questo tipo, se ciascun membro della collezione di differenze corrispondenti {fu - gif} ha la forma «banale» {h; - h). Diciamo che le Uù} sono ridotte modulo quantità della forma {h; - h1}, che è essenzialmente lo stesso senso in cui il termine «modulo» è stato impiegato in§ 16. l (vedi anche la nozione di «classe d'equivalenza» menzionata nell'introduzione). In effetti, la classe di funzioni ([;1 oh;), a cui si può essere interessati nella teoria della coomologia, può essere estremamente generale. Nella teoria dei twistor, si ha normalmente a che fare con funzioni olomorfe; da qui la nozione di «coomologia olomorfa di fascio». Questa idea di coomologia si applica, in particolare, alle funzioni twistoriali. In verità, dobbiamo pensare che una «funzione twistoriale» non sia, in generale, semplicemente una singola funzione olomorfaf; ma sia data da una collezione di funzioni olomorfe {1;1}, dove ogni singola./,1è definita sulla sovrapposizione di una coppia di insiemi aperti 'U; e~' confj; = - f;l' dove sulle sovrapposizioni triplefj +.fìk +f;; = O e dove l'intera collezione di questi insiemi aperti { 'U;} copre tutta la regione 2 dello spazio dei twistor in considerazione. Un elemento della prima coomologia su 2 (rispetto al ricoprimento {'U;}) è rappresentato come questa collezione {/,i}, ridotta modulo quantità della forma h, - h1, con h; definito su 'U;. Non si deve pensare che la collezione di funzioni fu sia un elemento della coomologia, ma che dia un 989
LA STRADA CHE PORTA ALLA REALTÀ
modo di rappresentare questo misterioso «elemento». Diciamo che lefu sono rappresentanti di questo elemento della prima coomologia. Per la definizione rigorosa di coomologia, tuttavia, dovremmo anche prendere in esame il limite di ricoprimenti sempre più fini della regione :Z; fortunatamente, vi sono teoremi che ci dicono che, per la coomologia olom01fa di fascio, possiamo fermarci quando gli 'U; sono tipi sufficientemente semplici di insieme chiamati insiemi di Stein. 33 (La prima coomologia olomorfa di fascio si annulla sempre su un qualunque insieme di Stein.) In questo modo, se limitiamo l'attenzione a ricoprimenti per cui ogni 'U; è un insieme di Stein, non abbiamo bisogno di dire «rispetto al ricoprimento {U;}» quando ci riferiamo a un elemento di coomologia definito su 2. La nozione di coomologia non dipende dalla scelta specifica del ricoprimento di Stein; un elemento della coomologia è una «cosa» definita su :Z, che risulta essere la stessa qualunque ricoprimento di questo tipo sia impiegato. 34 Questo fatto notevole è parte della magia della coomologia (olomorfa) di fascio! Come si applica tutto ciò alle funzioni twistoriali e agli integrali sul contorno che abbiamo considerato nel paragrafo precedente? La situazione più semplice si ha quando vi sono soltanto due carte 'U 1 e 'U2 , che insieme coprono la regione dello spazio dei twistor in esame. In questo caso, dobbiamo considerare soltanto una funzione, che è la «funzione twistoriale» di §33.8: f(Zcc-y = fi. 2 = - ./2 1• In conformità alle regole della coomologia di fascio, diciamo chef(Zcc-y è equivalente ag(Zcc-y se la differenza è banale nel senso di sopra
f-g=h1 -h2, dove la funzione olomorfa h 1 è definita globalmente su 'U1 e h2 globalmente su 'U2 . È una cosa semplice dimostrare che l'appropriato integrale sul contorno applicato af è proprio lo stesso di quello applicato a g, ogni volta che queste funzioni sono equivalenti in questo senso. Alcune volte, tuttavia, è necessario considerare una struttura di carte più complicata. In sostanza, le «regole di coomologia» di prima per l'equivalenza di funzioni twistoriali sono adattate in modo da preservare le risposte che sono date dalle espressioni degli integrali sul contorno, ma la nozione di integrale sul contorno deve ora essere generalizzata a quella di «integrale su un contorno ramificato», con un ramo in ciascuna regione di sovrapposizione. Questo è indicato in fig. 33.19. 35 Una caratteristica importante della coomologia è quella di essere essenzialmente non locale. Immaginiamo di avere un elemento della coomologia definito in qualche regione :Z; ha allora senso considerare la restrizione di quell'elemento a qualche regione più piccola 2', contenuta in :Z. Il carattere non locale della coomologia si manifesta nel fatto che, per qualsiasi sottoregione (aperta) :Z', sufficientemente piccola, di :Z, la restrizione di questo elemento in :Z' si annulla, nel senso che, dato/;j su :Z', è sempre possibile trovare delle h, in :Z', per le quali.fù = h; - hj. 990
Prospettive pilÌ radicali; teoria dei twistor
Fig. 33.19 - Un «contorno ramificato» (sulla sfera di Riemann), applicabile alla valutazione spaziotemporale di funzioni twistoriali per le quali la copertura consiste in più di due insiemi.
Questa non località delle funzioni twist01iali ci dice che non deve essere attribuito alcun significato al valore preso da.fù in qualche punto particolare. Possiamo, infatti, restringerci in una regione abbastanza piccola attorno a quel punto e scoprire che l'elemento della coomologia scompare completamente; vedi fig. 33.20. Questa non località, mostrata dalle funzioni twistoriali (considerate come elementi della prima coomologia), ci ricorda in modo allettante le caratteristiche non locali degli effetti EPR e del quanglement (§23.10). A mio parere avviene qualcosa d'importante dietro il «sipario», qualcosa che potrebbe un giorno far capire la misteriosa natura non locale dei fenomeni EPR: ma, se così fosse, deve essere ancora scoperto. Dobbiamo pensare che questo «elemento della coomologia» sia come una «cosa» definita nello spazio 2, che è un po' come una fì.mzione definita in 2, ma che è fondamentalmente non locale. Un esempio di questo genere di «cosa» è un intero fibrato vettoriale (complesso) su 2, come è stato descritto in §§15.2, 5; ricordiamo che, nella definizione di fibrato, la parte che giace sopra una regione abbastanza piccola dello spazio base (qui 2) è «banale», nel senso che questa parte è solo un prodotto topologico (cfr. §15.2). (Vedi fig. 15.3.) Questo è un esempio del fatto che, se restringiamo il nostro elemento della prima coomologia in una regione abbastanza piccola, anch'esso diventa «banale», cioè svanisce. Così, «l'informazione» che è espressa in un elemento della coornologia è qualcosa che ha un carattere fondamentalmente non locale.
7r:triz;;~\ cll'elemento · coomologia
I ) ··
.
,:
·
Fig. 33.20 - Un elemento della coomologia può seinpre essere ristretto in una regione più piccola. Se questa regione è sufficientemertte piccola però, la coomologia scompare sempre. Ciò illustra la non località della coomologia. 991
LA STRADA CHE PORTA ALLA REALTÀ
Fig. 33.21 - Un disegno di un «oggetto impossibile» (un «tribarn ). Dal punto di vista locale, non vi è alcunché d'impossibile in quello che il disegno rappresenta. La «impossibilità» è misurata da un elemento di coomologia, che scompare in qualunque regione abbastanza piccola del disegno.
Vale forse la pena di dare un esempio elementare che illustri la nozione di coomologia, anche se solo in un caso semplice, in modo particolarmente chiaro. Si veda la fig. 33.21 per un disegno di un «oggetto impossibile» detto anche «tribar». 36 È evidente che «l'oggetto 3-dimensionale», apparentemente raffigurato dal disegno, non può esistere nell'ordinario spazio euclideo; tuttavia, localmente, non vi è alcunché «d'impossibile» nel disegno. I:impossibilità è qualcosa di non locale, che scompare se si esamina una regione abbastanza piccola del disegno; in effetti, questa nozione «d'impossibilità» in un tale disegno può essere espressa come uno specifico elemento della coomologia. 37·[33 ·261. Questa coomologia, tuttavia, è relativamente semplice, poiché le funzioni Uu} sono assunte costanti. Ho appena sfiorato alcune delle idee fondamentali della coomologia di fascio; vi sono molte applicazioni di queste idee in matematica, e non tutte queste hanno a che fare con l 'olomorfia. I «fasci», a cui si è principalmente interessati nella teoria dei twistor, sono quelli espressi in termini di funzioni olomorfe, e vi è una magia speciale nella teoria della coomologia, in questo contesto particolare. (Grosso modo, il termine «fascio» si riferisce al tipo di funzione a cui si è interessati, ma la nozione di fascio è veramente molto più generale di quella di una funzione ordinaria.) 38 Vi sono molti altri tipi d'impiego della coomologia, inclusi alcuni che sono importanti nello studio degli spazi di Calabi-Yau che compaiono nella teoria delle stringhe (§31.14), per esempio. Vi sono anche parecchi modi molto diversi di definire gli elementi della coomologia di fascio, che si possono dimostrare tutti equivalenti dal punto di vista matematico, nonostante il loro aspetto molto differente. 39 A mio parere, la coomologia (di fascio) è un eccellente esempio di nozione platonica (§ 1.3), che - come lo stesso sistema IC dei numeri complessi sembra avere una «sua propria vita» che si estende molto al di là di qualsiasi modo particolare scelto per rappresentarla. [33.26] Vedete se riuscite a fare questa cosa, spezzando il disegno in un certo numero di disegni sovrapponentisi (gli {'U;} ), ciascuno dei quali rappresenta una struttura coerente del 3-spazio, e impiegando il logaritmo della distanza di questa struttura del 3-spazio dall'occhio dell'osservatore per calcolare le {fu}.
992
Prospettive più radicali; teoria dei twistor
33.10 Twistor e suddivisione in frequenze positive e negative Come includiamo nella teoria dei twistor la condizione di frequenza positiva, così fondamentale in QFT? Rammentiamo, da §9.5, il modo con cui la divisione della sfera di Riemann S2 negli emisferi sud e nord, s- e S+, ci offre la suddivisione di una funzione, definita sull'equatore S1, nelle sue parti di frequenza positiva e negativa. La parte di frequenza positiva si estende in s-, mentre quella di frequenza negativa si estende in s+ (fig. 33.22a). Lo spazio proiettivo dei twistor fa una cosa analoga, ma in un modo globale che si applica direttamente ai campi non massivi, nella loro interezza; ottiene ciò in conformità a un'analogia diretta tra la sfera di Riemann e lo spazio proiettivo dei twistor, dove l'analogo di una funzione sulla sfera di Riemann S2 è un elemento della prima coomologia su IPlL L'analogo dell'equatore S 1 deve essere lo spazio !PN, che divide IPlf (che è uno spazio CIP 3) in due metà, IJJllf+ e !Plf-, proprio nello stesso modo con cui S 1 divide S2 (che è uno spazio CIP 1) nei due corrispondenti40 emisferi s- es+ (fig. 33.22b). In termini più espliciti, l'analogo di un'ordinaria funzione (complessa) definita su S 1 o su s- o su s+ è, rispettivamente, un elemento della prima coomologia definito su !PN o su IJJllf+ o su !Plf-. I campi non massivi su M (rigorosamente, su 7lt#) sono rappresentati come elementi della prima coomologia su !PN; ciascuno di questi può essere espresso (in modo sostanzialmente unico) come somma di un elemento che si estende in IJJllf+ e un elemento che si estende in !Plf-. Il primo descrive un campo non massivo di frequenza positiva, men-!
S2 = (:l]Jll
lP'lf = ICIP' 3
l
prima crono logia di frequenza positiva
IP'lf' _j_ - -1---Ì---Ì---=---IP'N y
~
i
funzione di frequenza negativa
(a)
(l]Jllf-
j
(b)
Fig. 33.22 - Un'analogia tra la sfera di Riemann S2 (= CIP' 1) e lo spazio proiettivo dei twistor [Pllf (= CIP' 3). (a) Una funzione complessa (vale a dire, un elemento «della zeresima coomologia» ), definita sull'asse reale ~ di S2, si suddivide nella sua parte di frequenza positiva, che si estende in modo olomorfo in quello che è qui raffigurato come l'emisfero nord s-, e nella sua parte di frequenza negativa, che si estende nell'emisfero sud s+. (La sfera di Riemann è qui tracciata in modo che ~ sia il suo equatore, ma che - i sia aL polo nord e i al polo sud; confrontate con fig. 8.7 e fig. 9.10, §9.5.) (b) Un elemento della prima coomologia, definito su IP'N (e rappresentante un campo senza massa) si suddivide nella sua parte di frequenza positiva, che si estende in modo olomorfo nella metà superiore [Pllf+ dello spazio proiettivo dei twistor, e nella sua parte di frequenza negativa, che si estende nella metà inferiore [Pllf-. 993
LA STRADA CHE PORTA ALLA REALTÀ
tre il secondo uno di frequenza negativa. 41 In termini di spaziotempo, questa parte di frequenza positiva del campo si estende per essere definita nel tubo anteriore, che da §33.8 ricordiamo essere la regione rwtJ+ di CM 11 costituita dai punti che nello spazio dei twistor sono rappresentati da linee proiettive in [Plf-+. In CM+, questi sono i punti ( complessi) i cui vettori di posizione hanno parti immaginarie che sono di tipo tempo e che puntano verso il passato.P 3•27 l Questa analogia tra !Plr e la sfera di Riemann conduce a un possibile modo con cui idee della teoria dei twistor potrebbero trovare un'analogia con alcune idee della teoria delle stringhe. Si rammenti, da §§31.5, 13, che superfici di Riemann sono usate per rappresentare «storie di stringhe» in quella teoria. La sfera di Riemann (CIP 1) è la più semplice di queste superfici, ma per rappresentare tipi più generali di storie di stringhe sono introdotte superfici con vari numeri di «manici» (superfici di Riemann di genere più elevato - vedi §8.4). Queste superfici di Riemann possono avere anche «buchi» (con bordi S 1), oltre ai manici (vedi fig. 31.5); per analogia, 42 si possono considerare generalizzazioni dello spazio !Plr, che acquistino in modo corrispondente «manici», e anche «buchi» (con frontiere che siano copie di IPN). Queste generalizzazioni sono state chiamate «spazi twistoriali a pretzel» e può essere sviluppata una forma di QFT basata su questi spazi (vedi fig. 33.23). Lo status di queste idee non è stato finora completamente accertato. Dal punto di vista storico, la richiesta di frequenza positiva - e questa proprietà per cui IPN divide IPlr in due metà - ham10 offerto una motivazione fondamentale per la formulazione originaria della teoria dei twistor, nel 1963, più di dodici anni prima della scoperta che i campi non massivi hanno una descri-
(a)
(B)
Fig. 33.23 - (a) Teoria conforme dei campi (un modello di tipo teoria delle stringhe), basata su generalizzazioni della sfera di Riemann a supe1fici di Riemann di genere maggiore, che possono avere «buchi» di grandezza finita così come manici (vedi fig. 31.5, i buchi rappresentano luoghi dove è introdotta informazione esterna). (b) Una versione twistoriale che impiega generalizzazioni di IJJ>lr, acquisendo «manici» in modo corrispondente alle superfici di Riemann e anche «buchi» i cui bordi sono copie di IJJ>N («spazi twistoriali a pretzel»).
[33.27] Dimostrate, dall'equazione d'incidenza, che un vettore complesso di posizione 1" per un punto R di ICM è rappresentato da una linea proiettiva in IPlf;, se e solo se la parte immaginaria di ,A è di tipo tempo e punta verso il passato.
994
Prospettive più radicali; teoria dei twistor
zione twistoriale come prima coomologia olomorfa di fascio. 43 È straordinario che anche qui abbiamo di nuovo una proprietà che è specifica a uno spaziotempo con quattro dimensioni e segnatura lorentziana. Vi è anche qualcosa di molto specifico nel fatto che nella teoria dei twistor svolgono un ruolo elementi della prima coomologia, invece che ordinarie funzioni - che sono elementi della «zeresima» coomologia - o elementi della seconda coomologia o di coomologie di ordine ancora più elevato. Esistono (e hanno un ruolo da svolgere nella teoria dei twistor) anche nozioni di coomologie di ordine più elevato, ma vi è qualcosa di unico nella prima coomologia, che è fondamentale per la teoria dei twistor. Infatti, solo queste quantità trovano poi un ruolo diretto nella generazione di deformazioni dello spazio dei twistor. A ciò arriveremo in seguito.
33.11 Il gravitone non lineare Gli elementi di coomologia (le funzioni twistoriali) che abbiamo finora preso in considerazione dovrebbero essere pensati come interamente «passivi», nel senso che sono semplicemente «dipinti» sullo spazio (dei twistor). Questo corrisponde al fatto che descrivono campi spaziotemporali che sono soltanto presenti nello spaziotempo e non influenzano altri campi. Per capire come essi possano davvero offrire un'influenza attiva, pensiamo che la «pittura» sullo spazio dei twistor «si asciughi», così che ora questo spazio viene distorto (fig. 33.24). Per vedere come questo possa avvenire, pensiamo che le nostre funzioni twistorialifu, precedentemente passive, siano associate a un campo vettoriale FiJ in modo appropriato. «Facendo scorrere le carte l'una sull'altra» nella direzione di questi campi vettoriali di una quantità infinitesima, cominciamo ad «asciugare la pittura» e costruiamo uno spazio dei twistor infinitesimamente «curvo». Possiamo immaginare che questa deformazione sia «esponenziata» (§ 14.6), fino a ottenere una deformazione finita dello spazio dei twistor. La prima situazione in cui questa procedura è stata applicata con successo si è verificata nel caso di gravità antiautoduale. 44 Nel caso infinitesimo (campo debole), abbiamo un campo non massivo di elicità S = - 2, così im-
(a)
(b)
Fig. 33.24 - Un elemento della prima coomologia di un campo vettoriale è «passivo» (vale a dire, soltanto «dipinto» sullo spazio). Affinché abbia un'influenza attiva, pensiamo che la «asciugatura della pittura» sia il risultato di una esponenziazione del campo vettoriale su ciascuna sovrapposizione. Questa dà come risultato uno «scivolamento» finito di una carta sull'altra, dando una distorsione finita, o uno «spazio curvo».
995
LA STRADA CIIE PORTA ALLA REALT;\
r ·~-
:,"i·1
jrj
:1'1
7
U1
;r:, 1"t"
',f
t:
U2
w~
7
.§~ ~
...;r-spaz10,..
1;
j
j
In
simplettico
Fig. 33.25 -Applicate l'idea di fig. 33.24 al caso della descrizione twistoriale (con due carte) della gravità antiautoduale. Il campo vettoriale è capaoJ°)alw 1 - capaw 1)a1ro0 , dovef è una funzione omogenea di grado 2. Otteniamo uno spazio twistoriale curvo (una porzione) 7. Vi è una proiezione globale di 7 sul Jt spazio. Ciascuna fibra di questa proiezione è un 2spazio simplettico complesso, così come Io stesso n spazio.
piegando la formula precedente - 2S - 2 per il grado di omogeneità abbiamo una funzione twistoriale f(= J;) di omogeneità 2. Stiamo assumendo, per semplicità, che vi siano solo due carte, U 1 e U 2 , ciascuna essendo ritenuta una porzione di spazio twistoriale lr piatto con le coordinate standard di §33.5. Il richiesto campo vettoriale F, costruito a partire daj; risulta essere
Si noti che il grado di omogeneità 2 di/compensa esattamente quello dei due operatori differenziali per dare un operatore che è omogeneo di grado zero, così che agisce sullo spazio proiettivo dei twistorY 328 l Immaginiamo ora di esponenziare questo spostamento infinitesimo di una carta rispetto all'altra (vedi fig. 33.25); otteniamo allora uno spazio (una porzione) twistoriale curvo 7. I; assenza di n derivate nella nostra relazione infinitesima di raccordo implica che il twistor in una carta deve avere la stessa n parte del twistor con cui si raccorda nell'altra carta. Ne consegue che l'operazione che «proietta fuori» il n- spinore dall'intero spazio 7 è coerente su tutto 7; cioè, vi è una proiezione globale di 7 sullo spazio dei n spinori. Ignoriamo (o meglio, rimuoviamo) gli «elementi zero» sia di 7 sia del 1C spazio; troviamo allora che 7è una specie di fibrato sul nspazio (vedi §15.2). 45 Ciascuna fibra (I' immagine inversa di qualsiasi particolare n, cioè la parte di 7 che si trova «sopra» n) risulta essere una 2-varietà complessa con una struttura simplettica, come fa lo stesso n- spazio (vedi §14.8 - qui significa solo che su questa 2-varietà è definita una misura di area), un fatto che è assicurato dalla forma specifica del raccordo, data prima. Come ritorniamo da questo spazio twistoriale curvo a una nozione di [33.28] Perché grado zero implica che questo dia un campo vettoriale su una regione in
IP'lf? Suggerimento: che cosa è il commutatore di F con :r? 996
Prospettive pizì radicali; teoria dei twistor
«spaziotempo»? La risposta è che ciascun «punto dello spaziotempo» corrisponde in modo unico a una sezione olomorfa del fibrato 7. (La nozione di sezione olomorfa è stata data in§ 15.5; in questo caso, è un'applicazione dal 1t" spazio in 7.) Perché questa è una definizione ragionevole? Nel caso di un lf piatto, ciò equivale a rappresentare il punto spaziotemporale (probabilmente complesso) R con l'applicazione che porta n-in Z = (irn, n-). In termini dello spazio proiettivo piatto dei twistor !Plf, questa sezione è semplicemente la linea retta R (una sfera di Riemann, CIP 1) in !Plf che abbiamo impiegato in §33.5 per rappresentare R_[ 33 z91È veramente straordinario che questa definizione di «punto dello spaziotempo» funzioni altrettanto bene per lo spazio dei twistor curvo 7. Troviamo 46 che vi è una famiglia a quattro parametri complessi di sezioni olomorfe, proprio come nel caso piatto. (Nello spazio proiettivo IP7 questa è una famiglia a quattro parametri complessi di linee CIP 1.) Abbiamo perciò una varietà complessa 4-dimensionale per rappresentare questa famiglia. Il fatto che la dimensionalità sia quattro è veramente notevole - è un esempio della magia complessa a numero di dimensioni complesse maggiore - che segue da teoremi del matematico giapponese Kunihiko Kodaira. 47 (L'esperienza con sole varietà reali avrebbe potuto farci supporre un numero infinito di parametri; ma abbiamo già osservato in §15.5 che il numero di sezioni olomorfe può essere molto limitato.) In fig. 33.26, questa procedura è illustrata in modo grafico (nella descrizione proiettiva). Partiamo con un'opportuna regione 'R dello spaziotempo complesso di Minkowski CM; per semplicità, assumiamo che 'R sia un opportuno intorno (aperto) di un punto R di CM. La corrispondente regione 2 dello spazio proiettivo !Plf è quella spazzata dalla famiglia di linee, ciascuna delle quali rappresenta un punto di 'R; questa sarà un intorno (chiamato intorno tubolare) della linea Rin !Plf che rappresenta R (fig. 33.26a). Possiamo ritenere che la topologia di 2 sia S2 x IR4, dove S2 viene dalla topologia della linea R - o, in modo equivalente, del n--spazio proiettivo e IR 4 descrive la parte trasversale dell'immediato intorno di ciascun punto di R. Pensiamo ora che S2 ( qui il n--spazio proiettivo) sia separato in due semisfere, Jeggermente estese in modo che vi sia un «collare» di sovrapposizione, ritenendo poi che 2 sia costituito dai due pezzi (insiemi aperti) sovrapposti, 'U1 e 'U2 , giacenti su ciascuna di queste semisfere leggermente estese (fig. 33.26b). «Spostiamo» ora 'U2 rispetto a 'U1, secondo il campo vettoriale di prima, per ottenere la nostra regione deformata IP7 dello spazio proiettivo dei twistor (fig. 33.26c). Vi è ancora una proiezione globale sul re spazio (fig. 33.26d), che dà la struttura di fibrato; tuttavia, le originarie «linee rette» in 'U 1 e 'U2 sono ora spezzate, così che non danno sezioni, ma il teorema di Kodaira ci dice che vi è una nuova famiglia a quattro parametri di curve olomorfe in IP7, che di[33.29] Spiegate il senso in cui questa linea è una «sezione» di IP'lf - I. 997
LA STRADA CHE PORTA ALLA REALTÀ
M
IP'"f (a)
,✓
rv.:?
,.-,
;-- ..
' ~Jl,'
\I G ' l
"_,, ;e
(b)
1t
spazio-i,, c==-==--c-====::>>
Fig. 33.26 - La costruzione di un gravitone non lineare sinistrorso. (a) Nella corrispondenza standard dello spazio piatto dei twistor, i punti P e Q di CM hanno separazione nulla tutte le volte che le corrispondenti linee P e Q in IP'lr si incontrano. (b) Desideriamo deformare, in qualche modo, IP'lr in uno spazio twistoriale curvo, ma teoremi matematici ci dicono che questo non può essere fatto in modo globale. Di conseguenza, prendiamo come «spaziotempo» di partenza solo un conveniente intorno (aperto) i?.? di un punto Rin CM. (c) Questo corrisponde a un intorno tubolare 2, in IP'lr, della linea R. (d) Possiamo ora applicare la procedura di fig. 33.25 per deformare 2 (considerato come l'unione di due insiemi aperti, U 1 e 'U2). (e) Troviamo, tuttavia, che la linea originaria R è adesso spezzata e non può essere impiegata come definizione ragionevole di un «punto dello spaziotempo». (f) Ci viene in soccorso un teorema di Kodaira, per dirci che vi è una famiglia a 4 parametri di «linee» R' (curve olomorfe compatte, appartenenti alla medesima classe topologica delle nostre linee originarie), che serviranno a questo scopo. (g) I punti del nostro cercato spazio '7lt del «gravitone non lineare» (un 4-spazio complesso) sono dati da curve di Kodaira R'. La metrica (complessa conforme) di '7lt è definita - come in (a) - dalla condizione che P' e Q' abbiano separazione nulla tutte le volte che le corrispondenti linee P' e Q' si incontrano. La curvatura di Weyl di 'Jltrisulta essere automaticamente antiautoduale, ed esso è anche Ricci-piatto in virtù dei dettagli della costruzione.
ventano le vere sezioni olomorfe della struttura di fibrato. Il richiesto spazio
'i1t è costruito in modo che ciascuno dei suoi punti corrisponda a una di queste sezioni (fig. 33.26e); risulta che a 'i1t può essere assegnata una metrica g in modo naturale e che la sua curvatura di Weyl è antiautoduale, ed esso è Ricci-piatto. Possiamo trovare facilmente i coni nulli di g (la struttura conforme) impiegando il fatto che due punti P e R di 'i1t sono separati da un intervallo di tipo nullo, se e solo se le corrispondenti linee P e ~ in IJJl7 si intersecano (fig. 33.26). 998
Prospettive più radicali; teoria dei twistor
Il lettore può essere legittimamente preoccupato per il significato fisico di questo «spaziotempo» 'ìlt; infatti, è risultato essere complesso (e perciò 8-dimensionale invece che 4-dimensionale, quando considerato come una varietà reale). Nel caso piatto, potremmo individuare i punti reali dello spaziotempo (eventi in M) prendendo sezioni di 7r giacenti in N, ritenendo poi che 71(, sia semplicemente la complessificazione CM dello spazio di Minkowski M; ma nel caso curvo non ci possiamo permettere un simile lusso. In effetti, nel caso curvo, lo «spaziotempo» che otteniamo con questa costruzione è necessariamente una varietà complessa per meriti propri e non può avere origine da una complessificazione di uno spaziotempo reale di Lorentz. Come mai? Una 4-varietà di Lorentz con una curvatura di Weyl antiautoduale è necessaiiamente Weyl-piatta (perché il complesso coniugato della parte autoduale nulla è la parte antiautoduale, che è quindi anch'essa nulla). Se è anche Ricci-piatta, allora è semplicemente del tutto piatta. Nel caso complesso,48 d'altra paiie, vi è una vasta famiglia di 4-varietà non banali, antiautoduali e Ricci-piatte. È un fatto straordinario che tutte queste possano essere ottenute (almeno localmente) per mezzo della sopra menzionata procedura twistoriale! Che cosa dobbiamo fare di questo spazio complesso 71(,? Dal punto di vista fìsico, l'interpretazione di un 4-spazio complesso, antiautoduale e Ricci-piatto (se si può dire che sia di «frequenza positiva», in qualche senso appropriato) è che rappresenta un gravitone sinistrorso. In realtà, è un gravitone non lineare, nel senso che è una «funzione d'onda» di qualche tipo, ma è ora una soluzione della vera equazione non lineare di Einstein per il vuoto (Ricci-piatto), invece che della sua approssimazione lineare. Avremmo avuto quest'ultima se avessimo assunto che la funzione twistoriale f fosse solo un elemento della coomologia, invece di permettere che la «pittura si asciugasse» e quindi deformasse lo spazio stesso dei twistor. Osserviamo che la teoria dei twistor ci ha condotto in una direzione curiosa e precedentemente inaspettata nell'unificazione delle idee quantistiche con la struttura dello spaziotempo; le nostre funzioni d'onda twistoriali sono ora entità non lineari, e quindi cominciano ad apparire deviazioni dalle regole standard della meccanica quantistica lineare (§§22.2-4). Vi è una caratteristica di questa costruzione che è particolarmente degna di nota. Se prendiamo un punto qualsiasi Z dello spazio curvo dei twistor 7, troviamo che qualsiasi intorno sufficientemente piccolo di Z ha una struttura del tutto identica a quella di qualche intorno di qual1;mque punto Z: dello spazio piatto dei twistor 7r (non giacente nella regione «infinita» I - vedi §33.5). La struttura locale posseduta dalio spazio dei twistor è, di conseguenza «floppy», nel senso in cui questa parola è stata impiegata in § 14.8. In questo modo, tutta l'informazione riguardante la curvatura, eccetera, dello spazio 71(, è memorizzata globalmente in 7, non localmente; ciò è una riflessione del fatto, cui si è fatto riferimento prima, che un elemento della coomplogia definito da una funzione twisto1iale scompare completamente quando viene ristretto a una regione abbastanza piccola. Nello spazio dei twistor non vi è alcuna «equazione di 999 \
LA STRADA CHE PORTA ALLA REALTÀ
campo». Il genere d'infonnazione che è normalmente memorizzato nelle soluzioni delle equazioni di campo nello spaziotempo (in questo caso, l'equazione antiautoduale di Einstein) sembra essere memorizzato solo non localmente in una costruzione dello spazio dei twistor. 49
33.12 Twistor e relatività generale Questa «costruzione del gravitone non lineare» è stata fondamentale per lo sviluppo della teoria dei twistor sin dalla metà degli anni Settanta. Nella sua forma iniziale, richiese progressi in due diverse direzioni. La più ovvia di queste era un'analoga costruzione per il gravitone non lineare destrorso e la sua combinazione con quello sinistrorso per avere la possibilità di formare stati di polarizzazione misti (come gravitoni non lineari a polarizzazione piana). Ciò sembrerebbe una parte cruciale del programma dei twistor. Come è stato fatto notare prima, la nozione di «gravitone non lineare» è veramente nello spirito di ricerca di una teoria, propagandata con forza nel capitolo 30, in cui le regole lineari standard dell'ordinaria teoria U quantistica debbano piegarsi per poter ottenere la corretta unione con la relatività generale di Einstein. Tuttavia, il «gravitone» che ha avuto origine dalla costruzione precedente è soltanto un «mezzo gravitone», poiché vi è stato incorporato soltanto uno dei due possibili stati di elicità. Qualche lettore attento potrebbe proporre che, se passassimo a una descrizione in termini dei twistor duali Ww invece che dei twistor za, potremmo ottenere, ripetendo la precedente costruzione con i twistor duali, una funzione d'onda non lineare per un gravitone destrorso.f 33 ·30l In questo modo sarebbe il gravitone destrorso a corrispondere al grado di omogeneità 2 (rispetto a W,J, mentre quello sinistrorso corrisponderebbe al grado di omogeneità - 6; questo, tuttavia, non ci tirerebbe fuori dalle difficoltà, perché perderemmo gli stati di elicità sinistrorsa - e non avrebbe alcun senso usare le variabili Wa per gli stati destrorsi e le variabili za per quelli sinistrorsi, soprattutto perché abbiamo bisogno di descrivere stati di elicità misti. 50 Il problema di «esponenziare» in qualche modo le funzioni twistoriali f(Z~ di grado d'omogeneità 6 per ottenere un gravitone non lineare destrorso è noto come problema googly (gravitazionale). (La parola «googly» è un termine del cricket che descrive una palla ruotante in senso destrorso attorno alla sua direzione di moto, anche se lanciata con un'azione che normalmente sembrerebbe dover impartire una rotazione sinistrorsa.) Ci sono voluti quasi venticinque anni per trovare una soluzione plausibile, ma sembra che recenti sviluppi abbiano portato a un'appropriata costruzione. 51 Tuttavia, nel momento in cui sto scrivendo, le procedure sono ancora ipotetiche rispet[33.30] Per quale motivo? Suggerimento: Perché una riflessione spaziale converte i twistor in twistor duali? 1000
Prospettive più radicali; teoria dei twistor
to a molti importanti aspetti. Non tenterò di descrivere qui questi sviluppi, dirò solo che la nuova caratteristica essenziale è che le fibre della proiezione del nostro spazio twistoriale curvo 7 sullo spazio proiettivo IJJl7 vengono «twisted up» (distorte) in un modo che è definito da una funzione twistoriale di grado di omogeneità - 6. (Il «twist» è effettuato per mezzo dell'esponenziazione di un campo vettoriale, su un paio di carte sovrapposte, dalla forma ingannevolmente semplice C/_ 6 dove C è una opportuna costante e f_ 6 è una funzione twistoriale di grado d'omogeneità - 6.) Ciò permette d'includere assieme sia la parte sinistrorsa sia quella destrorsa del gravitone. Almeno nel caso di uno spaziotempo 7lt asintoticamente piatto, in modo opportuno, vi è un'esplicita costruzione diretta per 7in termini di ?I(. Vi è, inoltre, una proposta provvisoria per ottenere ?I( da un dato 7, cioè per costruire punti spaziotemporali dalla struttura puramente twistoriale di 7, che si congettura assicuri che la richiesta Ricci-piattezza (l'equazione di Einstein per il vuoto) sia correttamente inclusa. Questa proposta si ricollega, in modo significativo, a un progetto di ricerca a lungo termine, dovuto a Ezra T. Newman e ai suoi colleghi, per interpretare i punti dello spaziotempo in tennini dei cosiddetti «tagli di cono luce», che sono le intersezioni dei coni luce di 7lt con l'infinito nullo futuro !V. 52 Tuttavia, anche se apparentemente promettenti, alcuni importanti aspetti di questa costruzione twistoriale rimangono ancora irrisolti. 53 I.:altra direzione in cui l'originaria (risalente al 1975/1976) costruzione del gravitone non lineare sinistrorso esigeva migliorie era quella di generalizzazioni dalla teoria gravitazionale ad altri campi di gauge. Molto presto, nel 1976/1977, Richard Ward mostrò come si poteva ottenere anche il generale campo antiautoduale di gauge impiegando una costruzione twistoriale analoga a quella del caso gravitazionale. In verità, la costruzione di Ward ha portato a importanti sviluppi, da parte di Ward e altri, in campi d'interesse matematico, in particolare nel campo dei sistemi integrabili (equazioni non lineari che possono, in un senso appropriato, essere risolte nel caso generale). In quest'area, la teoria dei twistor ha offerto una poderosa visione d'insieme del soggetto nella sua interezza. 54 Sembra probabile che i sopra menzionati progressi verso una completa soluzione del problema gravitazionale dell'elicità mista daranno anche indicazioni sul modo con cui trattare, all'interno del formalismo dei twistor, i campi di gauge generali (di elicità mista).
zaa;aza,
33.13 Verso una teoria twistoriale della fisica delle particelle Questo ci conduce al problema riguardo al modo in cui la teoria dei twistor potrebbe svilupparsi in una teoria fisica completa - cosa che al momento non è. A questo scopo, è impo1iante che siano ulteriormente sviluppate due altre aree di studio nella teoria dei twistor. La prima è quella di fornire un trattamento globale della QFT; in effetti, vi è stato un notevole insieme di attività, sviluppate 1001
LA STRADA CHE PORTA ALLA REALTÀ
soprattutto da Andrew Hodges e dai suoi studenti, a Oxford (con qualche spinta iniziale mia e di alcuni altri nei primi anni Settanta), che danno un approccio perturbativo alla QFT in cui i diagrammi di Feynman sono rimpiazzati da costruzioni note come diagrammi twistoriali. Questi implicano integrazioni su contorni a dimensione maggiore e il fonnalismo realizza alcuni straordinari successi nell'evitare molti degli infiniti che s'incontrano nelle convenzionali procedure di Feynman. 55 Tuttavia, questo approccio è ancora molto più complicato di quello che si vorrebbe e manca di un indipendente principio di base che ci dica con esattezza quali integrali eseguire sul contorno, senza dover fare ricorso all'intennediazione delle convenzionali espressioni di Feynman. La seconda di queste aree è la teoria twistoriale delle particelle che è stata sviluppata principalmente da Zoltan Pe1jés, George Sparling, Lane Hughston, Paul Tod e Florence Tsou (Tsou Seung Tsun) da idee da me stesso introdotte dalla metà degli mmi Settanta ai primi anni Ottanta, ma che erano poi rimaste a lungo in letargo. In questo caso l'idea fondamentale è che, mentre le particelle non massive possono essere descritte da fonzioni d'onda twistoriali di una singola variabile twistoriale, vale a dire j(Z0 ), quelle massive richiedono più variabili, vale a dire xa, ... , za. Vi è un'espressione per la quantità di moto e il momento angolare di una particella massiva che implica la somma dei contributi individuali di tutti questi twistor, ma ora vi è un gruppo di simmetria interna che ha origine da trasformazioni tra queste variabili twistoriali e le loro complesse coniugate che non hanno effetto sulla quantità di moto e sul momento angolare totali. È probabilmente degno di nota il fatto che si ottengono grnppi che includono, ma che generalizzano leggermente, il gruppo U(2) delle interazioni elettrodeboli e quello SU(3) delle interazioni forti. Sono state osservate alcune straordinarie relazioni con la classificazione standard delle paiiicelle secondo il modello standard, ma poi lo schema ha ristagnato per alcune ragioni tecniche; sembra che ci sia una ragionevole prospettiva che i recenti sviluppi sul «problema googly» - soprattutto se potranno essere applicati ai campi di gauge - possano riaprire il soggetto. Vi è anche, a mio parere, una significativa possibilità che la proposta di Chan-Tsou per un modello della fisica delle particelle, brevemente discussa in §25.8, possa concordare in modo significativo con questi sviluppi. Questa proposta richiede che vi sia un gruppo duale a ciascun gruppo (non abeliano) di simmetria delle particelle, oltre all'originario gruppo cli gauge. La teoria dei twistor suggerisce che, in conformità alla costruzione di Ward sopra menzionata - assieme alla sua ipotizzata versione «googly» ciascun gruppo dovrebbe figurare sia in versione antiautoduale sia in versione autoduale; e questo sembra richiedere che la forma duale del gruppo cli gaugè dovrebbe svolgere un ruolo significativo così come l'originario gruppo di gauge. In questo modo, attraverso la mediazione cli idee provenienti dalla proposta di Chan-Tsou, il programma twistoriale per le pa1iicelle potrebbe avere una sua parte nella futura fisica delle particelle. Inoltre, si deve anticipare che progressi coronati da sue1002
Prospettive più radicali; teoria dei twistor
cesso in questa area dovrebbero avere anche un forte impatto sul programma di QFT della teoria dei diagrammi twistoriali.
33.14 Qual è il futuro della teoria dei twistor? Nelle mie descrizioni della teoria dei twistor, ho omesso l'obbligatorio avvertimento per il lettore che le mie opinioni su questo soggetto non riflettono quelle della comunità dei fisici in generale. In realtà, poiché ho dedicato più della metà della mia vita alla teoria dei twistor (sia pure in maniera irregolare), è poco probabile che il mio punto di vista corrisponda a quello della grande maggioranza di fisici che non si sono dedicati principalmente a questa teoria. Dovrei inoltre chiarire che il numero di fisici che conoscono bene questo soggetto è piuttosto ristretto, sicuramente molto piccolo in relazione al numero di quelli che sanno qualcosa della teoria delle stringhe o della supersimmetria. Non si può certo dire che la teoria dei twistor sia una attività «tradizionale» dei fisici teorici odierni. Ma la teoria dei twistor condivide con la teoria delle stringhe il fatto di aver avuto una significativa influenza sulla matematica pura: questa viene infatti considerata una delle sue più grandi forze. La teoria dei twistor ha avuto un importante impatto sulla teoria dei sistemi integrabili (come è stato brevemente menzionato in precedenza), sulla teoria delle rappresentazioni56 e sulla geometria differenziale. (In quest'ultima area dovrei menzionare il lavoro di Sergei A. Merkulov e L. J. Schwachhofer, che sono stati capaci di trovare una soluzione per quello che è conosciuto come «problema dell'olonomia», impiegando metodi sviluppati da quelli dell'originaria costruzione del gravitone non lineare. 57 La teoria dei twistor ha, in lavori collegati, un valore significativo nella costruzione delle cosiddette «varietà iperkahleriane», «spazi di Zoll», eccetera.) 58 La teoria dei twistor è stata ampiamente guidata da considerazioni di eleganza e interesse matematico e deve molta della sua forza alla sua rigorosa e fruttuosa struttura matematica. Il lettore ingenuo potrebbe avere la tendenza a dire, con qualche giustificazione, che tutto questo è molto bello, ma non sono stato io a dire nell'ultimo capitolo che una delle debolezze della teoria delle sh-inghe è quella di essere guidata, in larga misura, dalla matematica e non molto dalla natura del mondo fisico? La stessa cosa, sotto molto aspetti, è una critica valida anche per la teoria dei twistor. Non vi è certamente alcun motivo, proveniente da moderni dati d'osservazione, per indurci a credere che la teoria dei twistor sia la strada che la fisica moderna dovrebbe seguire; e molti potrebbero avere la sensazione che la natura fortemente chirale di questa teoria ci porti troppo in direzione di un' asimmetria spaziale. Dopo tutto, non ci sono prove fisiche che un'asimmetria tra destra e sinistra abbia qualche ruolo nella fisica gravitazionale. Nei capitoli 27, 28 e 30, ho evidenziato il bisogno di un'asimmetria temporale nell'appropriata 1003
LA STRADA CHE i'ORTA ALLA REALT/\
unione tra meccanica quantistica e gravità, ma non vi è alcuna evidente esigenza fisica di un'asimmetria spaziale (eccetto forse indirettamente, per via del teorema CPT della QFT; vedi §25.4 e §30.2). Può succedere, naturalmente, che l'asimmetria spaziale del formalismo non si traduca in un' asimme1Tia negli effetti fisici; il motivo migliore per sperare che ciò avvenga sta nel fatto che le algebre generate dalla coppia (Z"', - Pia;aza), da una parte, e da ( Zm Za) dall'altra, sono formalmente identiche. Ciò suggerisce che qualunque conclusione potremmo raggiungere con l'impiego di una descrizione con i twistor (vmiabili za) potrebbe essere ugualmente ottenuta con l'impiego di una descrizione con i twistor duali (usando variabili Wa =za). Questa analogia, inoltre, è così completa che nessuna asimmetria tra destra e sinistra nella gravitazione potrà comparire nella teoria 1isultante. D'altra pmte, se il formalismo deve rispecchiare la Natura, dovremo richiedere un'asimmetria tra destra e sinistra al momento di descrivere le interazioni deboli (§25.3). Tuttavia, nell'attuale stato relativamente primitivo della teoria dei twistor, non c'è alcun motivo evidente per questa differenza. La principale critica che può essere rivolta alla teoria dei twistor, ora come ora, è che non è realmente una teoria jìsica; certamente non fa alcuna previsione fisica univoca. Dalla mia (super)ottimistica prospettiva, ritengo che la teoria dei twistor sia vagamente comparabile al formalismo hamiltoniano della fisica classica. La teoria hamiltoniana non ha introdotto cambiamenti fisici, ma ha offerto un nuovo punto di vista sulla fisica classica che in seguito ha dimostrato di essere proprio ciò che era necessario per la nuova teoria quantistica secondo le prescrizioni di Schrodinger, come è stato descritto nei capitoli 21-23. La teoria dei twistor è, analogamente, solo una riformulazione che non introduce necessariamente cambiamenti fisici; la speranza ottimistica è che la sua struttura possa anche offrire un trampolino di lancio per qualche significativo sviluppo fisico nel futuro. Non vi è, naturalmente, alcun obbligo per lo scettico di credere che tali sviluppi avranno luogo, e la principale tesi a favore della teoria dei twistor sta, come nel caso della teoria delle stringhe (o della M-teoria), nella forza del suo fascino estetico o matematico. Queste due teorie, tuttavia, sono incompatibili, nel loro stato attuale, poiché operano con spazitempo di numero diverso di dimensioni. Si potrebbe giustamente (ma forse troppo rudemente) dire che una delle previsioni della teoria dei twistor è che le aspirazioni della teoria delle stringhe sono sbagliate-- o, viceversa, che una delle previsioni della teoria delle stringhe è che quelle della teoria dei twistor sono sbagliate! Questa incompatibilità non si estende a varianti o nuove interpretazioni della teoria delle stringhe (o della M-teoria) in cui non si ritiene che le dimensioni extra siano dimensioni spaziotemporali, ma siano dimensioni «interne» di un qualche tipo. Anche se una simile nuova interpretazione sembra fornire un punto di vista coerente, è alquanto in disaccordo con la spinta alle spalle della teoria delle stringhe, nella versione normalmente abbracciata.
naia
1004
Prospettive più radicali; teoria dei twistor
A questo proposito, dovrei ricordare al lettore alcuni lavori molto recenti, a cui ho accennato in §31.18, dovuti principalmente a Edward Witten. 59 Questi mettono in rilievo alcune affascinanti possibilità per un nuovo modo di vedere le ampiezze di scattering di Yang-Mills. Combinano idee della teoria dei twistor con alcune idee della teoria delle stringhe - ma adesso in un contesto 4-dimensionale! In qualsiasi caso, la teoria dei twistor richiede qualche nuovo input. Fra i più importanti ingredienti di altre teorie fisiche di successo hanno figurato lagrangiane e integrali sui cammini di Feynman, che hanno fornito l'appropriato modo QFT di trattare le equazioni di campo (vedi §26.6). Tuttavia, la teoria dei twistor si gloria della scomparsa delle equazioni di campo (§§33.8, 11), perciò sembra che qualche nuova idea sia necessaria per lo sviluppo di una completa QFT twistoriale. 60 La teoria dei twistor fa qualche precisa «previsione»? Ciò che penso possa essere più simile a una previsione è che le motivazioni alla base della teoria implicano che l'universo dovrebbe avere curvatura spaziale negativa, vale a dire K 3). 61 In ciascuno dei casi K > O, K = O, K < O, vi è un gruppo di simmetrie esatte, ma soltanto nel caso K < O questo è un gruppo olomorfo. In effetti, in questo caso, il gruppo è esattamente quello che ci ha iniziato alla «magia complessa» della teoria dei twistor, vale a dire il gruppo di Lorentz 0(1, 3) che (ignorando le riflessioni) è il gruppo di trasformazioni olomorfe della sfera di Riemann. Dov'è questa sfera di Riemann? È «l'infinito» del 3-spazio iperbolico-come il cerchio limite del dipinto di Escher, riprodotto in fig. 2.11 - analogo alla sfera celeste di §18.5, come un bordo del 3-spazio iperbolico di §18.14; vedi fig. 18.10. Vediamo così che K < Oè una previsione non tanto della teoria dei twistor, quanto della sottostante filosofia olomorfa. Possiamo spingerci più avanti e dire qualcosa della costante cosmologica A? Sembra che le costruzioni twistoriali (vedi §33.12) attualmente proposte, possano includere, in modo naturale, l'equazione di Einstein per il vuoto solo nel caso A= O, mentre è difficile comprendere come l'attuale tipo di procedura possa essere modificato per adattarsi a un A -:;:. O. Questo ci dice che A = O è una predizione della teoria dei twistor? Sarebbe meglio di no (nonostante la mia personale precedente preferenza per A = O)! Infatti, impressionanti dati osservativi recenti (vedi §28.1 O) indicano con forza A> O. Ciò fornisce nuove sfide alla teoria dei twistor. Sicuramente la teoria dei twistor dovrà fare molto di più proprio rispetto a ciò se deve diventare una teoria fisica rispettabile! Cosa possiamo dire delle regole della teoria quantistica? La teoria dei twi1005
LA STRADA CHE PORTA ALLA REALTÀ
stor dà qualche indicazione specifica sulla direzione di cambiamenti in accordo con le aspirazioni del capitolo 30? Il «gravitone non lineare» di §33.11 inizia a indicare che l'approccio twistoriale potrebbe, alla fine, richiedere una modifica (non lineare) delle regole della meccanica quantistica. Tuttavia, non vi è ancora moltissimo, entro il formalismo dei twistor, che indichi la presenza di una fondamentale asimmetria temporale in queste modifiche, come sarebbe richiesta secondo le discussioni di §§30.2, 3, 9. Potrebbe però esserci nei particolari sviluppi «googly», che sono stati brevemente discussi in §33.12, la suggestiva caratteristica che li vedrebbe dipendere effettivamente da una descrizione asimmetrica rispetto al tempo. I futuri sviluppi ci diranno se questa possibilità ha qualcosa di reale, e si dovrebbero tenere a mente i commenti del paragrafo precedente. Di conseguenza, la teoria dei twistor finora non dice nulla di utile sulla riduzione dello stato quantico, sebbene questo fenomeno sia stato uno dei motivi ispiratori di questa teoria. Infine, lasciate che mi dedichi alla questione dello stato della filosofia olomorfa che forma uno dei pilastri della teoria dei twistor. Penso che sia giusto dire che questa filosofia è stata davvero mantenuta e ha dato una potente spinta, che, per certi versi, ha superato le aspettative - come nel caso delle rappresentazioni twistoriali di campi non massivi, sia lineari (§§33.810) sia non lineari (§§33.11, 12). A un certo punto, però, la teoria dovrà dire qualcosa sugli aspetti della fisica legati ai numeri reali e a un comportamento non olomorfo, come la comparsa di valori di probabilità (in accordo con la regola non olomorfa del quadrato del modulo, z ~ /zl 2) e di punti reali dello spaziotempo, dove spereremmo di essere in grado d'includere comportamenti non analitici (per non parlare di quelli non olomorfi). Riguardo a quest'ultimo problema, si dovrebbe ricevere qualche incoraggiamento dalla notevole teoria delle iperfunzioni, introdotta alla fine del capitolo 9 (vedi §9. 7), secondo cui comportamenti non analitici possono essere elegantemente rappresentati nel contesto di operazioni olomorfe. La misura in cui una futura teoria dei twistor sarà effettivamente in grado d'essere applicata a tali problemi è materia per il futuro.
Note 1. Vedi Ahmavaara (1965). 2. Vedi Schild (1949); 't Hooft (1984); e Snyder (1987). 3. Vedi Sorkin (1991); Rideout e Sorkin (1999); Markopoulou e Smolin (1997); uno degli sviluppi più importanti in questo campo è stato Markopoulou (1998). 4. Vedi Kronheimer e Penrose (1967); Geroch e altri (1972); Hawking e altri (1976); Myrheim (1978); 't Hooft (1978). 5. Vedi Finkelstein (1969). 6. Vedi Smolin (2001); Giirsey e Tze (1996); Dixon (1994); Manogue e Schray (1993); Manogue e Dray (1999). 1006
Prospellive più radicali; teoria dei twistor
7. Vedi Regge (1962) per la referenza originaria. Immirzi (1997) ha scritto una rassegna informale (e istruttiva). 8. Jozsa ha sviluppato queste idee nella sua tesi di dottorato. Vedi Jozsa (1981 ). 9. Vedi Isham e Butterfield (2000). 10. Vedi Goldblatt (1979). 11. Vedi Eilenberg e Mac Lane (1945); Mac Lane (1988); Lawvere e Schanuel (1997). 12. Vedi Baez e Dolan (1998); Baez (2000); Baez (2001); Chari e Pressley (1994). 13. Vedi Connes e Berberian (1995). 14. Vi sono anche molti altri impieghi della geometria non commutativa, sia in matematica pura sia in matematica applicata alla fisica. Vedi Connes (1990, 1998). Un esempio di quest'ultima è lo sviluppo di un elegante formalismo per il trattamento completo della rinormalizzazione con l'aiuto della geometria non commutativa; vedi §26.9 e Kreimer (2000). 15. Vedi Connes e Berberian (1995). 16. Per precisione, dobbiamo includere il corrispettivo di una sfera di Riemann di «raggi luminosi all'infinito» per completare la definizione di IP>N; vedi §33.3. 17. Questo avrebbe bisogno delle appropriate quantità (scalari) non direzionali per il gruppo di Poincaré (vale a dire, i suoi operatori di Casimir; vedi §22.12). Queste sono lo spin totale e la massa di riposo (al quadrato); quest'ultima, tuttavia, non risulta essere costituita da multipli interi di qualcosa, quindi gli aspetti combinatori di un tale schema non sono molto chiari. Ciononostante, questo approccio è stato sviluppato da John Moussouris nella sua tesi di dottorato a Oxford nel 1983 (vedi Moussouris 1983). Si ha bisogno di un'ulteriore etichetta attaccata alle linee di spin, oltre alla massa e allo spin. 18. Vedi McLennan (1965); Penrose (1963, 1964, 1965a, 19866). 19. Vedi Penrose e Rindler (1984). 20. Vedi Harvey (1990); Penrose e Rindler (1986); Budinich e Trautman (1988). 21. Vedi Huggett e Tod (200 l ). 22. In qualunque evento x nello spaziotempo, sono specificate due direzioni nulle. Vi è la direzione del «raggio luminoso» di questa famiglia in x e la direzione del 4-impulso della particella ruotante che il twistor rappresenta. Queste due direzioni nulle sono le «direzioni nulle principali», cioè le direzioni definite dalla rappresentazione di Majorana (vedi §22.10), del (la parte autoduale e antiautoduale) momento angolare posseduto da questa particella, preso rispetto a x. Vedi Wald ( 1984); Huggett e Tod ( 1985). 23. Vedi Penrose (1975); Penrose (19876 ). 24. Vedi Penrose (1968b); Huggett e Tod (2001). 25. Vedi Huggett e Tod (2001); Penrose e Rindler (1986); Hughston (1979). 26. Vedi Dirac (1936); Fierz (1938, 1940); Penrose (1979b). 27. Vedi Fierz e Pauli (1939); Penrose e Rindler (1986); Penrose (1965); Penrose e MacCallum (1972). 28. Vedi Penrose (1968b, 1969b, 1987); Huggett e Tod (2001); Hughston (1979); Whittaker (1903); Bateman (1904, 1944). 29. Questo è il IC2 che rappresenta la linea 1< in lfDN (fig. 33.11). Alla maggior parte dei teorici dei twistor è più familiare la versione interamente proiettiva di questo integrale sul contorno, in cui si impiega la I-forma z = Jt 0,d7t 1, Jt 1,d7t 0, al posto della 2-forma 'r = d1t 0, A d1t 1,. L'integrale sul contorno è ora I-dimensionale e la sua relazione con la prescrizione 2-dimensionale qui data è che una di queste dimensioni del contorno (data da un cerchio S 1) riduce la versione non proiettiva qui data alla più familiare versione proiettiva. 1007
LA STRADA CflE PORTA ALLA REALTÀ
30. 31. 32.
33. 34. 35. 36. 37. 38. 39. 40. 41.
42. 43. 44. 45.
46. 47. 48.
49. 50.
Uno dei vantaggi di tale versione è che permette la descrizione di stati di elicità mista. Vedi Huggett e Tod (2001); Hughston (1979); Penrose e Rindler (1986). La teoria dei twistor ha un grosso debito con Sir Michael Atiyah per un importante input iniziale a questa realizzazi01Je. Questa è la cosiddetta coomologia di Cech. Vi sono anche molti altri modi di arrivare al concetto di coomologia. Vedi Penrose e Rindler (1986); Huggett e Tod (2001). Vedi Penrose e Rindler (1986). Gunning e Rossi (1965) ne danno una discussione più estesa. Vedi Gunning e Rossi (1965); Penrose e Rindler (1986). Vedi Penrose e Rindler (1986). Vedi Penrose (1991). Vedi Penrose (1991). Vedi Penrose e Rindler (1986); Gunning e Rossi (1965); Griffiths e Harris (1978); Chem (1979); Wells (1991). Vedi le referenze nella nota precedente, come pure Eastwood e altri (1981). Non vi è alcun significato qui nell'inversione dei segni+ e-. Si tratta solo di un imbarazzante incidente dovuto alla notazione. Qui vi sono alcuni dettagli tecnici importanti; se il campo originario non è analitico (non è ero), questi campi (su Ml) possono risultare iperfunzionali nel senso di §9.7, vedi Bailey e altri (1982). Vedi Hodges e altri (1989). Vedi Penrose (1987b). Vedi Penrose (1976a, 1976b); Ward (1977); Penrose e Ward (1980); Penrose e Rindler (1986). Non è però un fibrato olomorfo (§15.5), sebbene tutte le operazioni fatte nella sua costruzione siano olomorfe, poiché, localmente nel 1t-spazio, non è rigorosamente uno spazio prodotto olomorfo. 7è chiamatofibrazione olommfa. Vedi Penrose (1976a, 19766). In circostanze normali; vedi Penrose (1976b ); Penrose e Ward (1980); Penrose e Rindler (1986). Vedi Kodaira (1962). O nel caso reale definito positivo(++++) o nel caso di segnatura suddivisa (+ + - -). Vedi Penrose (1976b); Hansen e altri (1978); Atiyah e altri (1978); Dunajski (2002). Sembrerebbe quindi che vi sia una significativa relazione con la nozione di QFT topologica, cui si è fatto riferimento in §32.5. Vi è un approccio a questi problemi, simmetrico rispetto alla riflessione, che impiega quelli che sono noti come ambitwistor; questo approccio ha ottenuto alcuni significativi successi parziali in questa direzione; vedi Penrose (1975); LeBrun (1985, 1990); Isenberg e altri (1978); Witten e altri (1978). Vedi anche Penrose e Rindler (1986). Un ambitwistor di uno spazio piatto è fondamentalmente una coppia (W a, Z"'), dove W = O, e descrive un raggio luminoso complesso. Questo, tuttavia, non si conforma alla filosofia per cui le «funzioni twistoriali sono funzioni d'onda», sopra adottata, poiché una descrizione con ambitwistor è più simile a una descrizione classica, in cui compaiono sia una variabile sia la sua variabile coniugata - in questo caso, W e invece dell 'una o dell'altra come sarebbe appropriato per una funzione d'onda. I; approccio degli ambitwistor incorre anche in alcune goffaggini matematiche nella sua descrizione di campi non lineari.
;za
a za -
1008
Prospettive più radicali; teoria dei twistor
51. 52. 53. 54. 55.
56. 57. 58. 59. 60.
61.
Vedi Penrose (2001 ). Vedi, per esempio, Frittelli e altri (1997); Bramson (1975). Vedi Penrose (1992). Vedi Mason e Woodhouse (1996). Vedi Penrose e MacCallum (1972); Penrose e Rindler (1986), p. 149 per alcune delle referenze più vecchie; vedi Hodges ( 1982, 1985, 1990, 1998) per qualche lavoro più recente. Vedi Bailey e Baston (1990); Bastone Eastwood (1989); Mason e Woodhouse (1996) per l'impiego dei twistor in matematica. Vedi Merkulov e Schwachhi:ifer (1998). Vedi Gindikin (1986, 1990); LeBrun e Mason (2002). Vedi la nota 76 del capitolo 31. Anche se le lagrangiane hanno svolto un ruolo periferico nella teoria dei twistor nella comprensione delle interazioni fisiche, non hanno ancora trovato un'opportuna formulazione generale in questa teoria. È forse abbastanza ironico che lo stesso successo che la teoria dei twistor ha avuto nel presentare i campi fisici in una maniera che implicitamente risolve le loro equazioni di campo (per mezzo delle funzioni twistoriali omogenee, nel caso di campi liberi senza massa) è quello che ha condotto a difficoltà con la sua formulazione lagrangiana. Nella convenzionale formulazione quantistica, le equazioni di campo vengono da una «somma su storie» (§26.6), dove deve essere esplicitamente possibile violare le equazioni di campo nella formulazione, affinché questa idea abbia senso, e poi le correzioni quantistiche alla teoria classica vengono dall'esame più dettagliato di questo integrale sui cammini. Tutto questo lo perdiamo se la formulazione non permette la violazione delle equazioni di campo! Mi sembra che sia necessaria qualche nuova valutazione di quella che deve essere la vera «essenza» delle lagrangiane nella teoria dei twistor e, in verità, nella teoria fisica in generale. Questo forse si ricollega alle preoccupazioni che ho espresso alla fine di §26.6 e ai problemi, autenticamente profondi, presentati dalle divergenze, virtualmente onnipresenti negli integrali sui cammini (vedi §26.6). Penrose e Rindler (1986), §9.5.
CAPITOLO
34
DOVE SI TROVA LA STRADA VERSO LA REALTÀ?
34.1 Le grandi teorie della fisica del ventesimo secolo - e al di là? Tentiamo di fare l'inventario di ciò che abbiamo imparato dalle nostre teorie fisiche - poiché cominciamo a esplorare il terzo millennio d. C. - riguardo alla natura fondamentale di questo straordinario mondo in cui ci troviamo. Non c'è alcun dubbio che siano stati compiuti straordinari progressi nella sua comprensione e che questi siano il risultato di attente osservazioni fisiche e di superbi esperimenti, di ragionamenti fisici di grande profondità e intuizione, di argomentazioni matematiche complicate, ma di routine, o di grande ispirazione al massimo livello. Tutto ciò ci ha condotto dalle intuizioni degli antichi greci sulla geometria dello spazio, attraverso la meccanica newtoniana, alle magnifiche strutture della meccanica classica, poi alla teoria elettromagnetica di Maxwell e alla termodinamica. Il ventesimo secolo ci ha poi dato la relatività speciale, che ha aperto la strada alla straordinaria ed esatta teoria generale della relatività di Einstein, e anche la profondamente misteriosa, ma estremamente accurata e largamente applicabile, meccanica quantistica e il suo sviluppo in teoria quantistica dei campi (QFT); in particolare, abbiamo gli straordinari modelli standard della fisica delle particelle e della cosmologia. È opinione abbastanza diffusa che «ci siamo quasi», che una «teoria del tutto» possa essere non molto distante dagli sviluppi del tardo ventesimo secolo. Tali commenti si sono spesso basati su ciò che era in quel momento lo stato della «teoria delle stringhe»: un punto di vista che è più difficile mantenere ora che la teoria delle stringhe si è trasformata come per magia in qualcosa (la M- o Fteoria) la cui natura è oggi fondamentalmente sconosciuta. A mio parere siamo ancora molto distanti da una «teoria definitiva»; non credo assolutamente che gli sviluppi tratteggiati nel capitolo 3 l siano nella giusta direzione. Diversi e notevoli.sviluppi matematici derivano davvero dalle idee della teoria delle stringhe (e da idee a esse collegate). Tuttavia, rimango profondamente scettico sul fatto che siano qualcosa di diverso da pezzi di bravura matematica, anche se con qualche input dovuto a idee fisiche profonde. A meno 10IO
Dove si trova la strada verso la realtà?
che la dimensionalità dello spaziotempo possa essere ricondotta a quella che osserviamo direttamente (vale a dire 1 + 3), rimango profondamente convinto che queste idee della teoria delle stringhe, in sé e per sé, non ci portino molto più avanti nella comprensione fisica. Per quanto riguarda gli altri scherni che sono stati proposti, come i principali tratteggiati nei capitoli 32 e 33, con cui sono molto più in sintonia, non ho alcun dubbio che anch'essi abbiano bisogno d'importanti intuizioni. Sarebbe sciocco soprattutto prevedere che queste teorie siano prossime a fare quegli ulteriori progressi necessari per guidarci sulla vera strada per la comprensione della realtà fisica. Tuttavia, già nel ventesimo secolo, la specie umana ha compiuto indubbiamente progressi straordinari verso una simile comprensione, e io ho tentato, in questo libro, di trasmettere qualcosa di ciò che è stato realizzato. A mio parere, la relatività generale di Einstein spicca come la massima realizzazione individuale del secolo. Può darsi che la maggior parte dei fisici ritengano che la teoria quantistica ( e la QFT) sia una realizzazione ancora maggiore, ma io, dalla mia particolare prospettiva su questo soggetto, non mi sento in grado di condividere questa opinione. Mentre è indubbio che la teoria quantistica ha spiegato molte più cose della relatività generale, in una gamma decisamente più ampia di fenomeni fisici, non ritengo che questa teoria abbia ancora raggiunto il necessario grado di coerenza. Il problema è, naturalmente, il paradosso della misura, preso in esame a lungo nel capitolo 29. A mio parere, la teoria quantistica non è ancora completata; quando lo sarà - presumo nel corso del ventunesimo secolo - rappresenterà senz'altro una realizzazione persino più grande della relatività generale di Einstein. In effetti, come le asserzioni del capitolo 30 suggerirebbero con forza, una simile meccanica quantistica completata dovrebbe includere la teoria di Einstein in qualità di limite sulla scala di grandi masse e distanze. (E spero che al lettore sia chiaro, dalle mie osservazioni in §31.8, che non ritengo che la teoria delle stringhe abbia già ottenuto questa unione, nonostante le molte affermazioni a favore di questa tesi.) Penso che la relatività generale sia destinata a rimanere come descrizione dello spaziotempo nel limite di grande scala (dove la presenza di una costante cosmologica A è permessa come parte dell_a teoria di Einstein), anche se dobbiamo attenderci serie modifiche alle sue descrizioni alla distanza assurdamente piccola di Planck di 1o- 35 rn o a densità che possono avvicinarsi al valore di Planck di circa 5 x 1093 volte la densità dell'acqua in prossimità di qualche singolarità spaziotemporale. Questo atteggiamento rispetto allo status della relatività generale deve ora essere reputato quello convenzionale. Si deve ritenere che lo status osservativo della teoria, almeno al limite abbastanza grande della scala delle distanze delle stelle di neutroni orbitanti e degli effetti di lente gravitazionale, e persino dei buchi neri, sia eccellente. In questo caso intendo la teoria standard di Einstein, senza costante cosmologica. Cosa dire della costante cosmologica? Osservazioni fatte nel corso degli ultimi anni sembrano favorire un valore positivo per essa. Se A vi è davvero, è cer1011
LA STRADA CHE PORTA ALLA REALTÀ
tamente molto piccola in termini locali ordinari. Pensando a essa come a una curvatura, che è il reciproco del quadrato di una lunghezza, questa lunghezza è paragonabile al raggio dell'universo osservabile, così che A è certamente trascurabile, tranne che alle scale cosmologiche; interpretandola invece come una densità effettiva QA, non può essere più di due o tre volte la minuscola densità media che ha ora l'universo, che è circa 10- 27 kgm- 3 - notevolmente meno del migliore vuoto artificiale realizzato sulla Terra, risultando così, di nuovo, importante solo su scala cosmologica. Tuttavia, sulla base del punto di vista spesso espresso dai teorici dei campi quantistici, A è realmente una misura della densità effettiva del vuoto, generata dalle «fluttuazioni quantistiche del vuoto» (una caratteristica dell'indeterminazione di Heisenberg in QFT, vedi §21.11; vedi anche §29.6, §30.14), e di conseguenza «dovrebbe» avere un valore (paragonabile al valore di Planck) che è qualcosa come 10 120 volte più grande (o probabilmente soltanto 1060 volte più grande) del limite superiore di quello osservato! Questo è considerato un enigma fondamentale nella QFT, 1 non risolto da alcun approccio convenzionale alla gravità quantistica o dalla teoria delle stringhe. Personalmente sono molto meno turbato da ciò rispetto a quanto sembrano essere molti teorici; questo perché ritengo che l'intero problema delle «fluttuazioni di vuoto» dovrà essere radicalmente riesaminato quando avremo una migliore teoria quantistica della gravità e una migliore QFT. Dobbiamo, naturalmente, riconoscere la straordinaria gamma di fenomeni che supportano l'attuale meccanica quantistica e la QFT; dovrei però chiarire che in questo non vi è alcuna contraddizione con il punto di vista che ho sostenuto nel capitolo 30, dove sono previsti cambiamenti nelle basi della teoria quantistica. Nessun esperimento, finora, è stato in grado di esplorare, neppure da vicino, la «gravità quantistica» al livello a cui mi aspetto che tali cambiamenti diventino evidenti e che la riduzione del vettore di stato avvenga oggettivamente (OR gravitazionale). Gli osservati entanglement quantistici su distanze di circa 15 chilometri2 sono completamente coerenti con queste previste variazioni, poiché tali entanglement implicano solo coppie di fotoni con energie dell'ordine di 10- 19 J e la riduzione spontanea dello stato, secondo la OR gravitazionale, non è attesa finché i fotoni non vengono effettivamente misurati (a questo punto OR avverrebbe nell'apparato di misurazione). I.:attuale situazione sperimentale riguardo alla validità della meccanica quantistica quando sono implicati significativi movimenti di masse è meglio rivelata in recenti esperimenti di Anton Zeilinger e colleghi a Vienna. 3 Essi hanno effettuato quello che è fondamentalmente un esperimento a due fenditure con «bucky balls» di C 60 ( e anche di C 70 ). Queste sono fullereni, dove ciascuna molecola ha 60 atomi di carbonio, in una magnifica disposizione simmetrica che rassomiglia a quella delle cuciture della maggior parte dei moderni palloni da calcio (o anche in una disposizione meno simmetrica con 70 atomi di carbonio). Queste molecole di fullerene hanno un diametro di circa un nanometro e interferiscono tra loro dopo es1012
Dove si trova la strada verso la realtà?
sere state in una sovrapposizione di due posizioni separate da circa 1o- 7 m, che è circa 100 volte il diametro della bucky ball. Secondo lo schema suggerito in §30.11, una simile sovrapposizione durerebbe almeno circa centomila anni prima di ridursi spontaneamente secondo la OR gravitazionale, così che non vi è alcuna contraddizione con l'esperimento di Zeilinger. La situazione potrebbe, naturalmente, essere molto diversa in qualche esperimento futuro. Qualcosa che si avvicina alla proposta FELIX, ambientata nello spazio, di §30.13, o più probabilmente qualche esperimento collegato come potrebbe risultare dal lavoro di Dik Bouwmeester a Santa Barbara, metterebbe direttamente alla prova lo schema OR gravitazionale e può darsi che vi siano altre possibilità per esperimenti che potrebbero essere effettuati nei primi anni del ventunesimo secolo. Reputo che questa prospettiva sia particolarmente eccitante e che vi sia una chiara possibilità che questi esperimenti possano significativamente modificare il nostro punto di vista attuale sulla meccanica quantistica o, al minimo, restringere notevolmente le speculazioni sul come la meccanica quantistica potrebbe essere modificata secondo qualche teoria futura. Questo è in forte contrasto con l'attuale (o credibilmente estrapolata) situazione sperimentale riguardo ad altri tentativi, come quelli sottolineati nei capitoli 31-33, di combinare la teoria quantistica con la gravità. La maggior parte delle riflessioni su esperimenti progettati per applicarsi a tali proposte implicano particelle lanciate con energie straordinariamente alte, assurdamente molto al di là delle possibilità di qualsiasi esistente (o seriamente progettato) acceleratore di particelle. (Le sole eccezioni a questo stato di cose di cui sono a conoscenza sono degli esperimenti progettati per testare la possibile esistenza di «grandi» dimensioni extra (§31.4) che potrebbero avere effetto, a piccole distanze, sulla legge di gravità dell'inverso del quadrato, o alcune altre proposte, scarsamente collegate, indirizzate a comprendere se la covarianza lorentziana potrebbe essere violata ad alta energia, a causa di suggeriti effetti gravitazionali quantistici.) 4 In effetti, il collaudo di qualsiasi schema «convenzionale» di unione tra quanti e gravità, dove gli effetti di questa unione modificherebbero soltanto la struttura dello spaziotempo (alle distanze o tempi straordinariamente piccoli di Planck-Stoney), lasciando inalterate le procedure standard della meccanica quantistica, deve affrontare molte difficoltà; dal punto di vista sperimentale, ci troviamo in una posizione decisamente migliore se le regole della meccanica quantistica sono modificate da effetti della relatività generale, come è stato suggerito nel capitolo 30, poiché questi effetti rientrano proprio nell'ambito dell'attuale tecnologia. Se tali esperimenti sono effettuati con successo e indicano che occorre modificare le regole della meccanica quantistica, vi sarebbe almeno una buona guida fisica a integrare i desiderata, in gran parte matematici, che guidano la presente ricerca nel campo della gravità quantistica. I.:assenza di dati sperimentali relativi alle normali proposte di unione tra 1013
LA STRADA CHE PORTA ALLA REALTÀ
quanti e gravità ha portato a una curiosa situazione nella ricerca teorica di fisica fondamentale. Sembra, infatti, che si sia sviluppato un consenso generale riguardo al fatto che, per poter compiere reali progressi nel superamento dei modelli standard della fisica delle particelle (e della cosmologia), ottenendo quindi una comprensione più profonda degli ingredienti fondamentali dell'universo, sarà necessario avere una teoria quantistica che includa la gravità oltre alle forze forti, deboli ed elettromagnetiche. Parte del motivo pare essere la concezione (senza dubbio fisicamente giustificata) che una QFT finita (invece che semplicemente rinormalizzabile) esigerà che le divergenze siano «cut off» alla piccolissima lunghezza di Planck, dal che la necessità che la gravità faccia parte del quadro (vedi §31.1 ). Ma, poiché non ci sono esperimenti in questa area, gli sforzi dei teorici sono stati indirizzati soprattutto verso il mondo interno dei desiderata matematici.
34.2 La fisica fondamentale guidata dalla matematica l:interazione tra idee matematiche e comportamento fisico è stata un tema costante di questo libro. In tutta la storia delle scienze fisiche i progressi sono stati ottenuti trovando il corretto bilanciamento tra le limitazioni, le tentazioni e le rivelazioni matematiche, da una parte, e dall'altra, la precisa osservazione delle azioni del mondo fisico, di solito per mezzo di esperimenti accuratamente controllati. Quando la guida sperimentale viene a mancare, come nella maggior parte dell'attuale ricerca fondamentale, questo bilanciamento non funziona a dovere. La coerenza5 matematica è ben lungi dall'essere un criterio sufficiente per dirci se è probabile che siamo «sul giusto cammino» (e, in molti casi, persino questa richiesta evidentemente necessaria è gettata al vento). Il criterio dell'estetica matematica comincia ad assumere un peso molto più grande di quello che aveva prima; i ricercatori sottolineano che i successi di Dirac, di Schrodinger, di Einstein, di Feynman e di molti altri sono dovuti al fatto di essere stati guidati, in misura abbastanza ampia, dall'attrazione estetica delle particolari idee teoriche da loro proposte. Personalmente ritengo che non si possa assolutamente negare il valore di tali considerazioni estetiche e che esse svolgano un ruolo di fondamentale importanza nella selezione di proposte plausibili di nuove teorie della fisica fondamentale. Alcuni di questi giudizi estetici possono essere qualche volta semplicemente l'espressione di un chiaro bisogno di uno schema matematicamente coerente; infatti, bellezza matematica e coerenza sono davvero strettamente collegate. A me sembra che la necessità di una simile coerenza, in qualunque modello fisico proposto, sia incontestabile; inoltre, a differenza di molti criteri estetici, la coerenza matematica ha il vantaggio di essere chiaramente qualcosa di oggettivo. In generale, la difficoltà che si ha con i giudizi estetici è che tendono a essere molto soggettivi. 1014
Dove si trova la strada verso la realtà?
La coerenza matematica, tuttavia, non è qualcosa che, in sé e per sé, può essere facilmente apprezzata. Quelli che hanno lavorato a lungo e duramente su alcune idee matematiche possono trovarsi in posizione migliore per apprezzare la sottile e spesso inaspettata unità che si trova in qualche particolare schema. Quelli che giungono a un tale schema dal di fuori, d'altra parte, ne hanno una visione più confosa e possono trovare difficile apprezzare perché una certa proprietà dovrebbe avere qualche particolare merito, o perché si dovrebbe ritenere che alcune cose siano più sorprendenti - e forse, quindi, più belle - di altre. Tuttavia, vi possono essere circostanze in cui sono quelli provenienti dall'esterno che possono giudicare più obiettivamente; infatti, forse, l'aver passato molti anni su una collezione strettamente focalizzata di problemi matematici nascenti in qualche approccio particolare può portare a giudizi travisati! Ma coerenza ed eleganza matematica, nella matematica di una teoria fisica, nonostante il loro indubbio valore, sono chiaramente ben lungi dall'essere sufficienti. Le considerazioni fisiche hanno di solito un'importanza molto maggiore; ma, in situazioni in cui la guida sperimentale manca, queste qualità matematiche assumono un'importanza molto più grande. Ceriamente non sostengo che vi siano risposte semplici a tali questioni; credo che i singoli ricercatori facciano bene a seguire le proprie inclinazioni estetiche, ma non dovrebbero sorprendersi di scoprire che qualche collega rimane completamente indifferente alla supposta magnificenza delle conclusioni a cui sembrano condurre queste inclinazioni. Io ritengo che tali motivazioni estetiche siano una parie essenziale dello sviluppo di qualunque nuova idea importante nella scienza teorica; ma senza i vincoli dell'esperimento e dell'osservazione tali motivazioni portano spesso la teoria molto al di là di ciò che è fisicamente giustificato. In tutto il corso della storia possiamo vedere molti esempi, in cui un elegante schema matematico sembrava offrire, dapprima, un nuovo modo livoluzionario per scoprire i segreti della Natura, ma in cui poi queste speranze iniziali non sono state realizzate - almeno, non nel modo inizialmente previsto. Un buon esempio può essere il sistema dei quatemioni, in relazione allo loro stupenda proprietà di formare un'algebra senza divisori dello zero. Come abbiamo visto in § 11.2, dopo la loro scoperta nel 1843, Hamilton fu indotto a dedicare i rimanenti ventidue anni della sua vita al tentativo di rappresentare le leggi di Natura interamente entro l'ambito della loro struttura. Tuttavia, questo lavoro con «puri quaternioni» (col che intendo i suoi originari quatemioni con la loro proprietà di essere un'algebra senza divisori dello zero) ha avuto un effetto diretto piuttosto limitato sullo sviluppo successivo della scienza fisica fondamentale. Le altre influenze di Hamilton sulla teoria fisica sono state certamente grandissime e molto dirette; sono state, infatti, le sue iniziali ricerche in ciò che ora chiamiamo «hamiltoniane», «piincipio di Hamilton», «equazione di Hamilton-Jacobi», eccetera - tutte ricerche che fanno parte di un'esplorazione dell'analogia tra particelle newtoniane e onde- che hanno offerto il punto di partenza per lo sviluppo, nel ventesimo secolo, della meccanica quantisti1015
LA STRADA CHE PORTA ALLA REALTÀ
ca e della QFT (vedi §20.2 e §§21.1, 2). l;influenza dei quaternioni sulla fisica, però, è avvenuta solo tramite generalizzazioni, in cui la loro proprietà di algebra senza divisori dello zero è stata gettata al vento. Deve essere stato fin troppo facile, a metà del diciannovesimo secolo, essere ipnotizzati dalla stupenda caratteristica matematica dei quaternioni di poter effettuare la loro divisione (§ 11.1 ), Questa meravigliosa proprietà, di cui godono i quaternioni e un numero relativamente piccolo di altre algebre, ha avuto una significativa influenza sulla matematica pura, ma non direttamente sulla fisica convenzionale. È stata la generalizzazione di Clifford dei quaternioni a un numero più alto di dimensioni, assieme alle successive idee di Pauli e soprattutto di Dirac, in cui è adottata la segnatura lorentziana rilevante per lo spaziotempo, a rendere infine possibili enormi progressi nella teoria fisica (§ 11.5, §§24.6, 7). In questi ulteriori sviluppi, che sono stati enormemente importanti per la fisica, la stupenda proprietà della divisione di Hamilton è stata inevitabilmente abbandonata! Ritornerò, in §34.9, su questo misterioso problema della bellezza nella matematica che è coronata da successo per la fisica. Ma tali questioni riguardano l'importante e affascinante problema complementare del «prodotto secondario» della matematica. Fin dai tempi degli antichi greci, alcune teorie iniziate in stretto contatto con il comportamento del mondo hanno generato vaste aree di matematica elegante, studiate inizialmente solo per il piacere di farlo, ma che spesso trovano applicazioni molto distanti dalle considerazioni fisiche da cui hanno tratto origine. Alcune volte queste applicazioni richiedono molti secoli prima di essere realizzate (come nel caso dello studio di Apollonio, del 200 a. C. circa, delle sezioni coniche, che hanno svolto un ruolo fondamentale nella comprensione dei moti planetari dovuta a Keplero e Newton nei secoli sedicesimo e diciassettesimo, o del «piccolo teorema» di Fermat del 1640, che ha trovato importanti applicazioni in crittografia nell'ultima parte del ventesimo secolo). La matematica - la buona matematica, in particolare - ha l'abitudine di trovare le sue applicazioni nei campi più disparati, il che è uno dei motivi della sua forza e robustezza. I meccanismi naturali sono stati spesso una meravigliosa sorgente per queste idee matematiche; che vi debba essere precisione e affidabilità in tali idee stimolate dalla Natura non è così sorprendente, se acce,ttiamo che la Natura operi esattamente in conformità a leggi matematiche. Più straordinaria è la sottigliezza della matematica che sembra essere implicata nelle leggi di Natura, e l'abitudine che tale matematica sembra avere di trovare applicazione in aree molto distanti da quella originaria (come nel caso, in particolare, del calcolo infinitesimale di Newton e Leibniz-vedi capitolo 14). Viceversa, possiamo sostenere che una putativa teoria fisica che stimoli molta ricerca produttiva in aree matematiche ampiamente estese guadagni per questo credibilità fisica? Tale questione ha particolare rilevanza per gli schemi fisici dei capitoli 31, 32 e 33: credo non si possa dare una risposta 1016
Dove si trova la strada verso la realtà?
semplice a questa domanda, ma certamente dovrebbe essere raccomandata grande attenzione verso l'argomento. La teoria delle stringhe, in particolare, ha stimolato molta ricerca matematica e proprio da questo fascino matematico acquista molto della sua forza. (Si potrebbe dire la stessa cosa di gran parte della teoria dei twistor e degli approcci di Ashtekar e Hawking.) Non è però chiaro quanto ciò sia indicativo di un reale accordo di base con la realtà fisica; tuttavia, molto spesso ho sentito matematici puri esprimere la loro gioia perché qualche risultato da loro trovato ha applicazione in fisica solo per il fatto che ha importanza matematica per la teoria delle stringhe! Posso comprendere che molti matematici puri desiderino che alcuni aspetti della loro materia possano trovare importanti applicazioni nei meccanismi del mondo fisico, ma dovrebbe essere chiarito che non vi è (finora) alcun motivo osservazionale per credere che la teoria delle stringhe (in particolare) sia fisica, anche se è certamente motivata da potenti aspirazioni fisiche. La teoria delle stringhe è una materia studiata anche da moltissimi fisici, ma questo la rende fisica? Tutto ciò solleva il problema della moda nella ricerca fisica fondamentale, problema a cui desidero dedicarmi nella prossima sezione.
34.3 Il ruolo della moda nella teoria fisica Lasciatemi iniziare citando uno studio compiuto da Carlo Rovelli e riportato nella sua comunicazione all'International Congress on General Relativity and Gravitation, tenuto a Pune, India, nel dicembre del 1997. 6 Rovelli è uno dei creatori dell'approccio delle variabili di loop alla gravità quantistica, descritto in §32.4, e non ha mai fatto alcuna proclamazione di professionismo nella conduzione del suo studio. In più, i risultati da lui trovati riflettono certamente quelle che sarebbero state le mie previsioni (ma non corroborate da prove). Egli contò il numero di articoli sul soggetto della gravità quantistica pubblicati nel corso dell'anno precedente, secondo la registrazione nei Los Angeles Archives. La media mensile approssimativa dei lavori per i vari approcci a questo soggetto risultò la seguente: Teoria delle stringhe Gravità con variabili di loop QFT in spazi curvi Approcci con reticoli Gravità quantistica euclidea Geometria non commutativa Cosmologia quantistica Twistor Altri
69 25 8 7 3 3 1 1 6 1017
LA STRADA CHE PORTA ALLA REALTÀ
Il lettore si renderà conto che in questo mio libro ho seguito solo molto blandamente i dettami della moda nello spazio che ho dedicato a queste rispettive teorie. (Ho sfiorato soltanto superficialmente le QFT in spazi curvi, in relazione all'effetto Hawking, discusso in §30.4. Gli approcci con reticoli assumono modelli spaziotemporali discreti, invece di quelli continui - vedi §33.1. La gravità quantistica euclidea figura nell'approccio di Hawking, discusso in §28.9. La cosmologia quantistica impiega spazitempo semplificati in cui è ignorata la maggior parte dei gradi di libertà gravitazionali. Gli altri approcci citati sono stati discussi nei capitoli 31-33 .) Si noterà che vi sono più articoli nell'area della teoria delle stringhe che in tutte le altre aree messe assieme. Se dovessimo pensare che la ricerca scientifica sia guidata dai principi di un governo democratico, allora, poiché i teorici delle stringhe hanno la maggioranza assoluta, dovremmo dire che tutte le decisioni riguardo a quali ricerche dovrebbero essere fatte sarebbero dettate da loro! 7 Per fortuna, i criteri della scienza non sono quelli di un governo democratico; è giusto e opportuno che le attività minoritarie non debbano sofftire solo per il fatto di essere minoritarie. La coerenza matematica e l'accordo con le osservazioni sono molto più importanti. Ma possiamo ignorare completamente i capricci della moda? Sicuramente no. Oltre a molte idee meno credibili, molto alla moda al loro tempo (come la nozione di supergravità I I -dimensionale le cui sette dimensioni extra costituiscono una «7-sfera schiacciata»),8 posso ricordare molte mode del passato che mi sono sembrate - e ancora mi sembrano - contenere verità molto significative (come le traiettorie di Regge - vedi §31.5 - e la matrice analitica S di Geoffrey Chew),9 ma che adesso sono fuori moda da decenni. La popolarità di una teoria fornisce, in qualche misura, una valutazione della sua plausibilità scientifica - ma solo in qualche misura. È anche vero che, per quanto riguarda gli affari, sono quelli grandi ad avere una tendenza naturale a crescere ulteriormente a spese di quelli più piccoli. Non è difficile capire perché questo dovrebbe avvenire anche con le mode scientifiche, soprattutto in questo nostro mondo di viaggi in jet e di internet, in cui le nuove idee scientifiche si propagano rapidamente per tutto il globo, a voce durante le conferenze scientifiche o trasmesse quasi istantaneamente per posta elettronica e tramite internet con articoli scientifici (spesso non esaminati.e valutati). La competizione, spesso frenetica, scatenata da questa facilità di comunicazione, porta a «schierarsi dalla parte dei più», perché i ricercatori temono di essere lasciati indietro se non partecipano. La moda non è un problema tanto grande per quelle idee teoriche che sono continuamente sottoposte al controllo sperimentale, ma con le idee che sono ben lungi dalla possibilità di una conferma o di un rifiuto sperimentale dobbiamo essere particolarmente cauti nel ritenere che la popolarità di un approccio sia una reale indicazione della sua validità. La moda svolge un ruolo anche in altre aree come la notazione o uno specifico formalismo matematico; questo è probabilmente un problema meno im1018
Dove si trova la strada verso la realtà?
portante di quelli discussi in precedenza, ma che è ancora significativo per lo sviluppo della ricerca. Lasciatemi descrivere un esempio particolare, e precisamente la grande prevalenza dell'impiego del formalismo spinoriale a quattro componenti di Dirac lispetto a quello posteriore a due componenti di van der Waerden (vedi §22.8, §24.7, §25.2). In ciò, come vedremo, vi è anche un po' d'ironia. In verità, in elettrodinamica quantistica, è quasi universalmente impiegato il formalismo dei 4-spinori, mentre, come è stato mostrato da Robert Geroch, 10 è realmente molto più semplice usare i 2-spinori (brevemente discussi in §22.8). Quando Dirne, nel 1928, scoprì la sua equazione, impiegò i 4spinori. Questa equazione suscitò molto interesse per l'importanza degli spinori e un anno dopo l'eminente matematico olandese Bartel L. van der Waerden formulò il potente calcolo dei 2-spinoli. 11 Tuttavia, l'eccitazione causata dalla scoperta di Dirne dell'equazione dell'elettrone significò che la maggior parte dei fisici seguì 1' approccio originario di Dirac, anche perché molti non erano neppure a conoscenza del formalismo più flessibile e raffinato di van der Waerden. Sembra, però, che lo stesso Dirac abbia alla fine apprezzato la potenza di ciò che van der Waerden aveva fatto; in effetti, nei primi anni Cinquanta frequentai un corso di lezioni di Dirac in cui egli propose una magnifica introduzione al calcolo 2-spinoriale, chiarendomi nella sua interezza un argomento che in precedenza mi aveva creato molta confusione. Dirac aveva effettivamente usato l'approccio 2-spinoriale, nel 1936, per trovare generalizzazioni della sua equazione per l'elettrone per particelle di spin maggiore. 12 Sembra che un certo numero di ricercatori, non avendo familiarità con il formalismo 2-spinoriale, abbia riscoperto casi speciali delle equazioni di Dirne per particelle di spin maggiore, chiamandole «equazione di Duffin-Kemmer» (1936, 1938 per spin O e 1), «equazione di Proca» (1930) e «equazione di Rarita-Schwinger» (1941, per spin 3/2). Ora viene citato il loro lavoro, anziché il precedente di Dirne. Dirac non era un seguace della moda e sembra che non abbia neppure seguito la moda che aveva lui stesso imposto! Ciononostante, altri si trovarono qualche volta costretti a essere «modaioli» anche se non ne avevano l'intenzione. Lo scoprii quando, a metà degli anni Settanta, visitai il CERN per parlare con Bruno Zumino, uno degli ideatori di alcune delle idee fondamentali della supersimmetria. (Il suo lavoro del 1974, assieme a Julius Wess, 13 aveva ottenuto una definita connessione con la teoria dei twistor che io desideravo esplorare più a fondo.) Mi disse che apprezzava la forza del formalismo dei 2-spinori e che una volta aveva scritto un articolo in cui lo aveva impiegato per formulare una sua idea. Tuttavia, pochi mesi più tardi, così mi spiegò, il fisico Abdus Salam aveva proposto la medesima idea, ma impiegando i 4-spinori. Tutti allora fecero riferimento al lavoro di Salam e nessuno al suo. Zumino allora disse che non avrebbe mai più commesso l'errore d'impiegare il (tecnicamente superiore) formalismo dei 2-spinori! Vi è un problema collegato a questo che rende difficile ai ricercatori, so1019
LA STRADA CHE PORTA ALLA REALTÀ
prattutto a quelli giovani, distaccarsi dalle mode della ricerca persino se lo volessero: le disparate e difficili idee matematiche con cui devono confrontarsi nella moderna fisica matematica. È abbastanza difficile selezionare una piccola parte di una particolare linea di lavoro e tentare di padroneggiarla; essere in grado di fare un autorevole studio comparativo dei meriti di parecchie linee differenti andrebbe certamente al di là della capacità della maggior parte dei giovani ricercatori. Di conseguenza, se devono fare una scelta, devono contare sulle preferenze di quelli che sono già ricercatori affermati, e questo può solo incrementare la propagazione di linee di lavoro già alla moda, a scapito di quelle che sono meno conosciute. Sebbene le mie osservazioni siano state indirizzate al genere di ricerca teorica che non è vincolata da risultati sperimentali, la moda è importante anche in relazione agli esperimenti, ma per un motivo alquanto diverso. Questo si origina, in larga misura, dall'enorme spesa solitamente implicata nella preparazione di un esperimento. Poiché la maggior parte degli esperimenti è dawero così costosa, è richiesto normalmente il sostegno del governo o di grandi aziende commerciali, per cui sono necessari numerosi comitati per decidere se procedere con un esperimento, o per decidere quale tipo d'esperimento sarebbe più consono per sfruttare gli scarsi fondi a disposizione. È naturale che i membri di questi comitati con conoscenze scientifiche siano quelli che si sono affermati per il loro contributo allo sviluppo di idee che hanno condotto con successo alle attuali prospettive. Perciò, essi tenderebbero a favorire solo quegli esperimenti che sono direttamente indirizzati a problemi che sembrano naturali da questi particolari punti di vista. La teoria ha quindi la tendenza a restare alquanto «bloccata» in direzioni particolari. Sarebbe molto difficile, per questo motivo, fare qualche grande cambiamento di direzione.
34.4 Una teoria erronea può essere sperimentalmente falsificata? Si potrebbe pensare che qui non vi sia alcun reale pericolo, perché se la direzione fosse sbagliata l'esperimento la infirmerebbe, e saremmo quindi forzati a scegliere qualche nuova direzione. Questo è il quadro tradizionale del modo di progredire della scienza. In effetti, il noto filosofo della scienza Karl Popper ha fornito un criterio ragionevole 14 per l'ammissibilità scientifica di una teoria proposta, e precisamente che sia osservazionalmente falsificabile. Ho però paura che sia un criterio troppo rigoroso e che in definitiva rappresenti un punto di vista sulla scienza troppo idealistico per questo mondo attuale di «grande scienza». Lasciatemi fare l'esempio della supersimmetria nella moderna fisica delle particelle: è un'idea teorica con una certa eleganza matematica e che rende molto più facile ai teorici la costruzione di QFT rinormalizzabili (§31.2). Cosa ancora più importante, è un ingrediente fondamentale della teoria delle 1020
Dove si trova fa strada verso la realtà?
stringhe. La sua posizione tra i teorici è così forte, in questi giorni, che è quasi considerata parte dell'attuale modello «standard» della fisica delle particelle. Per come stanno oggi le cose, non ha però alcun (serio) supporto sperimentale (§31.2). La teoria prevede un «superpartnern per tutte le osservate particelle fondamentali della Natura, ma nessuno di questi è stato finora osservato. Secondo i teorici della supersimmetria, ciò è dovuto al fatto che un meccanismo di rottura di simmetria (di natura ignota) fa sì che i superpartner siano così massivi che le energie necessarie per crearli vadano oltre le capacità degli acceleratori odierni. Con un incremento dell'energia disponibile i superpartner potrebbero essere scoperti e sarebbe così posta una nuova pietra miliare nella fisica, con importanti conseguenze per il :foturo. Supponiamo però che ancora non sia stato realmente trovato alcun superpartner. Ciò confuterebbe l'idea della supersimmetria? Niente affatto; si potrebbe argomentare (e probabilmente lo si farebbe) che si era stati semplicemente troppo ottimisti a proposito della piccolezza del grado di rottura di simmetria e che sarebbero necessarie energie ancora più elevate per trovare i superpartner mancanti. Vediamo che non è così facile rimuovere, per mezzo del tradizionale metodo scientifico basato su esperimenti cruciali, un'idea teorica popolare, anche nel caso in cui sia effettivamente errata. Anche il puro e semplice dispendio economico degli esperimenti rende oggi testare una teoria notevolmente più difficile di quello che sarebbe stato altrimenti. Nella fisica delle particelle, vi sono molte altre proposte teoriche in cui le particelle previste hanno masse (energie) che sono troppo elevate per qualsiasi seria possibilità di confutazione. Differenti versioni specifiche di GUT o di teoria delle stringhe fanno «previsioni» di questo genere che, per questo motivo, sono al sicuro da qualunque contestazione. Il carattere «non popperiano» di tali modelli li rende inaccettabili come teorie scientifiche? Io penso che un così rigoroso giudizio popperiano sarebbe certamente troppo severo. Come esempio, ricordiamo il ragionamento di Dirne (§28.2) che affermava che la sola esistenza di un singolo monopolo magnetico in qualche luogo del cosmo offrirebbe una spiegazione del fatto che ciascuna particella dell'universo ha una carica elettrica che è un multiplo intero di qualche dato valore (come è davvero osservato). La teoria che afferma che un tale monopolo esiste in qualche luogo è chiaramente non popperiana. Questa teoria potrebbe essere accertata dalla scoperta di una simile particella, ma pare che non sia falsificabile, come richiesto dal criterio di Popper; infatti, se la teotia fosse errata, l'incapacità degli sperimentatori di trovare un monopolo, per quanto lunga sia la ricerca, non infirmerebbe la teoria! 15 Questa teoria è però certamente scientifica e degna di considerazione. Un commento analogo potrebbe essere fatto riguardo alla cosmologia. La regione dell'universo che è al di là del nostro orizzonte di particella (§27.12) non è direttamente osservabile; sembra, tuttavia, che sia fisicamente ragionevole assumere che quella regione rassomigli, su grande scala, alla regione che 1021
LA STRADA CHE PORTA ALLA REALTÀ
è accessibile all'osservazione diretta. La teoria per cui la regione inosservabile rassomigli davvero alla regione accessibile all'osservazione- che, in realtà, fa parte del modello standard della cosmologia (§27.8), ma non della maggior parte dei modelli inflazionati (§28.4) - non è falsificabile con l'osservazione. Inoltre, persino se restringiamo l'attenzione alla parte direttamente osservabile dell'universo, possiamo chiederci se la geometria dello spazio, supposto omogeneo e isotropo su grande scala, abbia curvatura positiva, negativa o nulla (i casi K> O, K < O, K = O, rispettivamente; vedi §27.8). Se la nostra teoria asserisce che K = O, questa affermazione può essere osservazionalmente falsificabile, perché per qualunque deviazione finita dalla piattezza spaziale un'osservazione sufficientemente precisa potrebbe (in linea di principio - anche se forse non in pratica) discernere questo spostamento dalla piattezza, per quanto piccola possa essere la curvatura dello spazio; ma se la nostra teoria asserisce che K # O, la teoria non potrebbe essere rifiutata se in realtà fosse K = O, perché vi sarebbe sempre nelle osservazioni qualche margine d'incertezza che potrebbe consentire una curvatura positiva o negativa molto piccola. Osserviamo che il caso K > Opotrebbe essere confutato se in realtà fosse K < O, e lo stesso avverrebbe a ruoli invertiti. D'altra parte, K = O non può essere (direttamente) confermato, 16 mentre K # Opotrebbe essere confennato dall'osservazione (nel caso in cui l'universo avesse effettivamente quelle caratteristiche). In questo modo, entrambe le asserzioni K > Oe K < Osono popperiane, nel senso ristretto che sono falsificabili in certe circostanze - anche se non possono essere falsificate se, in realtà, K = O- e sono anche individualmente confermabili. Notiamo che l'affermazione K = Oè completamente popperiana, in linea di principio, ma non confermabile! Non sono sicuro dove ci lasci il punto di vista popperiano, a causa di queste varie possibilità. A me sembra evidente che ognuno dei tre casi K > O, K < Oe K = Oè egualmente un'asserzione «scientifica», indipendentemente da queste sottili differenze riguardo al criterio di Popper. Ciononostante, una teoria corretta sarebbe in migliori condizioni se predicesse o K > Oo K < O, poiché allora avrebbe la probabilità di essere confermata dall'osservazione (e una conferma è ciò che richiede una teoria scientifica, nonostante il punto di vista più negativo di Popper sul problema dell'accettabilità scientifica). Una teoria che predicesse K = Odovrebbe dipendere da altre giustificazioni affinché sia accettata. Una di queste giustificazioni potrebbe essere che K = Osia una conseguenza di una particolare teoria che trova conferma osservativa in qualche altro modo. In verità, questa è la situazione conclamata per la cosmologia inflazionaria, molto alla moda, che è stata discussa in §28.4. Ricordiamo che, come la supersimmetria è ritenuta «quasi» parte del modello standard della fisica delle particelle, la cosmologia inflazionaria è spesso ritenuta quasi parte dell'attuale modello «standard» della cosmòlogia! Tentiamo di prendere in esame lo status del1'inflazione riguardo al principio di falsificazione di Popper. Si potrebbe pensare che la situazione sia chiara e che l'inflazione sia proprio 1022
Dove si trol'a la strada verso la realtà:
una teoria popperiana; per più di un decennio è stato costantemente asserito che K = Oè una delle conseguenze dell'idea d'inflazione, 17 e ricordo di aver assistito a numerosi seminari tenuti da sostenitori del! 'inflazione in cui venivano fatte simili previsioni. 18 Quindi, se le osservazioni ci dicono con sicurezza che K O, l'inflazione deve essere esclusa. Questo sembra il modo migliore di aderire al p1incipio di Popper! Vi sono, inoltre, molte previsioni deitagliate sulla radiazione di fondo che provengono dall'inflazione (assieme ad alcune altre assunzioni), e sembra che queste godano generalmente di qualche notevole sostegno osservazionale, in particolare riguardo all'osservata invarianza di scala delle fluttuazioni, in accordo con la maggior parte delle previsioni inflazionarie. Tuttavia, a metà degli anni Novanta, hanno cominciato ad aumentare le prove, da vari tipi indipendenti d'osservazione, che la densità media della materia Qd (barionica più oscura) del! 'universo è inferiore a quella che sarebbe richiesta per una piattezza spaziale globale, essendo al massimo circa un terzo di quel valore. (I valori delle grandezze QJ e Q 11 sono dati in termini di frazione della densità critica - vale a dire, quella che darebbe K = O nella teoria di Einstein senza il termine cosmologico; vedi §28.10.) .Q" è quindi circa 0.3. In accordo con questa tendenza delle osservazioni, i teorici dell'inflazione hanno iniziato a fornire modelli inflazionari che ammettono K * O, con in effetti K < 0. 19 Possiamo inoltre far notare che anche la scuola di Hawking, in cui sembrava che K > O fosse una previsione certa (collegata alla proposta «senza frontiera» di Hartle-Hawking- vedi §28.9), ha cominciato a considerare modi in cui K < O potrebbe essere adattato nel loro schema. 20 Questa situazione è durata fino al 1998, quando alcune osservazioni di supernove lontane sembravano dirci che è necessario includere nel!' equazione di Einstein una costante cosmologica positiva, cioè A> O. Ciò dà una densità efficace aggiuntiva L(1 che, quando messa insieme alla densità della materia .Qc1, darebbe quella considerata c1itica, .!~1 + !2.1 = l (o, invece, la Qd + QA > l che sarebbe necessaria per l'originaria proposta cli Hartle-Hawking). In questo modo, la piattezza spaziale globale (K = O) può essere coerente con l'osservazione (come lo potrebbe essere una curvatura spaziale globale positiva), con QA z O. 7. Di fronte a ciò, pare che la maggior parte degli inflazionisti sia tornata a K = O come previsione della cosmologia inflazionaria. Non sono certo di ciò che Popper avrebbe pot1.1to dire di tutto questo! In effetti, vi è ora un'·esotica proposta inflazionaria in cui è introdotto nell'universo un nuovo ingrediente (un nuovo campo), chiamato «quintessenza», che fornirebbe una costante cosmologica effèttiva, tramite una «energia oscura» dinamica di pressione negativa. Vedi Steinhardt e altri ( 1999). È stato sostenuto che questo potrebbe segnalare l'arrivo di una nuova fase d'inflazione (vedi §28.10)! Sì deve sperare che suggerimenti alquanto fantasiosi come questi troveranno davvero il modo d'essere convincentemente definiti dall'osservazione, anche se, in pratica, le cose raramente sembrano essere così chiare.
*
1023
LA STRADA CHE PORTA ALLA REALTÀ
Personalmente ritengo che dobbiamo essere estremamente cauti con affermazioni di questo genere - anche se apparentemente supportate da risultati sperimentali di alta qualità. Questi esperimenti sono spesso analizzati dal punto di vista di qualche teoria scientifica alla moda; per esempio, le recenti superbe osservazioni BOOMERanG2 1 della radiazione di fondo sono state inizialmente interpretate, in larghissima misura, dal punto di vista della cosmologia inflazionaria, e affermano quindi con convinzione che le osservazioni mostrano davvero che K = O(e quindi A> O). Inoltre, nel caso di alcuni espe1imenti (come in BOOMERanG) in cui sono stati raccolti moltissimi dati e in cui vi è molto spazio per differenti tipi di analisi che richiedono molti anni, può succedere che i dati grezzi non siano universalmente rilasciati per un periodo di parecchi anni, in modo che solo le persone interessate possano (molto ragionevolmente) avere un «primo incontro» con i dati. In questo periodo intennedio, non vi è molta possibilità che i dati siano analizzati da un punto di vista diverso. In effetti, nel caso di BOOMERanG, Vahe Gurzadyan e alcuni membri della squadra sono stati realmente in grado di accedere ai dati e di applicarvi la loro analisi di ellitticità (§28.10), trovando una forte indicazione diretta per K < O (più tardi supportata dalla sua corrispondente analisi dei dati WMAP). Come nel caso della «anomala» misurazione 2 WMAP (stranamente nascosta dall'asse verticale in fig. 28.19), questa non è troppo favorevole alla posizione inflazionaria. Si dovrebbe, quindi, aspettare che la polvere sedimenti prima di arrivare a una chiara conclusione riguardo a tutto ciò. Vediamo con quanta forza le questioni di moda scientifica possono influenzare le direzioni della ricerca scientifica teorica, nonostante le tradizionali affermazioni degli scienziati sull'obiettività della loro materia. Ciononostante, dovrei assolutamente chiarire che l'apparente mancanza di obiettività non è colpa della Natura; vi è un oggettivo mondo fisico là fuori e i fisici giustamente ritengono che il loro lavoro sia di scoprirne la natura e di comprenderne il comportamento. !_;apparente soggettività che scorgiamo nelle forti influenze della moda, prima accennate, è semplicemente una caratteristica del nostro procedere a tastoni verso questa comprensione, dove pressioni sociali e finanziarie e (comprensibili) debolezze e limitazioni umane svolgono ruoli importanti nelle caotiche e spesso mutuamente incoerenti descrizioni con cui attualmente ci dobbiamo confrontare.
e=
34.5 Da dove possiamo aspettarci la prossima rivoluzione fisica? In questo capitolo, credo di aver presentato un quadro dell'attuale progresso verso una comprensione fondamentale della fisica decisamente più pessimistico rispetto a quello che è spesso offerto nei resoconti popolari. Tuttavia, credo anche che sia un quadro considerevolmente più realistico. Non è comunque mia 1024
Dove si trova la strada verso la realtà?
volontà affermare che abbiamo raggiunto uno stadio in cui il progresso fondamentale è quasi impossibile, come hanno cercato di sostenere alcuni divulgatori. 22 Vi è proprio un'enorme quantità di dati osservativi che bisogna ancora capire - e sarebbe così persino se non fossero mai più effettuati altri esperimenti. I dati degli esperimenti moderni sono spesso memorizzati automaticamente, e soltanto un piccolo aspetto particolare dell'informazione memorizzata può essere interessante per i teorici e gli sperimentatori che sono direttamente coinvolti. I..:intera massa di dati sarebbe così probabilmente analizzata soltanto in vista delle particolari domande a cui essi sono interessati. È certamente possibile che vi siano molti indizi sui procedimenti naturali nascosti in tali dati, anche se non riusciamo ancora a scorgerli in modo appropriato. Si rammenti che la relatività generale di Einstein si è basata fondamentalmente sulla sua intuizione (il principio di equivalenza - vedi § 17.4) che era già implicita, ma non completamente apprezzata, nei dati osservativi a disposizione sin dal tempo di Galilei (e anche prima). Possono esserci altri indizi nascosti nelle osservazioni moderne, incommensurabilmente più estese. Probabilmente vi sono indizi «ovvi», che stanno davanti ai nostri occhi: bisognerebbe soltanto osservare da un'altra angolazione per ottenere una prospettiva fondamentalmente nuova sulla natura della realtà fisica. Credo infatti che sia necessario un nuovo punto di vista, e che questo cambiamento di prospettiva dovrà affrontare i grandi problemi sollevati dal paradosso della misura della meccanica quantistica e dalla connessa non località inerente agli effetti EPR e al problema del «quanglement» (capitoli 23 e 29). Nel capitolo 30 ho sostenuto che il paradosso della misura deve essere profondamente interconnesso con i principi della relatività generale (soprattutto con il principio d'equivalenza di Galilei-Einstein appena citato). Nuovi esperimenti (come il FELIX o una sua alternativa più realistica su base terrestre; §30.13) possono forse indicare la strada per la necessaria nuova comprensione della teoria quantistica. Forse saranno altri tipi d'esperimento a gettare luce sulla natura della gravità quantistica (per esempio quelli progettati per testare la possibilità di spazitempo di dimensionalità più alta). Forse, d'altra parte, saranno riflessioni teoriche a farci progredire. I germi di un tale sviluppo teorico apparente possono già essere scoperti in alcune delle idee descritte nei capitoli precedenti di questo libro? Chiaramente vi saranno numerosi punti di vista differenti riguardo a questo argomento, fortemente influenzati dalle opinioni personali. Per più di quarant'anni ho sperato, e continuo a farlo oggi, che la struttura della teoria dei twistor possa fornire intuizioni che potrebbero condurre a un simile cambiamento di punto di vista fisico. Però, nonostante i progressi (vedi capitolo 33), non si può dire che la teoria dei twistor, così come stanno le cose, ci abbia avviato in qualche direzione che ci aiuti a risolvere il paradosso della misura. Quale che sia la propria posizione rispetto ai meriti relativi delle teorie che ho descritto, sono certamente necessarie nuove intuizioni e nuove prospettive. 1025
LA STRADA CHE PORTA ALLA REALTÀ
In quale modo queste possono verificarsi? Possiamo aspettarci che un «nuovo Einstein», lavorando da solo, riesca a formulare idee rivoluzionarie attraverso riflessioni in gran parte personali? O ci troveremo di nuovo spinti da scoperte sperimentali notevolmente sconcertanti? Nel caso diAlbert Einstein, le sue personali intuizioni ci hanno condotto alla relatività generale, che è in grandissima misura la «teoria di una sola persona» (nonostante i contributi essenziali che Einstein ha avuto da Mink:owski, Grossmann e altri). La teoria quantistica, d'altra parte, è stata una teoria «dovuta a molte persone», poiché è stata guidata dall'esterno dagli straordinari risultati di moltissimi accurati esperimenti. Si ha l'impressione che, nell'attuale clima di ricerca fondamentale, sia molto più difficile per un singolo individuo fare progressi sostanziali rispetto al tempo di Einstein. Lavoro di gruppo, massicci calcoli al computer, l'inseguimento di idee alla moda: queste sono le attività che tendiamo a vedere nella ricerca attuale. Possiamo attenderci di veder sbocciare da queste attività le necessarie prospettive fondamentalmente nuove? Questo rimane da vedere, ma io ne dubito alquanto. Forse se le nuove direzioni possono essere indicate più sperimentalmente, come è avvenuto nel caso della meccanica quantistica nel primo terzo del ventesimo secolo, un simile approccio «a molte persone» potrebbe funzionare. Ma a mio parere questo può avvenire, nell'area della gravità quantistica, solo nel caso in cui vi siano esperimenti che rivelino un'influenza dei principi della relatività generale sulla struttura stessa della meccanica quantistica (come sostengo nel capitolo 30). In mancanza di ciò, ho l'impressione che sia necessario un approccio molto più simile a quello einsteiniano «di una singola persona»; e in questo caso non ho dubbi che solo l'estetica matematica, in aggiunta all'intuizione fisica, debba essere un'importante forza direttiva. Il motivo di questo convincimento è che quanto più sondiamo i fondamenti del comportamento fisico tanto più scopriamo che esso è accuratamente controllato dalla matematica. Inoltre, questa matematica non è solo di diretta natura computazionale, ma ha un carattere profondamènte sofisticato, in cui è possibile scorgere una sottigliezza e una bellezza non visibili nella matematica che è importante per la fisica a un livello meno fondamentale. Quindi, il progresso verso una più profonda comprensione fisica, se non può essere guidato dettagliatamente dall'esperimento, deve basarsi sempre più sull'abilità di apprezzare la rilevanza fisica e la profondità della matematica, e di «fiutare» le idee appropriate per mezzo di una valutazione di estetica matematica profondamente sensibile. È estremamente difficile, per la natura stessa del problema, stabilire un criterio affidabile per ottenere questa cosa; abbiamo già visto, nel contrasto tra gli approcci descritti negli ultimi capitoli di questo libro, come differenti sviluppi matematici, ciascuno guidato dal suo insieme di criteri di estetica matematica e fisica, possono condurre in direzioni mutuamente contraddittorie. Alcuni studiosi sostengono la necessità di cercare un modo per riunire tutti questi approcci in una specie di sintesi, distillando ciò che è appropria1026
Dove si trova la strada verso la realtà?
to dall'insieme. D'altra parte, si potrebbe ragionevolmente sostenere che le contraddizioni tra i diversi approcci siano troppo grandi e che al massimo uno di essi possa sopravvivere, mentre tutto il resto deve essere scartato. Personalmente sospetto che la verità si trovi tra questi due estremi e che si possa ancora scoprire qualcosa d'importante persino in molte di quelle teorie i cui fondamenti principali dovranno alla fine essere abbandonati. Alcune delle teorie che ho descritto, anche se non del tutto coerenti tra loro, hanno un'apprezzabile base comune. In particolare, l'approccio con variabili di loop del capitolo 32 ha significative caratteristiche in comune con la teoria dei twistor (capitolo 33) e posso immaginare che un'opportuna combinazione delle idee di ciascuna (implicanti forse reti di spin, schiume di spin, teorie di n-categoria, o persino geometria non commutativa) potrebbe portare a un progresso. La teoria delle stringhe nel suo stato attuale, con la sua dipendenza da dimensioni spaziali extra, mi sembra però troppo lontana dalla teoria dei twistor o da quella delle variabili di loop perché possa emergere una prevedibile loro unione. Le stringhe in sé e per sé non sono un motivo di incompatibilità (§31.5). Persino la supersimmetria è stata messa assieme alle idee dei twistor. 23 Ma l'insistenza della teoria delle stringhe nel richiedere un numero più elevato di dimensioni (e specialmente quelle particolari dimensioni/segnature che violano la filosofia olomorfa della teoria dei twistor - vedi il paragrafo finale di §33.4) rappresenta un conflitto fondamentale sia con la teoria dei twistor sia con la teoria delle variabili di loop. Sino a pochissimo tempo fa, i teorici delle stringhe non hanno mostrato alcuna inclinazione a fornire una coerente teoria (1 + 3)-dimensionale. Tuttavia, come è stato menzionato in §31.18 e §33.14, vi è stato di recente un mutamento e adesso alcune applicazioni delle idee delle stringhe all'ordinario spaziotempo (1 + 3)-dimensionale sembrano essere prese sul serio.
34.6 Che cos'è la realtà? Il lettore dedurrà da tutto questo che non credo che abbiamo ancora scoperto la vera «strada verso la realtà», nonostante gli straordinari progressi compiuti nel corso di tre millenni e mezzo, in particolare negli ultimissimi secoli. Sono sicuramente necessarie alcune intuizioni fondamentalmente nuove. Ma alcuni lettori potrebbero essere ancora dell'idea che questa stessa strada possa essere un miraggio. È vero - potrebbero argomentare - che siamo stati abbastanza fortunati da scoprire per caso schemi matematici in straordinario accordo con la Natura, ma l'unità della Natura nella sua interezza con qualche schema matematico non può essere che poco più di un «sogno». Altri potrebbero ritenere che la nozione stessa di «realtà fisica» con una natura veramente oggettiva, indipendente dal modo con cui potremmo scegliere di osservarla, è essa stessa un sogno. 1027
LA STRADA CHE PORTA ALLA REALTÀ
In verità, possiamo legittimamente chiederci: che cos'è la realtà? Questa è una domanda che l'uomo si è posto per migliaia d'anni e a cui i filosofi di tutte le epoche hanno tentato di dare risposte di ogni genere. Oggi, dall'osservatorio privilegiato della scienza moderna, guardiamo indietro e assumiamo una posizione più moderata: invece di tentare di rispondere alla domanda «che cosa», la maggior parte degli scienziati moderni tenterebbe di eluderla. Cercherebbero infatti di argomentare che la domanda è mal posta: non dovremmo cercare di chiederci che cosa è la realtà, ma soltanto come si comporta. «Come?» è in effetti una domanda fondamentale che possiamo considerare una delle principali preoccupazioni di questo libro: come descriviamo le leggi che reggono il nostro universo e il suo contenuto? Tuttavia, molti lettori avranno senza dubbio l'impressione che questa sia una risposta alquanto deludente, una sorta di «scappatoia». Conoscere il modo in cui il contenuto dell'universo si comporta non sembra dirci molto sulle cause di questo comportamento. La domanda «Che cosa?» è intimamente connessa a un'altra domanda antica, e precisamente a «Perché?». Perché le cose dell'universo si comportano in quel particolare modo? Ma, senza sapere che cosa sono queste cose, è difficile capire perché dovrebbero avere un comportamento piuttosto che un altro. La scienza moderna rimane cauta nel tentare di rispondere a domande di tipo «Perché?» tanto quanto a quelle di tipo «Che cosa?». Tuttavia, a domande di questo genere viene considerato accettabile rispondere purché le domande non siano relative alla realtà al suo più profondo livello. Ci si può attendere una risposta a domande come: «Di che cosa è fatta una molecola di colesterolo?», «Perché un fiammifero s'infiamma quando viene strofinato rapidamente su una superficie adeguatamente ruvida?», «Che cos'è un'aurora?», «Perché il sole brilla?», «Quali sono le forze che tengono assieme un atomo o una molecola d'idrogeno?», «Perché un atomo d'uranio è instabile?». Altre domande potrebbero però provocare maggiore imbarazzo; per esempio: «Che cos'è un elettrone?» o «Perché Io spazio ha proprio tre dimensioni?». Ma queste domande possono acquistare significato entro qualche descrizione più fondamentale della realtà fisica. Si è visto, in particolare nelle discussioni dei capitoli 31-33, che i fisici moderni descrivono invariabilmente le cose in termini di modelli matematici, qualunque sia il tipo di proposta a cui aderiscono. È come se cercassero di trovare la «realtà» nel mondo platonico delle idee matematiche. Un punto di vista simile sembrerebbe una conseguenza di qualsiasi «teoria del tutto» proposta, poiché allora la realtà fisica apparirebbe semplicemente come un riflesso di leggi puramente matematiche. Come ho sostenuto in questo capitolo, siamo sicuramente molto distanti da una simile teoria ed è argomento di discussione se qualcosa rassomigliante a una «teoria del tutto» potrà mai essere trovato. Sia come sia, è sicuramente vero che tanto più profondamente scandagliamo i segreti della Natura, tanto più profondamente siamo 1028
Dove si trova la strada verso la realtà?
spinti nel mondo platonico delle idee matematiche mentre cerchiamo di capire. Perché avviene ciò? Al momento, possiamo ritenerlo solo un mistero; è il primo dei tre profondi misteri, citati in § 1.4 e illustrati in fig. 1.3, qui riportato alquanto abbellìto in fig. 34.1. Le nozioni matematiche abitano realmente in un «mondo» tutto loro? Se così è, sembra che abbiamo trovato che l'ultima realtà abiti in questo mondo completamente astratto. Alcuni hanno difficoltà ad accettare che il mondo matematico di Platone sia in un certo senso «reale», e non ricaverebbero alcun conforto da una prospettiva in cui la realtà fisica stessa è costruita solo da nozioni astratte. Personalmente ritengo che il mondo di Platone conferisca una specie di «realtà» alle nozioni matematiche (ho tentato con forza di sostenere ciò in § 1.3), ma sarei riluttante a tentare di identificare effettivamente la realtà fisica con la realtà astratta del mondo platonico. Penso che la fig. 34.1 rappresenti nel miglior modo il mio atteggiamento rispetto a tale questione; un atteggiamento in cui ciascuno dei tre mondi - quello matematico platonico, quello fisico e quello mentale - ha il suo peculiare genere di realtà, dato che ciascuno è (profondamente e misteriosamente) fondato su quello che lo precede (i mondi sono considerati in ordine ciclico). Mi piace pensare che, in un certo senso, il mondo platonico possa essere il più primitivo dei tre, poiché la matematica è una specie di necessità, che virtualmente compare come per incanto per mezzo della sola logica. Sia come sia, vi è l'ulteriore mistero, o paradosso, dell'aspetto ciclico di questi mondi, in cui sembra che ognuno di questi sia in grado d'includere tutto quello successivo, pur sembrando dipendere solo da una piccola parte del suo predecessore.
mentalità
fisicità
Fig. 34.1 - Una ripetizione del diagramma (fig. 1.3) che raffigura «tre Mondi e tre Misteri», ma abbellito con gli altri «assoluti platonici» della Bellezza e della Moralità, in aggiunta alla Verità assoluta che deve essere trovata nella matematica. La Bellezza e la Verità sono intrecciate, poiché la bellezza di una teoria fisica agisce come guida alla sua correttezza in relazione al Mondo Fisico, mentre l'intera questione della Moralità è in definitiva dipendente dal Mondo della Mentalità. 1029
LA STRADA CHE PORTA ALLA REALTÀ
34.7 I ruoli dell'attività mentale nella teoria fisica Dobbiamo tenere a mente che ciascun «mondo» possiede il proprio genere distintivo di esistenza, diverso da quello degli altri due. Ciononostante, non penso che saremo in grado di considerare adeguatamente uno qualsiasi di questi mondi, isolato dagli altri. Poiché uno di questi mondi è quello dell'attività mentale, sorge il problema del ruolo della mente nella teoria fisica, e anche del modo in cui l'attività mentale si verifica nelle strutture fisiche con cui è associata (come i cervelli umani viventi, attenti e sani). Mi sono volutamente astenuto dal trattare diffusamente, in questo libro, la questione del1'attività mentale cosciente, nonostante questa sia importante nella nostra ricerca di una realtà fisica intelligente. (Ho trattato dettagliatamente questi argomenti altrove e non ho alcun desiderio di essere qui immischiato in molti dei controversi problemi che possono sorgere.) 24 In ogni caso, sarebbe per me inopportuno tentare di evitare del tutto la questione dell'attività mentale. A parte il fatto che il mondo dell'attività mentale deve essere considerato assieme agli altri due mondi, in accordo con fig. 34.1, vi sono in questo libro parecchi luoghi in cui il problema della coscienza ha già svolto, implicitamente o esplicitamente, un ruolo significativo nella teoria fisica. Uno di questi è in connessione al principio antropico, menzionato in §27.13 e discusso piuttosto per esteso in §§28.6, 7. Qualunque universo che può «essere osservato» deve, per necessità logica, essere in grado di supportare un'attività mentale cosciente, poiché la coscienza è quella che svolge il ruolo finale di «osservatore». Questa richiesta fondamentale potrebbe porre dei vincoli alle leggi fisiche o ai parameh·i fisici dell'universo, per poter assicurare l'esistenza dell'attività mentale cosciente. Di conseguenza, il principio antropico afferma che l'universo che noi, in quanto osservatori coscienti, effettivamente osserviamo deve operare con leggi e parametri fisici coerenti con questi vincoli. Tali vincoli potrebbero manifestarsi in valori particolari per le costanti fondamentali (adimensionali) della Natura, discusse in §31.1. In effetti, è diventato abbastanza comune ritenere che i valori che effettivamente troviamo siano il risultato di qualche specie d'applicazione del principio antropico. Sfortunatamente, persino se i valori di queste costanti sono determinati dal principio antropico - invece che, per esempio, da considerazioni matematiche - questo principio è pressoché inutilizzabile, perché sappiamo così poco delle condizioni necessarie per l'esistenza della coscienza e per il suo verificarsi. È quasi completamente inutilizzabile in un universo spazialmente infinito e sostanzialmente uniforme (K::; O), perché in un universo simile qualsiasi configurazione di materia che potrebbe verificarsi per caso si verificherebbe in qualche luogo, così che persino condizioni molto sfavorevoli per la vita cosciente sarebbero ammesse da questo principio; vedi §28.6. A mio parere, una possibilità molto più ottimistica è che queste costanti fondamentali siano effettivamente numeri matematicamente determinabili. In 1030
Dove si trova la strada verso la realtà?
un universo spazialmente infinito, ciò non fa sorgere significativi problemi con il principio antropico. La coscienza svolge un altro ruolo importante e del tutto diverso in molte interpretazioni della parte R della meccanica quantistica, come è stato discusso nel capitolo 29 (§§29.7, 8 in particolare). In effetti, quasi tutte le interpretazioni «convenzionali» della meccanica quantistica dipendono in definitiva dalla presenza di un «essere percepente»; sembra quindi che ci richiedano di sapere cosa sia effettivamente un essere percepente! Ricordiamo che l'interpretazione di Copenaghen (il punto di vista (a) in §29.1) assume che la funzione d'onda non sia un'entità fisica oggettivamente reale, ma qualcosa la cui esistenza è «nella mente dell'osservatore». Questa interpretazione, almeno in una delle sue manifestazioni, richiede inoltre che una misurazione sia una «osservazione», il che presumibilmente significa qualcosa infine osservato da un essere cosciente - anche se, a un livello di applicabilità più concreto, la misurazione è qualcosa che viene effettuato da un apparato «classico» di misura. Questa dipendenza da un apparato classico è però soltanto un «ripiego» poiché qualsiasi parte dell'apparato è costituita da componenti quantistiche e non si comp01ierebbe realmente - neppure approssimativamente - in modo classico, se si attenesse all'evoluzione quantistica standard U. (Questa è semplicemente la questione del gatto di Schrodinger; vedi §§29.7-9 e §§30.10-13.) La questione della decoerenza ambientale (il punto di vista (c) in §29 .1) ci offre anch'essa soltanto una posizione di ripiego, poiché l'inaccessibilità dell'informazione «perduta nell'ambiente» non significa che essa sia effettivamente perduta, in senso oggettivo; ma se la perdita fosse soggettiva, torniamo di nuovo alla questione del «soggettivamente percepito - da chi?», che ci riporta al problema dell'osservatore cosciente. In ogni caso, persino con la decoerenza ambientale, se manteniamo unarigorosa aderenza all'evoluzione U come «vera» descrizione quantistica dell'universo, siamo condotti alla descrizione della realtà con i molti universi (il punto di vista (b) in § 29 .1 ). Il punto di vista dei molti universi dipende manifestamente dall'avere un'adeguata comprensione di che cosa costituisce un «osservatore cosciente», poiché ogni «realtà» percepita è associata a uno «stato di osservatore», così che non sappiamo quali stati di realtà (vale a dire «universi») sono ammessi finché non sappiamo quali stati di osservatore sono ammessi. In altri termini, il comp01iamento del mondo apparentemente oggettivo che è effettivamente percepito dipende da come la propria consapevolezza penetra nelle innumerevoli alternative quantistiche sovrapposte. In mancanza di una teoria adeguata degli osservatori coscienti, l'interpretazione a molti universi deve necessariamente rimanere fondamentalmente incompleta (vedi §29.8). 25 Anche l'approccio delle storie coerenti (punto di vista (d) in §29.2) dipende esplicitamente da qualche concetto di quello che potrebbe essere un «osservatore» (il concetto chiamato IGUS - Information Gathering and Utilizing System - sistema che raccoglie e utilizza informazioni) nello schema di Gell1031
LA STRADA CHE PORTA ALLA REALTÀ
Manne Hartle). 26 Anche il punto di vista suggerito da Wigner (una versione del punto di vista (f) in §29.2) in base al quale la coscienza (o forse, in generale, qualche sistema vivente) potrebbe violare l'evoluzione U fa riferimento esplicito al ruolo della mente (o di qualunque cosa che costituisca un «osservatore») nell'interpretazione della meccanica quantistica. Per quanto ne posso capire, le sole interpretazioni che non dipendono necessariamente da qualche concetto di «osservatore cosciente» sono quella di de-Broglie-Bohm (il punto di vista (e) in §29.2)27 e la maggior parte di quelli (i punti di vista (f) in §29.2) che richiedono qualche cambiamento fondamentale delle regole della meccanica quantistica, secondo i quali i processi U e R sono ritenuti approssimazioni a qualche evoluzione fisica oggettivamente reale. Come ho affennato in molte sezioni di questo libro (in particolare nel capitolo 30), sono un sostenitore di quest'ultimo punto di vista, in cui grazie a fenomeni gravitazionali un oggettivo R (cioè OR) rimpiazza U. Questo OR gravitazionale avrebbe luogo spontaneamente e non esigerebbe che un osservatore cosciente faccia parte del processo. In circostanze normali, frequenti manifestazioni OR avverrebbero continuamente e condurrebbero all'apparizione su grande scala di un mondo classico come eccellente approssimazione. Di conseguenza, non vi è alcun bisogno d'invocare un osservatore cosciente per realizzare la riduzione dello stato quantico (R) quando ha luogo una misurazione. D'altra parte, prevedo che il fenomeno della coscienza - che ritengo un reale processo fisico che si manifesta «là fuori» nel mondo fisico - faccia fondamentalmente uso del reale processo OR. Quindi, la mia posizione è sostanzialmente opposta a quelle a cui si è prima accennato, in cui si immagina che la coscienza sia responsabile, in un modo o in un altro, del processo R. A mio parere, è un processo R fisicamente reale che è (parzialmente) responsabile della coscienza! 28 Questa opinione è sperimentalmente testabile? Credo di sì. Vi sono, in primo luogo, suggerimenti specifici circa le strutture nel cervello che potrebbero essere direttamente rilevanti - in particolare, microtubuli neuronali di reticolo A, come è stato originariamente suggerito da Stuart Hameroff29 (ma forse anche altre strutture, come clatrine sinaptiche, 30 la cui struttura rassomiglia molto a quella delle molecole di C60 ) - e vi è ampio spazio per confennare o rifiutare queste specifiche idee. Queste richiedono un tipo di coerenza quantistica su larga scala, agente attraverso regioni considerevoli del cervello (avendo caratteristiche comuni a quelle di un superconduttore ad alta temperatura;3 1 vedi §28.1), e si immagina che i microtubuli neuronali di reticolo A svolgerebbero un ruolo importante in tutto ciò, in cui un evento cosciente sarebbe associato a una parziale riduzione di stato (OR orchestrato) di questo sistema quantistico. Questo implicherebbe di norma molte parti diverse del cervello, per realizzare un movimento coerente delle molecole delle proteine sufficiente a mettere in atto l'OR gravitazionale secondo la proposta descritta in §§30.11, 12. Vi è un suggerimento ingegnoso, proposto da Andrew Duggins, secondo 1032
Dove si trova la strada verso la realtà?
cui simili idee - anche se non specifiche per l'ipotesi dei microtubuli - potrebbero essere testate. Questo suggerimento dipende dal fatto che pur essendo regioni del tutto diverse del cervello responsabili di differenti aspetti di percezione (come le percezioni visive del movimento, del colore o della forma), nell'immagine a cui la coscienza arriva tutti questi differenti aspetti si riuniscono per formare una singola immagine. Questo è noto come binding problem. L;idea di Duggins è di provare a vedere se vi sono significative violazioni delle disuguaglianze di Bell implicate nella formazione d'una immagine cosciente; queste indicherebbero la presenza di effetti non locali di tipo EPR (§23.3-5), che suggerirebbero con forza che effetti quantistici su grande scala facciano parte della percezione cosciente. I risultati preliminari non sono finora decisivi, ma abbastanza incoraggianti. 32 Qualunque sia lo stato di queste idee, mi sembra che una teoria fisica «fondamentale» che aspiri a essere ritenuta completa ai più profondi livelli dei fenomeni fisici debba avere la potenzialità di contenere le facoltà mentali coscienti. Alcuni studiosi tenterebbero a evitare (o a minimizzare) questo problema, sostenendo che la consapevolezza «emerge» semplicemente come una specie di «epifenomeno». Di conseguenza - così sarebbe affermato - non ha alcuna importanza, per l'apparizione della consapevolezza, il tipo preciso di fisica alla base dei processi (non necessariamente biologici) rilevanti. Una posizione standard è quella del funzionalismo computazionale, secondo cui è soltanto l'attività computazionale (di una specie opportuna, ma ancora non specificata) a dare origine alle facoltà mentali coscienti. Ho discusso con forza contro questa opinione (impiegando in parte ragionamenti basati sul teorema di Godel e la nozione di computabilità di Turing; vedi §16.6) e ho suggerito che la consapevolezza dipenda veramente dalla mancante teoria (gravitazionale) OR. 33 I miei ragionamenti richiedono che questa teoria mancante debba essere non computazionale (in altre parole, che le sue azioni si trovino al di fuori dell'ambito delle simulazioni della macchina di Turing; vedi § 16.6). Le idee teoriche per la formulazione di un modello OR di questo tipo sono ancora in uno stadio molto preliminare, ma qui vi sono forse alcune indicazioni.
34.8 La nostra lunga strada matematica verso la realtà Spero che sia chiaro, dalla discussione nelle sezioni precedenti, che il nostro cammino verso la comprensione della natura del mondo reale è ancora molto distante dalla sua meta. Questa meta forse non sarà mai raggiunta, o forse infine emergerà qualche teoria definitiva che ci permetterà di comprendere, in linea di principio, ciò che chiamiamo «realtà». Se così sarà, la natura di questa teoria dovrà differire notevolmente da ciò che abbiamo visto finora nelle teorie fisiche. La più importante singola intuizione, emersa nel 1033
I.A STRADA CHE PORTA ALLA REALTJ\
corso del nostro viaggio di più di due millenni e mezzo, è che vi è una profonda unità 34 tra certe aree della matematica e il funzionamento del mondo fisico; questo è il «primo mistero» raffigurato in fig. 1.3 e fig. 34.1. Se la «strada verso la realtà» raggiungerà infine la sua meta, dovrebbe esserci una sottostante semplicità, molto profonda, in quel punto finale. Io non vedo ciò in alcuna delle proposte esistenti. Questa intuizione degli antichi greci in base alla quale è la matematica a evidenziare il funzionamento della realtà fisica ci ha servito strnordinariamente bene, e io spero di avere chiarito che, nonostante la distanza dallo scopo che ci siamo prefissati, siamo arrivati a una comprensione davvero imponente delle operazioni dell'universo ai livelli più profondi di cui siamo a conoscenza. Certi concetti matematici spiccano per aver avuto un particolare successo nel passato. Tra questi vi sono il sistema dei numeri reali e le idee della geometria. All'inizio si trattò della geometria euclidea, introdotta dagli antichi greci, ma poi delle idee sviluppate da Lambert, Gauss, Lobachevski, Bolyai, Riemann, Beltrami e altri. In seguito Minkowski c'insegnò a unire il tempo con lo spazio, e Einstein ci regalò la meravigliosa geometria dello spaziotempo curvo della relatività generale. Il calcolo integrale e differenziale di Archimede, Fermat, Newton, Leibniz, Euler, Cauchy, Cartan e molti altri, così come le idee a esso collegate delle equazioni differenziali, delle equazioni integrali e delle derivate variazionali, si è dimostrato assolutamente fondamentale per le teorie che descrivono con successo il funzionamento del mondo, poiché queste idee sono collegate con la geometria in modo molto importante. Sono state fondamentali anche le idee statistiche che ci permettono di trattare sistemi fisici grandi e complicati, costituiti da un numero enorme cli singoli ingredienti, come ci hanno mostrato Maxwell, Boltzmann, Gibbs, Einstein e altri ancora. La matematica sta anche alla base della teoria quantistica, basta pensare alla teoria delle matrici di Heisenberg, agli spazi complessi di Hilbert, alle algebre di Clifford, alla te01ia delle rappresentazioni, all'analisi funzionale infinito dimensionale, eccetera di Dirac, von Neumann e molti altri. Mi piacerebbe scegliere solo due aspetti particolari della matematica che sta alla base della nostra comprensione del fimzionamento del mondo, discutendoli uno dopo l'altro poiché credo possano accennare a questioni di principio importanti ma non trattate ampiamente nella nostra teoria fisica. Il primo è il ruolo del sistema dei numeri complessi che scopriamo essere così fondamentale per le operazioni della meccanica quantistica - in contrasto con il sistema dei numeri reali che ha costituito il fondamento di tutte le precedenti teorie di successo. Il secondo è il ruolo della simmetria, che ha un'imp01ianza fondamentale in pressoché tutte le teorie del ventesimo secolo, in particolare riguardo alla formulazione della teoria di gauge delle interazioni fisiche. Consideriamo dapprima i numeri complessi. È stato tm tema ricorrente in questo libro il fatto che non solo vi è una speciale magia nella matematica di questi numeri, ma che sembra che la Natura stessa sfrutti questa magia nel tes1034
Dove si trova fa strada verso fa realtà?
sere la trama dell'universo ai suoi livelli più profondi. Potremmo, tuttavia, discutere se questa sia realmente una vera caratteristica del nostro mondo, o se sia stata soltanto l'utilità matematica di questi numeri a condurre al loro uso estensivo nella teoria fisica. Molti fisici, credo, propenderebbero per questa seconda opinione, ma ricordo loro che vi è ancora qualcosa di misterioso - che richiede qualche spiegazione - nel perché sembra che il ruolo di questi nume1i sia così univer.sale nella struttura della meccanica quantistica, stando effettivamente alla base del fondamentale principio di sovrapposizione quantistica e, in modo alquanto diverso, dell'equazione di Schrodinger, della condizione di frequenza positiva e della «struttura complessa» infinito dimensionale (§26.3) che compare nella teoria quantistica dei campi. A questi fisici sembrano «naturali» i numeri reali e «misteriosi» i numeri complessi, ma, da un punto di vista puramente matematico, non vi è niente che sia più «naturale» per i numeri reali che per quelli complessi. In verità, in vista della natura alquanto magica dei numeri complessi, si potrebbe assumere il punto di vista opposto e reputare che essi siano innegabilmente più «naturali» o «dati da Dio» rispetto ai numeri reali. Secondo il mio particolare punto di vista, l'importanza dei numeri complessi - o, in modo più specifico, l'importanza dell'olomorfia (o dell'analiticità complessa) - nei fondamenti della fisica deve essere ritenuta una cosa «naturale», poiché il mistero si trova forse nell'opinione opposta. 35 Perché strutture reali sembrano svolgere un ruolo così importante nella fisica? Bisogna spiegare bene che persino il formalismo standard della meccanica quantistica, anche se basato su numeri complessi, non è una teoria completamente olomorfa. Lo vediamo nella normale richiesta per cui le osservabili quantistiche siano descritte da operatori hermitiani (o persino normali, come è stato illustrato in §22.5) e nella natura unitaria (invece che semplicemente complessa lineare) dell'evoluzione quantistica- che dipendono dalla nozione di coniugazione complessa (z .- z). Anche l'importante proprietà di ortogonalità tra stati è un'operazione non olomorfa. I.;hermiticità ha a che fare con la solita (ma non del tutto necessaria) richiesta per cui i risultati delle misurazioni siano numeri reali, mentre l'unitarietà ha a che fare con larichiesta per cui «la probabilità sia conservata», vale a dire che sia mantenuta la regola del quadrato del modulo, per mezzo della quale un'ampiezza complessa z è convertita in una probabilità con l'operazione non olomorfa
z.- zz. Vediamo che è fondamentalmente nella conversione di «informazione quantistica» (vale a dire quanglement; vedi §23.10) in «informazione classica» (probabilità della misura) che avviene la rottura dell'olomorfia quantistica. I.; ortogonalità delle alternative è ancora una caratteristica cruciale del processo di misura. Perciò, sembra che la non olomorfia faccia la sua apparizione nel momento in cui nella teoria quantistica sono introdotte misurazioni. 1035
LA STRADA CHE PORTA ALLA REALTÀ
Naturalmente vediamo il ruolo dei numeri reali anche nello spaziotempo di sfondo entro cui è posto il formalismo della teoria quantistica. Se il processo gravitazionale OR si rivela la vera base della riduzione dello stato quantico, vedremo che la struttura di numero reale (non olomorfa) dell'effettivo spaziotempo si collegherà a quella dell'operazione z - zz. Vi è forse qui qualche lezione per i teorici dei twistor, data la particolare dipendenza di questa teoria dalle operazioni olomorfe? D'altra parte, dovremmo forse cercare un ruolo per principi combinatoriali discreti, in qualche modo emergenti dalla magia dei numeri complessi, così che lo «spaziotempo» dovrebbe avere una sottostante struttura discreta, invece di quella basata sui numeri reali (com'è stato discusso in §§3.3, 5, §32.6 e §33.1)? In ogni caso, credo che vi siano questioni molto importanti, riguardanti le stesse basi matematiche della realtà fisica. Passiamo adesso al ruolo fondamentale della simmetria nella teoria fisica moderna. Non vi è alcun dubbio sull'utilità di questa nozione. Sia la teoria della relatività (in relazione al gruppo di Lorentz) sia la teoria quantistica ne fanno un uso altamente significativo. Dobbiamo però ritenere che la simmetria sia fondamentale per i sistemi della Natura, o sia soltanto una caratteristica accidentale o approssimata? Sembra che un cardine attorno al quale ruotano molti approcci moderni alla teoria delle particelle sia ritenere la simmetria veramente fondamentale e reputare le deviazioni da essa una caratteristica di rottura di simmetria nel1'universo iniziale. In verità, come fatto notare in § 13 .1 e §§ 15 .2, 4, una simmetria esatta è una caratteristica necessaria dell'idea di connessione di fibrato. Ricordiamo, inoltre, da §§25.5, 8 che l'atteggiamento standard riguardo alla teoria elettrodebole è ritenere che la simmetria U(2) sia fondamentalmente esatta, così che possa svolgere un ruolo come simmetria di gauge delle forze elettrodeboli (§ § 15 .1, 8), immaginando normalmente però che questa simmetria si sia rotta spontaneamente (circa 1o- 12 secondi dopo il Big Bang). Ricordiamo però, da §28.3, che vi sono certe difficoltà nell'appellarsi all'universo iniziale come fornitore della necessaria rottura di simmetria. Ciò vale per la simmetria U(2) della teoria elettrodebole e anche per le simmetrie molto più grandi che sono impiegate in teorie GUT. I grandi gruppi di simmetria delle teorie GUT sono realmente delle «semplificazioni» del nostro quadro della fisica delle particelle? Non sarebbe più semplice se molte di queste apparenti simmetrie fossero fondamentalmente rotte fin dall'inizio? In base a questa seconda prospettiva alternativa (che è davvero coerente persino per la teoria elettrodebole; vedi §28.3), molte delle simmetrie che percepiamo nelle nostre teorie fondamentali sarebbei'o realmente soltanto approssimate al livello fondamentale e dovremmo fare unaricerca più approfondita per comprendere da dove provengano queste apparenti simmetrie. Nell'ordinaria teoria quantistica abbiamo esempi di entrambi i tipi di rot1036
Dove si trova la strada verso la realtà?
tura di simmetria. Vi sono situazioni ben comprese in cui si manifesta davvero una rottura spontanea di simmetria, come nel caso della superconduttività (rottura di (U(l)) e di altri fenomeni. Vi sono, d'altra parte, esempi in cui il concetto di simmetria può essere impiegato per fornire un'eccellente comprensione di un fenomeno, ma dove si sa che la simmetria è soltanto un'approssimazione, che proviene da una sottostante teoria più profonda, meno simmetrica ma più esatta, come nella classificazione degli spettri atomici. 36 Resta da vedere quale di questi due tipi di situazione avrà maggiore importanza in una più profonda teoria futura della fisica delle particelle. 37 Vi sono circostanze in cui un gruppo esatto di simmetria può verificarsi persino con strutture dove all'inizio non è imposta alcuna simmetria. Lo vediamo nel caso della stessa sfera di Riemann che possiamo immaginare messa insieme con pezzi del piano complesso in un modo specifico, mancante di qualsiasi simmetria. Purché però la topologia della varietà complessa risultante sia proprio S2, troviamo che è equivalente alla sfera di Riemann, come varietà complessa (per un teorema di Riemann), così che il suo gruppo di simmetria è esattamente SL(2, C), vale a dire il gruppo di Lorentz senza riflessione (§ 18.5), indipendentemente da quanto ÌlTegolarrnente sia messa insieme. 38 Vi è un problema connesso che riguarda le misteriose costanti (numeri puri) della Natura (§31.1 ). Questi numeri sono fissati nel primissimo universo (come nella proposta di Wheeler-Smolin a cui si è accennato in §28.6), analogamente all'idea di rottura di simmetria? In effetti, si ritiene solitamente che alcune di queste costanti, come gli angoli di Cabibbo e Weinberg (§25.7), nascano proprio in questo modo. O questi numeri potrebbero essere matematicamente fissati da qualche sottostante teoria più profonda? Quest'ultima possibilità è quella da me preferita, ma non sembra che siamo prossimi ad avere una teoria credibile di questo tipo. 39 Una questione interessante, riguardo a ciò, è l'asimmetria chirale delle interazioni deboli (§25.3). Nel normale approccio al modello standard, questa asimmetria chirale è inclusa nella struttura della teoria, ma ora è stato osservato che i neutrini (almeno la maggior parte di essi) sono particelle massive, e già questo fatto rappresenta una deviazione dall'originario modello elettrodebole standard. Non si può semplicemente «incolpare» un neutrino sinistrorso per tutta l'asimmetria chirale delle interazioni deboli. Un neutrino massivo non è interamente una particella «zig» sinistrorsa, poiché, a causa della massa, avrebbe anche una parte «zag» destrorsa (vedi §25.2). Si potrebbe immaginare che, in qualche forma del modello standard (leggermente esteso per includere neutrini massivi), vi sarebbe una rottura spontanea di simmetria da un precedente modello, simmetrico rispetto a destra e sinistra. In questo caso, però, la prospettiva «convenzionale» è che la simmetria sarebbe là fin dall'inizio, invece che nascere da una rottura spontanea di simmetria nel primo universo. Potremmo anche prendere in considerazione la questione se l'asimmetria temporale (com'è richiesta dalle discussioni nei capitoli 27 e 28) sia un pro1037
LA STRADA CHE PORTA ALLA REALTÀ
blema da esaminare di nuovo da questo punto di vista. Tuttavia, essa non potrebbe certamente provenire da una convenzionale «rottura spontanea di simmetria nell'universo iniziale». Il quadro convenzionale impiega la seconda legge della termodinamica; non può essere usato per dedurla.
34.9 Bellezza e miracoli Passiamo adesso ad alcuni aspetti, più generali e misteriosi, della matematica che stanno alla base della teoria fisica al suo livello più profondo - almeno a quel livello che finora ci è stato rivelato. Due potenti forze guida hanno fortemente influenzato la direzione della ricerca teorica, anche se di solito non vengono menzionate nei lavori scientifici seri - per timore, senza dubbio, che queste influenze possano sembrare troppo lontane dalle regole rigorose di un'idonea procedura scientifica. La prima di queste è la bellezza, o eleganza, una questione che ho già trattato altrove in questo libro. Alla seconda, vale a dire all'irresistibile attrattiva di quelli che sono spesso definiti «miracoli», ho soltanto accennato finora (in§ 19.8, §21.5e§31.14). Tuttavia, come posso garantire per esperienza personale, questi possono davvero esercitare una potente influenza sulla direzione della propria ricerca. Prima di arrivare alla questione dei miracoli, che sono la principale preoccupazione di questa sezione, torniamo a quella della bellezza, poiché queste due non sono scollegate. Come indicato in precedenza, spesso si considera che una teoria, meritevole per il fatto di aver realizzato un grande progresso nella teoria fisica, possieda anche una bellezza di natura straordinariamente affascinante. Vi è l'indiscussa bellezza della geometria euclidea, che ha formato la base della prima teoria fisica profondamente accurata, vale a dire la teoria dello spazio formulata dagli antichi greci. Un millennio e mezzo dopo è arrivata la straordinaria eleganza della dinamica newtoniana, con la sottostante struttura, bella e profonda, di geometria simplettica, com'è stato rivelato più tardi dai formalismi di Lagrange e di Hamilton (§20.4). Anche la forma matematica dell'elettromagnetismo di Maxwell è davvero raffinata, e non vi è alcun dubbio sulla suprema bellezza matematica della relatività generale di Einstein. Si può dire la stessa cosa della struttura della meccanica quantistica e di molte delle sue caratteristiche specifiche. Io sceglierei la straordinaria eleganza matematica dello spin quantistico, dell'equazione relativistica d'onda di Dirac e del formalismo dell'integrale sui cammini della QFT, com'è stato sviluppato da Feynman. Tuttavia, possiamo mettere in discussione la possibilità che l'indubbia bellezza matematica di questi schemi sia qualcosa in grado di splendere in modo indipendente, semplicemente come pura matematica, se non fosse per il notevole fatto che s'accordano così bene con il funzionamento del nostro universo? Come starebbero, in quanto solo strutture matematiche, in para1038
Dove si trova la strada verso la realtà?
gone ad alcune gemme o guide luminose della matematica pura? Credo che se la caverebbero abbastanza bene, ma non benissimo. Vi sono molte parti della matematica pura, senza alcuna discernibile relazione con il mondo fisico, la cui bellezza eguaglia o persino supera quella delle teorie fisiche che abbiamo incontrato. (Vedi anche § 16.2.) Prendiamo in considerazione alcuni sviluppi, meravigliosi e profondi, nel campo della matematica in cui l'influenza della fisica - almeno finora - è stata minima. La teoria di Cantor dell'infinito ne è un esempio degno di nota. A mio parere, è uno dei contributi matematici più belli in tutta la storia della matematica. Tuttavia, una piccola parte di essa sembra avere rilevanza per il funzionamento del mondo fisico così come lo conosciamo (vedi §§ 16.3, 4, 7). La stessa cosa avviene per un altro dei magnifici risultati della conoscenza matematica, strettamente connesso alla teoria di Cantor del1'infinito, vale a dire il famoso teorema d'incompletezza di Godel (§ 16.6). Vi sono anche le idee, di vasta portata e profonde, della teoria delle categorie (§33.1) che finora hanno avuto scarsa connessione con la fisica. In queste due ultime aree vi è qualche plausibile indicazione per cui una significativa relazione con la fisica potrebbe svilupparsi nel ventunesimo secolo (§34.7, §33.1), ma ciò è ancora altamente speculativo. Sembra molto meno plausibile che qualche importante connessione con la fisica venga alla luce per la grande maggioranza delle altre teorie matematiche, profonde e meravigliose, che sono state sviluppate. Prendiamo in considerazione, per esempio, il notevole risultato di Andrew Wiles, ottenuto alla fine del ventesimo secolo, che afferma la verità dell'asserzione vecchia più di 350 anni, nota come «ultimo teorema di Fermat». Sembra che questo sia molto lontano dalle leggi fisiche, per come le conosciamo adesso, nonostante le magnifiche idee matematiche che vi sono implicate. Molti altri meravigliosi sviluppi hanno avuto luogo nel ventesimo secolo, come la classificazione dei gruppi semplici, sia discreti sia continui. In questo caso vi sono state certamente applicazioni alla fisica, ma siamo lontani dal dire che la teoria dei gruppi semplici ci fornisce una «teoria fisica». Si tratta soltanto del fatto che le classificazioni matematiche sono d'aiuto ai fisici, permettendo loro di vedere quali sono le possibilità. Consideriamo un altro esempio. Il diciannovesimo secolo ha visto la magnifica teoria di Riemann della funzione- e della sua connessione con la distribuzione dei numeri primi. Questa sembra quasi altrettanto lontana dalla fisica, nonostante l'indubbia bellezza e la grande importanza matematica dell'ipotesi di Riemann, non ancora dimostrata (§7.4). In effetti, vi sono qui alcune affascinanti connessioni con la fisica,40 ma sarebbe difficile sostenere che la teoria di Riemann ci fornisca qualcosa di somigliante a un modello del mondo fisico. Dobbiamo aspettarci che nella fisica del futuro vi sarà una stretta relazione con una parte maggiore della meravigliosa e profonda matematica? O siamo indotti in errore dai successi che abbiamo finora visto nella teoria fisica 1039
LA STRADA CHE PORTA ALLA REALTÀ
e crediamo che la relazione tra matematica e fisica sia più stretta di quella che realmente è? La domanda può essere succintamente espressa nella rappresentazione di fig. 1.3. Quanta parte del mondo matematico platonico sta alla base della freccia che raffigura il «primo mistero»? Vi può e_ssere un modo di percepire quale tipo di matematica è quello che trova un ruolo profondo nel reggere il comportamento del mondo fisico? Questo è un problema affascinante; forse i fattori cruciali di base, che governano la misteriosa relazione tra matematica e fisica, saranno meglio compresi in un'epoca futura. Spero che considerazioni come quelle fatte prima rendano chiaro al lettore che la bellezza matematica è, di per sé, al più una guida ambigua. Tuttavia, come ho fatto notare in molte parti di questo libro, è difficile dubitare del notevole ruolo che i giudizi estetici, sia matematici che fisici, svolgono nel prendere decisioni sulle linee più fruttifere da seguire nella ricerca nel campo della fisica teorica. Molti di questi giudizi hanno un carattere sottile ed è facile rendersi conto che riuscire a comprendere quale tra parecchie alternative sia la più attraente da seguire è una questione altamente personale. Di tanto in tanto, tuttavia, nella ricerca di teorie matematiche del mondo fisico, può nascere qualcosa che su tali scelte ha un impatto molto più forte della semplice eleganza ma. tematica, e questo qualcosa è ciò che chiamo «miracolo». Posso pensare a molti esempi nella storia recente delle idee di «gravità quantistica». Nella teoria della supergravità (§31.2) fu scoperto che, mentre l'approccio perturbativo alla QFT della teoria standard della relatività generale di Einstein conduceva a divergenze non rinormalizzabili al secondo ordine, con l'introduzione della supersùnmetria queste divergenze erano miracolosamente cancellate. 41 Questa cancellazione coinvolgeva un grande numero di termini, e per un po' di tempo molti ricercatori nel campo della supergravità pensarono che questo «miracolo» di cancellazione fosse un segnale che indicava che la teoria era sulla strada giusta, in modo che ci si dovesse attendere che la rinormalizzabilità fosse possibile a tutti gli ordini - e, di conseguenza, presto sarebbe stata trovata la teoria esatta della gravità quantistica! Sfortunatamente per questi ricercatori, quando furono in grado di completare il calcolo al terzo ordine, alcune divergenze non rinormalizzabili fecero di nuovo la loro comparsa. Ciò condusse a prendere in considerazione un numero più elevato di dimensioni, ma le cose ristagnarono per un po' di tempo. P-oi, negli ultimi anni Novanta, la supergravità fu riportata in vita in quanto parte del cammino che conduce alla M-teoria, com'è stato descritto in §§31.4, 14. Sono sicuro che la teoria delle stringhe e la M-teoria sono state esse stesse guidate da moltissimi di questi miracoli. Uno dei più importanti è stato sicuramente la scoperta delle simmetrie speculari, con cui si sono avute forti indicazioni per cui la misteriosa collezione di teorie delle stringhe, apparentemente molto diverse, com'è stato descritto in §31.14, potesse essere riunita in un grande schema chiamato «M-teoria». Queste simmetrie speculari 1040
Dove si trova la strada verso la realtà?
agirono magicamente, e numeri che in precedenza sembrava non avessero alcunché in comune si trovarono a essere identici, come nel caso dei calcoli eseguiti da Candelas e dai suoi colleghi, descritti in §31.14. Questo si qualifica certamente come un miracolo, nel significato che do qui a questo termine. Sono sicuro che, quando il numero 317.206.375, ottenuto nei calcoli di Candelas con l'impiego della simmetria speculare, è stato infine confermato dagli esperti di algebra, questo è stato salutato come un miracolo, fornendo prove convincenti che la nuova M-teoria doveva essere sulla giusta strada! Che questo sia vero o meno, tale «miracolo» ha certamente offerto un eccellente sostegno agli aspetti matematici dell'idea di simmetria speculare. Molto interesse puramente matematico è stato effettivamente in seguito stimolato sulla base di questo argomento e ora è stata ottenuta una buona comprensione, dal punto di vista della matematica pura, di molte questioni che vi sono implicate. 42 Tali miracoli apparenti sono realmente buone indicazioni per la correttezza di un approccio alla teoria fisica? Questo è un problema profondo e difficile. Posso immaginare che qualche volta lo possano essere, ma bisogna essere estremamente cauti in queste cose. Poteva sembrare un miracolo la scoperta di Dirac, il fatto che la sua equazione d'onda relativistica incorporava automaticamente lo spin dell'elettrone, così come l'impiego da parte di Bohr della quantizzazione del momento angolare per ottenere il corretto spettro atomico dell'idrogeno, e analogamente la comprensione di Einstein del suo approccio alla gravità tramite lo spazio curvo della relatività generale che dava effettivamente la risposta corretta per il moto del perielio di Mercurio - che in precedenza aveva messo in imbarazzo gli astronomi per più di settant'anni. Queste erano però appropriate conseguenze fisiche delle te01ie che erano state proposte e i miracoli fornivano impressionanti conferme delle rispettive teorie; è meno chiaro quale sia la forza di miracoli puramente matematici, come nel caso della supergravità o della simmetria speculare. Quando si otterrà infine una comprensione matematica di un miracolo di questo genere, si potrà «ridimensionare» il miracolo in questione. Perché persino così la forza psicologica del miracolo, che deve sempre essere considerato nel suo appropriato contesto storico, potrebbe non essere completamente rimossa. Ma una cosa è certa: questi miracoli matematici non possono essere sempre una guida sicura. Nel corso dei miei studi sulla teoria dei twistor, mi sono imbattuto in parecchi motivi d'incoraggiamento che avrebbero potuto rientrare nella categoria dei «miracoli» nel senso che sto qui impiegando. La scoperta (§33.8) che funzioni omogenee di singoli twistor generano soluzioni generali delle equazioni del campo non massivo è stata una di queste, mentre un'altra è stata la costruzione di §33.11 del gravitone non lineare. Queste scoperte indicano che la teoria dei twistor è «sul giusto cammino»? Si deve di nuovo essere cauti. Non ho alcun desiderio di confrontare i miracoli della teoria dei twistor con quelli della teoria delle stringhe, ma non possono essere entrambi indica1041
LA STRADA CIIE PORTA ALLA REALTÀ
zioni non ambigue, perché, come fatto notare in §33.14, queste due teorie sono, così come stanno le cose, incompatibili l'una con l'altra! Questi commenti, tuttavia, si applicano solo a quello che io ritengo essere lo stato di queste teorie «in questo momento». Alcuni sviluppi dall'aria eccitante avvenuti soltanto negli ultimi mesi potrebbero rovesciare completamente le conclusioni a cui sembra che sia arrivato nei miei commenti finali nel paragrafo precedente. Questi sono alcune applicazioni molto im1ovative delle idee delle stlinghe nel contesto della teoria dei twistor, dovute soprattutto a Edward Witten43 (a cui ho già fatto riferimento brevemente in §31.18 e §33.14). In questi sviluppi, la teoria delle stringhe è applicata alla fisica dell'ordinario spazio quadridimensionale e si occupa del genere di interazioni di Yang-Mills che sono probabilmente di diretta rilevanza per le reali interazioni tra particelle, rappresentando quindi una rottura sostanziale con la forma della teoria delle stringhe a cui facevo riferimento nel paragrafo precedente. Come è stato ottenuto ciò? Essenzialmente ritenendo che lo «spazio bersaglio» in cui le superfici di Riemann della teoria delle stringhe devono essere mappate non sia una 3-varietà complessa di Calabi-Yau (§31.14), che era stata invocata per fornire le «dimensioni spaziali extra» della teoria «standard» delle stringhe, ma sia invece la 3-varietà complessa che è lo spazio proiettivo dei twistor [Plf (un IC[P3; vedi §33.5). Nel modo con cui queste nuove idee sono state descritte, è ancora implicata qualche supersimmet1ia e questa versione supersimmetrica di [Plr può essere realmente ritenuta una specie di «spazio di Calabi-Yau». (Questo perché sia soppressa una certa «anomalia» - ma a me sembra che la necessità della soppressione di questa anomalia sia probabilmente sopravvalutata e che forse la supersimmetria non sia realmente necessaria.) Per come stanno queste nuove idee, le superfici di Riemann sono ritenute avere genere 1 (vedi §8.4), cioè sono sfère di Riemann. 44 Ciò permette che sia realizzato un apprezzabile contatto con una notevole parte della prima teoria dei twistor, in cui erano state precedentemente implicate idee di «stringhe». 45 Se la teoria delle stringhe può essere cambiata in questo modo, che a me sembra essere molto essenziale, quale rilevanza fisica ham10 i «miracoli» di quella teoria? Ritengo che potrebbero avere davvero qualche rilevanza significativa (anche se indiretta) e che si potrebbe forse comprendere più facilmente quello «che avviene dietro le quinte» (come è suggerito nelle osservazioni di Richard Thomas citate in §31.18). Si può estrarre ciò che è poderoso nella teoria delle stringhe e rimuoverlo da una necessaria dipendenza dalla sopradimensionalità dello spaziotempo? Forse sì. Quello che appare vero è, in sostanza, che vi è qualcosa di profondo nell'idea di una teoria quantistica dei campi basata sulle applicazioni di sfere di Riemann su varietà complesse46 (o forse anche sulle applicazioni di sfere di Riemann di genere più elevato) e questo tipo di cosa potrebbe avere ancora rilevanza in questo contesto più nuovo, poiché la varietà complessa è lo spazio (proiettivo) dei twistor. Ma ciò che accade realmente sembra, in larga misura, un mistero. 1042
Dove si trova la strada verso la realtà?
34.10 La risposta a domande profonde suscita domande ancora più profonde Problemi come quelli descritti nelle precedenti sezioni sono lontani dall'essere risolti nell'ambito dell'attuale conoscenza fisica, ma possiamo sperare che una futura fisica nel ventunesimo secolo possa gettare luce su di essi. La razza umana può però essere giustamente orgogliosa se si volge a guardare ciò che è già stato realizzato fino alla fine del ventesimo secolo. Moltissimi problemi misteriosi - e addirittura terrificanti - per gli antichi sono stati risolti e alla luce di queste soluzioni è spesso possibile agire in modo positivo. Gran parte del terrore suscitato dalle malattie è ora svanito, non solo a causa delle moderne medicine (qui il metodo scientifico si è dimostrato inestimabile), ma anche perché possono essere usate diagnosi preventive con l'impiego della tecnologia moderna (raggi X, ultrasuoni, tomografia, eccetera), così come trattamenti sofisticati (radiazioni, laser, eccetera). Spesso questa tecnologia dipende da profonde conoscenze di fisica che non erano disponibili agli antichi. Lo stesso tipo di conoscenza ci ha dato molte altre cose, come l'idroelettricità, l'illuminazione elettrica, i materiali che servono da protezione contro gli elementi atmosferici, le telecomunicazioni come la televisione e la telefonia mobile, i computer, internet, le moderne forme di trasporto e numerosi altri aspetti della nostra vita. Molti di questi sviluppi dipendono certamente e direttamente dalla fisica in una forma o in un'altra. Inoltre, le regole fondamentali della chimica, per come la si conosce oggi, sono anch'esse fondamentalmente fisiche (in linea di principio, se non in pratica) -provenendo principalmente dalle regole della meccanica quantistica. La biologia è ancora molto distante dall'essere riconducibile a leggi fisiche, ma non abbiamo alcun motivo di credere che il comportamento biologico ( a parte la coscienza) non sia, alla sua radice, semplicemente dipendente da azioni fisiche che ora fondamentalmente conosciamo. Di conseguenza, sembra che anche la biologia sia in ultima analisi controllata dalla matematica. Prendiamo in considerazione, per esempio, il modo miracoloso con cui un seme può svilupparsi in una pianta vivente, in cui la superba struttura di ciascuna pianta è simile in grande dettaglio a ciascuna delle altre che hanno origine dallo stesso tipo di seme. Vi è qui una fisica profonda alla base, poiché il DNA che controlla la crescita della pianta è una molecola, per la quale la persistenza e l'affidabilità della sua struttura dipendono crucialmente dalle regole della meccanica quantistica (come Schrodinger ha evidenziato nel 1967, nel suo piccolo ma autorevole libro What is Life?). 47 La crescita della pianta, inoltre, è controllata dalle stesse forze fisiche che governano le singole particelle che la compongono. Quelle importanti sono soprattutto d'origine elettromagnetica, ma l'interazione nucleare forte è essenziàle per determinare quali nuclei siano possibili e quindi quali atomi possano essere presenti. 1043
LA STRADA CHE PORTA ALLA REALTÀ
Anche la forza debole svolge un suo ruolo in fenomeni che osserviamo su grande scala ed è straordinario come, nonostante la sua debolezza (soltanto circa 1o- 7 volte la forza forte e 1o- 5 quella elettromagnetica), questa forza possa provocare alcuni degli eventi più drammatici sperimentati dal genere umano. È infatti la forza debole a essere responsabile, per mezzo del decadimento radioattivo all'interno della Terra, del riscaldamento del magma terrestre. Le eruzioni vulcaniche sono, in particolare, un suo retaggio. Vi è stato un periodo di pochi anni nella storia della Terra, a partire dal 535 d. C. circa, in cui in tutto il mondo vi furono carestie e una temperatura particolarmente fredda, a causa della copertura virtualmente completa di polvere dovuta a un'enorme esplosione vulcanica. Questo vulcano era probabilmente il Krakatoa, vicino a Giava, che sembra abbia avuto una violenta eruzione nel 535 e un'altra (ma non così violenta) in epoca moderna, nel 1883. Probabilmente persino più drammatica per i suoi civilizzati spettatori fu l'esplosione vulcanica che distrusse l'isola Tera (Santorini) nel 1628 a. C., che sarebbe stata facilmente visibile da Creta, a circa 150 chilometri a sud di essa. Spazzò via la comunità civilizzata di Tera e probabilmente fu responsabile del susseguente declino della pacifica e colta società di Cnosso di Creta, dove nel suo Grande Palazzo48 si diceva fosse posto il famoso labirinto di Dedalo. È stato sostenuto in modo convincente che la distruzione di Tera può essere stata all'origine del mito di Atlantide. 49 Possiamo forse trarre qualche motivo di conforto dal fatto che alcuni dei cataclismi del passato possono anche aver generato lo sviluppo di nuovi progressi che altrimenti non sarebbero potuti avvenire. (Il più drammatico di questi cataclismi è stato il completo sterminio dei dinosauri che ha permesso lo sviluppo dei mammiferi e infine quello degli esseri umani - anche se sembra che questo sia stato dovuto alla collisione con un meteorite più che a un evento vulcanico.) Lo straordinario sviluppo della cultura nell'antica Grecia nel millennio dopo la distruzione di Tera deve forse qualcosa a quel catastrofico evento vulcanico? È forse perfino più sorprendente che le più violente esplosioni viste nell'universo siano causate dalla forza più debole di tutte le altre - se è corretto chiamarla forza - vale a dire la forza gravitazionale (soltanto circa 10- 40 volte la forza elettrica, in un atomo d'idrogeno, e circa 10- 33 volte l'intensità della forza debole), dove buchi neri alimentano le incredibilmente potenti sorgenti d'energia dei quasar. Nonostante la loro straordinaria potenza, la loro distanza da noi è però così grande che, visto dalla Terra, il quasar più luminoso, 3C273, ha una luminosità che è soltanto circa I o- 6 volte quella di Sirio, una stella a noi vicina. In effetti, quando esaminiamo il cielo in una notte chiara e tranquilla, anche se possiamo provare soggezione dinanzi all'immensità dell'universo, discerniamo soltanto una piccolissima frazione di esso. Gli oggetti più distanti visibili a occhio nudo (la galassia di Andromeda) sono soltanto a un piccolo 10- 3 della distanza fino a 3C273 e a circa 10- 4 volte la distanza fino al bordo dell'universo osservabile! 1044
Dove si trova la strada verso la realtà?
Le singolarità dello spaziotempo che si trovano nei noccioli dei buchi neri sono tra gli oggetti noti (o presunti) dell'universo attorno a cui permane il più profondo mistero - e che le nostre attuali teorie sono incapaci di descrivere. Come abbiamo visto soprattutto in §§34.5, 7, 8 vi sono altri problemi profondamente misteriosi di cui abbiamo scarsissime conoscenze. È molto probabile che il ventunesimo secolo rivelerà intuizioni persino più meravigliose di quelle con cui siamo stati benedetti nel ventesimo secolo. Ma affinché ciò avvenga, avremo bisogno di idee nuove e potenti, che ci conducano in direzioni significativamente diverse da quelle attualmente seguite. Forse quello di cui abbiamo maggiormente bisogno è qualche sottile cambiamento di prospettiva - qualcosa che noi tutti ci siamo lasciati sfuggire ...
Note 1. Vedi, per esempio, Mukohyama e Randall (2003). 2. Vedi Tittel e altri ( 1998). 3. Vedi Arndt e altri (1999). 4. Vedi Amelino-Camelia e altri (1998); Gambini e Pullin (1999); Amelino-Camelia e Piran (2001); Sarkar (2002); o, per una possibile «via di fuga», Magueijo e Smolin (2002). 5. Qui la parola «coerenza» indica che vi è anche una certa economia in una struttura matematica completamente coerente, dove differenti aspetti del suo formalismo lavorano assieme in perfetto accordo. 6. Vedi Rovelli (1998) in Gravity and Relativity: At the Turn of the Millennium (a cura di N. Dadhich e J. Narlikar). 7. Alcuni miei colleghi mi hanno detto che credono che questo sia adesso veramente il caso! 8. Si ricordi, da § 15 .4, che la sfera S7 è fibrata da sfere S3 in analogia con le «parallele di Clifford» su S3 . In effetti, S7 è «parallelizzabile», che significa che a tutti i suoi punti può essere assegnata con continuità una struttura di sette vettori tangenti. Lo «schiacciamento» di S7 è ottenuto sistematicamente lungo tali direzioni «parallele». Vedi Jensen ( 1973). 9. Vedi Collins ( 1977) per le traiettorie di Regge, e Chew (1962) per la matrice S. 10. Vedi Geroch (lecture notes dell'università di Chicago, non pubblicato). 11. Vedi van der Waerden (1929); Infeld e van der Waerden (1933); Penrose e Rindler (1984, 1986); O'Donnell (2003). 12. Vedi Dirac (1936); per altre versioni delle equazioni di spin più elevato, vedi Corson (1953). 13. Vedi Wess e Zumino (1974). 14. Vedi Popper (1934). 15. Per un uso scherzoso di questo genere d'idea, vedi Aldiss e Penrose (2000). 16. Nonostante recenti dichiarazioni che BOOMERanG abbia realmente offerto una simile conferma. Vedi, per esempio, Bouchet e altri (2002), per una limitata critica di queste dichiarazioni. 17. L'universo stazionario, come proposto da Bondi, Gold e Hoyle nei primi anni Cinquanta (vedi Hoyle 1948; Bondi e Gold 1948), era palesemente popperiano, come chiaramente affermato da Bondi, e una delle vie di falsificazione sarebbe stata la prova che K -:t:- O. Questo modello, tuttavia, cadde a causa di altri 1045
LA STRADA CHE PORTA ALLA REALTÀ
18. 19. 20. 21. 22. 23. 24. 25. 26. 27. 28. 29. 30. 31. 32. 33. 34.
35. 36. 37. 38. 39. 40.
41. 42. 1046
conflitti con 1'osservazione, in particolare per la presenza della radiazione di fondo di 2.7 K, che fu virtualmente una prova diretta del Big Bang; vedi §§27.9, 10, 12 e §28.4. Vedi, per esempio, Linde (1993). Vedi Bucher e altri (1995) e Linde (1995). Vedi Hawking e Turok (1998). Vedi Langs e altri (2001 ). Vedi il libro di John Horgan: The End of Science (1996). Vedi Ferber (1978); Ward e Wells (1989); Delduc e altri (1993); Ilyenko (1999). Vedi Penrose (1989, 1994, 1997). Vedi Deutsch (2000); Lockwood (1989). Vedi Gell-Mann (1994) e Hartle (2004). Tuttavia, chiunque abbia mai ascoltato le opinioni di David Bohm su tale questione sarebbe in grado d'apprezzare che egli non ritiene i problemi della coscienza collegati a quelli della meccanica quantistica. Vedi Penrose (1989, 1994, 1997). Vedi Hameroff e Watt (1982); Hameroff (1987, 1998); Hameroff e Penrose (1996). Vedi Koruga e altri (1993). Vedi, per esempio, Anderson (1997). Comunicazione personale. Per quanto è a mia conoscenza, le investigazioni di Dugging non sono ancora complete, e nessuna pubblicazione è ancora disponibile. Vedi Penrose (1987, 1994); Hameroffe Penrose (1996). Sembra che ritenere notevole e misteriosa questa unità sia motivo di dispute tra esperti. In una famosa conferenza, Io stimato fisico matematico Eugene Wigner (1960) fece commenti su «The unreasonable effectiveness of mathematics in the physical sciences». Ma Andrew Gleason, un eminente matematico, due poderosi teoremi del quale sono già comparsi altrove in questo libro, ha assunto un punto di vista opposto ( I 990), ritenendo che la concordanza tra matematica e fisica sia soltanto un riflesso del fatto che «la matematica è la scienza dell'ordine». La mia personale opinione è più vicina a quella di Wigner che a quella di Gleason. Mi sembra che non solo la straordinaria precisione, ma anche la sottigliezza e la sofisticazione che troviamo nelle leggi matematiche operative nei fondamenti della fisica, siano molto di più che la sola espressione di un «ordine» sottostante al funzionamento del mondo. Questa filosofia sembra essere vicina a quella di Geoffrey Chew, che ha attribuito molta importanza alle proprietà di olomorfia della matrice S. Vedi Chew (1962). Vedi i commenti introduttivi di Freeman Dyson in Dyson (1996). Vedi Penrose (1988). Questo fatto è significativo nello studio delle simmetrie asintotiche di spazitempo asintoticamente piatti nella relatività generale; vedi Sachs (1962); Penrose e Rindler (1986). Confronta con Eddington (1946). Vedi du Sautoy (2004) per una discussione della connessione dell'ipotesi di Riemann con la fisica; vedi anche Berry e Keating (1999). Una veloce ricerca nel LANL arXiv mostra l'importanza della regolarizzazione della funzione (di Euler)- 136 successi nell'ultimo conteggio!!! Vedi Wess e Bagger (1992) e la nota 13 del capitolo 31. Vedi le note 57 e 58 del capitolo 31.
Dove si trova la strada verso la realtà?
43. Vedi la nota 76 del capitolo 31. 44. Questo non limita, in sé e per sé, le linee dello spazio dei twistor, che rappresentano punti dello spaziotempo, a essere queste superfici dì Riemann, vedi §33.5, ma possono essere curve di «ordine più elevato». La «condizione di genere O» ci dice fondamentalmente che ci si occupa di processi di Yang-Mìlls ad albero, in cui non sono implicati «loop chiusi» (§26.8). 45. Shaw e Hughston (1990); Hodges (1985, 1990a, 1990b). 46. Questi sono chiamati« cr-modelli»; vedi Ketov (2000). 47. Vedi Schrodinger (1967). 48. Per la leggenda, un vecchio favorito è Hamilton ( 1999) (naturalmente ristampato!). 49. Vedi Friedrich (2000) per un recente resoconto di questa idea.
EPILOGO
Antea, una dottoressa in fisica, proveniva da una cittadina del Sud Italia e possedeva un notevole talento non solo matematico ma anche artistico. Fissava il cielo in una notte chiara attraverso una grande finestra, orientata verso est, dell'Istituto Albert Einstein a Golm, vicino a Potsdam, in Germania. Questa prestigiosa istituzione di ricerca fu eretta alla fine del ventesimo secolo, in prossimità del luogo dove Einstein una volta possedeva una casetta per le vacanze. Una buona parte della ricerca svolta in quell'istituto riguardava il controverso problema della «gravità quantistica», che tenta di unificare i principi alla base della relatività generale di Einstein con quelli della meccanica quantistica - un mistero alla base stessa delle leggi del mondo. Questo era l'indirizzo della ricerca di Antea, la quale, nonostante fosse una nuova arrivata, aveva idee poco «ortodosse» e non ancora completamente formate sul modo di procedere. Alcune di queste idee erano completamente in disaccordo con quelle dei suoi colleghi. Quella notte aveva continuato a lavorare fino alle ore piccole nella biblioteca dell'istituto, mentre tutti gli altri erano già da tempo nei loro letti. Stava studiando delle vecchie ricerche riguardo a gigantesche emissioni d'energia che avvengono al centro di alcune galassie. È una vera fortuna, pensò tra sé, che la Terra e il Sistema Solare non si trovino in un luogo vicino a una di queste, altrimenti sarebbero totalmente vaporizzate in modo quasi istantaneo. La nota spiegazione di queste stupende esplosioni sta nel fatto che ciascuna è alimentata da un buco nero d'immense proporzioni. Antea sapeva bene che un buco nero è una regione dello spaziotempo nel cui interno giace una struttura nota come «singolarità dello spaziotempo» un qualcosa la cui descrizione scientifica era ancora profondamente sfug,gente, perché dipende dall'ancora mancante teoria della gravità quantistica. Ma il vero interesse di Antea non era tanto per i buchi neri galattici quanto per un'esplosione ancora più mostruosa: l'esplosione per porre fine a tutte le esplosioni - o, piuttosto, quella che diede inizio a tutte - conosciuta come «Big Bang». Antea pensava intimamente che fosse l'origine di tutte le cose buone, e di tutte le cose cattive. Ma la singolarità dello spaziotempo nel Big 1048
Epilogo
Bang presentava misteri addirittura più grandi di quelli dei buchi neri. Antea sapeva che alla radice di questi misteri si trovava il segreto per unire la teoria macroscopica di Einstein dello spazio, del tempo e della gravità con i principi quantistici della fisica. Era una notte tranquilla e le stelle erano chiarissime. Per un po' Antea rimase in stato meditabondo, con le braccia ripiegate a riposo sulla balaustra delle scale, fissando attraverso la grande finestra le disposizioni delle stelle - non seppe mai per quanto tempo. Sentiva sempre soggezione quando contemplava, in quella vasta cupola apparentemente emisferica, la grande distanza di quei minuscoli punti luminosi, ben poco comunque se paragonata alle distanze molto più grandi su scala cosmologica. Tuttavia, diceva tra sé e sé, se avesse visto ora qualche esplosione cosmica, non importa quanto fosse stata distante, i suoi fotoni sarebbero arrivati fino a lei. La stessa cosa sarebbe avvenuta per i gravitoni prodotti nell'esplosione, alcuni dei quali sarebbero stati registrati nel rivelatore d' onde gravitazionali dell'Istituto vicino ad Hannover, non molto lontano da lì. Si commosse al pensiero che lei stessa sarebbe stata in contatto diretto con quell'evento ... Mentre stava guardando verso est, fu sorpresa da un momentaneo e inaspettato bagliore di luce verde, proprio quando stava per albeggiare, dopo di che si fece strada la luce rossa del sole. Il fenomeno del «lampo verde» e della sua nota spiegazione fisica le erano noti, ma non ne aveva mai visto alcuno prima di allora e ciò destò in lei uno strano effetto emotivo. Questa esperienza si mescolò alle riflessioni matematiche che l'avevano turbata per tutta la notte. Poi uno strano pensiero s'insinuò in lei ...
BIBLIOGRAFIA
Nella fisica del ventesimo secolo vi è stata una svolta a cui non ho ancora fatto cenno, ma che si è rivelata fondamentale. Sto parlando di arXiv.org, un deposito online in cui fisici e matematici, biologi e informatici possono pubblicare preprint (o «eprint») dei loro lavori prima (o persino al posto) di presentarli a una rivista. ArXiv.org ha permesso agli scienziati di comunicare nuove idee a una velocità incredibilmente alta, e pertanto ora il cammino della ricerca procede con una rapidità mai vista. Paul Ginsparg, che ha sviluppato arXiv.org, ha vinto recentemente un MacArthur «genius» fellowship per questa innovazione. Per tentare di sfruttare questa importante nuova tendenza, ho fornito, ovunque possibile nella bibliografia, i collegamenti arXiv.org. Trovare un articolo in arXiv.org è semplicissimo. Per prima cosa andate col vostro browser preferito in arXiv.org; cercate poi l'articolo o entrate in www.arxiv.org mettendo quindi il codice di identificazione fornito, tra parentesi, nella bibliografia. Per esempio, per richiamare il lavoro di Lee Smolin How far are we from the quantum the01y of gravity del 2003, dovremmo andare all'indirizzo web: www.arxiv.org/hep-th/0303 l 85. Provate a farlo! Questa caratteristica è utile soprattutto per quei lettori che possono accedere al World Wide Web, ma che abitano distanti da una biblioteca universitaria che potrebbe avere le riviste specializzate in cui sono pubblicati i lavori scientifici. Spero che questo nuovo aspetto della bibliografia incoraggi i lettori a leggere i molti (e ottimi) lavori che si trovano in arXiv.org, e non solo quelli a cui si fa riferimento in questo libro. Abian, A., The Theory of sets and transfinite arithmetic, Saunders, Philadelphia 1965 (trad. it. La teoria degli insiemi e l'aritmetica transfinita, Feltrinelli, Milano 1972). Abbott, B. et al., Detector Description and Pe,formance far the First Coincidence Observations between LIGO and GEO, «Nuclear Instruments and Methods», A517, 2004, pp. 154-179, [gr-qc/0308043]. Adams, e.e., The Knot Book, Owl Books, New York 2000. Adams, F.J. e Atijah, M.F.A., On K-theory and Hopf invariant, «Quarterly Journal ofMathematics», 17, 1966, pp. 31-38. Adler, S.L., Quaternionic Quantum Mechanics and Quantum Fields, Oxford University Press, New York 1955. Afriat, A., The Einstein, Podolsky, and Rosen Paradox. In Atomic, Nuclear, and Particle Physics, Plenum Publishing eorp., 1999. 1053.
LA STRADA VERSO LA REALTÀ
Aharonov, Y. e Albert, D.Z., Can we make sense out of the measurement process in relativistic quantum mechanics?, «Physical Review», D24, 1981, pp. 359-370. Aharonov, Y. e Anandan, J., Phase change during a cyclic quantum evolution, «Physical Review», Lett. 58, 1987, pp. 1593-1596. Aharonov, Y. e Bohm, D.J., Signijìcance of electromagnetic potentials in the quantum theory, «Physical Review», 115, 1959, pp. 485-491. Aharonov, Y. e Vaidman, L., Properties of a quantum system during the time interval between two measurements, «Physical Review», A41, 1990, p. 11. Aharonov, Y. e Vaidman, L., The Two-State véctor Formalismo/Quantum Mechanics. In Time in Quantum Mechanics (a cura di J.G. Muga et al.), Springer-Verlag, 2001. Aharonov, Y., Bergmann, P. e Lebowitz, J.L., Time symmetry in the quantum process of measurement (a cura di J.A. Wheeler e WH. Zurek), Princeton University Press, Princeton, New Jersey 1983; originariamente in «Physical Review», 134B, 1964, pp. 1410-1416. Ahmavaara, Y., The structure of space and the formalism of relativistic quantum theory, I, «Journal ofMathematical Physics», 6, 1965, pp. 87-93. Aitchison, I. e Hey, A., Gauge Theories in Particle Physic; A Practical Introduction, Voli. 1 and 2, Institute of Physics Publishing, Bristol 2004. Albert, D., Aharanov, Y. e D'Amato, S., Curious New Statistica! Prediction ofQuantum Mechanics, «Physical Review Letters», 54, 1985, p. 5. Aldiss, B.W e Penrose, R., White Mars, St Martin's Press, London 2000 (trad. it. Marte, pianeta libero, Mondadori, Milano 2001). Alpher, Bethe e Gamow, The Origin ofChemical Elements, «Physical Review», 73, 1948,p.803. Ambjorn, J., Nielsen, J.L., Rolf, J., e Loll, R., Euclidean e Lorentzian Quantum Gravity: Lessons from Two Dimensions, «Chaos Solitons Fractals», 10, 1999, [hepth/9805108]. Amelino-Camelia, G. e Piran, T., Planck-scale deformations ofLorentz symmehy as a solution to the UHECR and the TeV-MATH-gamma paradoxes, «Physical Review», D64, 036005, 2001, [astro-ph/0008107). Amelino-Camelia, G., et al., Potential Sensitivity of Gamma-Ray Burster Observations to Wave Dispersion in Vacuo, Nature 393, 1998, pp. 763-765, [astroph/9712103]. Anderson, P.W., The Theory ofSuperconductivity in the High-Tc Cuprate Superconductors, Princeton University Press, Princeton, New Jersey 1997. Anguige, K., Isotropie cosmologica! singularities 3: The Cauchy problem for the inhomogeneous conforma! Einstein-Vlasov equations, «Annals of Physics», 282, 1999, pp. 395-419. Antoci, S., The origin ofthe electromagnetic interaction in Einstein's unifiedfield theory with sources, 2001, [gr-qc/018052]. Anton, H., e Busby, R.C., Contemporary Linear Algebra, John Wiley & Sons, Hoboken, NJ 2003. Aposto1, T.M., Introduction to Analytic Number The01y, Springer-Verlag, New York 1976. Arfken, G. and Weber, H., Mathematical Methodsfor Physicists, Harcourt/Academic Press., 2000. Arndt, M. et al., T#Jve-particle duality ofC60 molecules, «Nature», 401, 1999, p. 680. Arnold, VI., Mathematical Methods of Classica! Mechanics, Springer-Verlag, New York 1978. Arnowitt, R., Deser, S., e Misner, C.W, In Gravitation: An Introduction to Current Research (a cura di L. Witten), John Wiley& Sons, New York 1962. 1054
Bibliografia
Ashtekar, A., New variables far «Classica! and Quantum Gravity», «Physical Review Letters» 57, 1986, pp. 2244-2247. Ashtekar, A., New Hamiltonian formulation of" generai relativi()!, «Physical Review», D36, 1987, pp. 1587-1602. Ashtekar, A., Lectures on Non-Perturbative Canonica! Gravity (Appendix), World Scientific, Singapore 1991. Ashtekar, A. e Lewandowski, J., Relation between polymer and Fock excitations, «Classica! and Quantum Gravity», 18, Ll l 7-Ll27, 2001. Ashtekar, A. e Lewandowski, J., Background Jndependent Quantum. A Status Report, 2004, [gr-qc/0404018]. Ashtekar, A. e Schilling, T.A., On Einstein:~ Path (a cura di A. Harvey), SpringerVerlag, Berlin 1998. Ashtekar, A. e Lewandowski, J., Representation themy of"analytic holonomy algebras, in Knots and Quantum Gravity (a cura di J.C. Baez), Oxford University Press, Oxford 1994. Ashtekar, A., Baez, J.C. e Krasnov, K., Quantum geometry of isolateci horizons and black ho/e entropy, «Advances in Theoretical and Mathematical Physics», 4, 2000, pp. 1-95. Ashtekar, A., Baez, J.C., Corichi, A. e Krasnov, K., Quantum geomet,y ami black hole entropy, «Physical Review Letters», 80, 1998, pp. 904-907. Ashtekar, A., Bojowald, M., Lewandowski, J., Mathematical structure o/loop quantum cosmology, «Advances in Theoretical and Mathematical Physics», 7, 2003, pp. 233-268. Atiyah, M.F., The GeometJ:v ami Physics of Knots, Cambridge University Press, Cambridge 1990. Atiyah, M.F. e Singer, l.M., The Index o/Elliptic Operators on Compact Manijòlds, «Bulletin ofthe American Mathematical Society», 69, 1963, pp. 322-433. Atiyah, M.F., Hitchin, N.J. e Singer, l.M., Selfduality infòur-dimensional Riemannian geomefl:v, «Proceedings ofthe Royal Society ofLondon», A 362, 1978, pp. 425-461. Baez, J.C., Spin fòam models, «Classica! and Quantum Gravity», 15, 1998, pp. 1827-1858. Baez, J.C., An introduction to .1pin.fòam models of"quantum gravity and BF themy, «Lect. Notes Phys.», 543, 2000, pp. 25-94. Baez, J.è., «Higher-dimensional algebra and Planck-scale physics», in Physics Meets Philosophy at the Planck Scale (a cura di C. Callender e N. Hugget), Cambridge University Press, Cambridge 2001, [gr-qc/9902017]. Baez, J.C. e Dolan, D., «Categorification», in Higher Category Themy (a cura di E. Getzler e M. Kapranov), Contempora,y Mathematics, voi. 230, AMS, Providence, RI., 1998, [vedi anche http://xxx.lanl.gov/abs/math.QA/9802029]. Bahcall, N., Ostriker, J.P., Perlmutter, S. e Steinhardt, P.J., The Cosmic Triangle: Revealing the State ofthe Universe, «Science», 284, 1999, [astro-ph/9906463]. Bailey, T.N. e Baston, R.J., a cura di, Twistors in Mathematics and Physics, LMS Lecture Note Series 156, Cambridge University Press, Cambridge 1990. Bailey, T.N., Ehrenpreis, L. e Wells, R.O., Jr., Weaksolutions ofthe masslessfield equations, «Proceedings ofthe Royal Society ofLondon», A384, 1982, pp. 403-425. Banchoff, T., Beyond the Third Dimension, Scientific American library, 1990-1996, [vedi anche htpp://www.faculty.fairfield.edu/jmac/cl/tb4d.htm]. Bar, I., Survey ofTwo-Time Physic, 2000, [hep-th/0008164]. Barbour, J.B., Time ancl the inte17Jretation of quantum gravity, Syracuse University Preprint, 1992. 1055
LA STRADA VERSO LA REALTÀ
Barbour, J.B., The Discovery ofDynamics: a Study from a Machian Point ofView of the Discovery and the Structure ofDynamical Theories, Oxford University Press, Oxford 2001 a. Barbour, J.B., The End ofTime, Oxford University Press, Oxford 2001b (trad. it. La fine del tempo: la rivoluzione fisica prossima ventura, Einaudi, Torino 2003). Barbour, J.B.,Absolute ofRelative Motion: the Deep Structure ofGeneral Relativity, Oxford University Press, Oxford 2004. Barbour, J.B., Foster, B. e O Murchadha, N., Relativity without relativity, «Classica! and Quantum Gravity», 19, 2002, pp. 3217-3248, [gr-qc/0012089]. Barrett, J.W. e Crane, L., Relativistic spin networks and quantum gravity, «Journal ofMathematical Physics», 39, 1998, pp. 3296-3302. Barrett, J.W. e Crane, L., A lorentzian segnature modelfor quantum generai relativity, «Classica! and Quantum Gravity», 17, 2000, pp. 31 O1-3118. Barrow, J.D. e Tipler, F.J., TheAnthropic Cosmologica! Principle, Oxford University Press, Oxford 1986 (trad. it. Il principio antropico, Adelphi, Milano 2002). Baston, R.J. e Eastwood, M.G., The Penrose transform: its interaction with representation the01y, Oxford University Press, Oxford 1989. Becker, R., Electromagnetic Fields and Interactions, Dover, New York 1982. Begelman, M.C., Blandford, R.D. e Rees, M.J., The01y ofextragalactic radio sources, «Review ofModern Physics», 56, 1984, p. 255. Belinskii, VA., Khalatnikov, I.M. e Lifshitz, E.M., Oscilliatory approach to a singular point in the relativistic cosmology, Usp. Fiz. Nauk, 102, 1970, pp. 463-500, [Trad. inglese in «Advances in Physics», 19, pp. 525-573]. Beli, J.S., Speakable and Unspeakable in Quantum Mechanics, Cambridge University Press, Cambridge 1987. Beltrami, E., Essay on the interpretation of non-Euclidean geomehy, in Stillwell, J.C., Sources of Hyperbolic GeometJy, «Hist. Math.», 10, 1996, AMS Publications. Bergman, P.G., «Helv. Phys.», Acta Suppi., 4, 1956, p. 79. Bergman, P.G., Two-component spinors in genera! relativity, «Physical Review», 107, 1957,pp.624-629. Bern, Z., Perturbative Quantum Gravi(y and its relation to Gauge Theory, Living Rev. Relativity, 5, 2002, [www.livingreviews.org/Articles/Volume5/20025bern/index.html]. Berry, M.V, Quanta! phasejàctors accompanying adiabatic changes, «Proceedings ofthe Royal Society ofLondon», A392, 1984, pp. 45-57. Berry, M.V, Classica! adiabatic angles and quanta! adiabatic phase, «Journal of Physics A: Mathematical and Generai», 18, 1985, pp. 15-27. Berry, M. V e Keating, J.P., The Riemann Zeros and Eigenvalue Asymptotics, «SIAM Review», 41, No.2, 1999, pp. 236-266. Biedenharn, L.C. e Louck, J.D., Angular Momentum in Quantum Physics, AddisonWesley, London 1981. Bilaniuk, O.M. e Sudarshan, G., Particle beyond the light barrier, «Physics Today», 22, 1969, pp. 43-51. Birrell, N.D. e Davies, P.C.W., Quantum Fields in Curves Space, Cambridge University Press, Cambridge 1984. Bjorken, J.D. e Drell, S.D., Relativistic Quantum Mechanics, McGraw Hill, New York & London 1965. Blanchard, A., Douspis, M., Rowan-Robinson, M. e Sarkar, S., An alternative to the cosmologica! «concordance model», «Astron. Astrophys.»; 412, 2003, pp. 35-44. Blanford, R.D. e Znajek, R.L., Electromagnetic Extraction of Energy from Kerr 1056
Bibliografia
Black Holes, «Monthly ofthe Royal Astronomica! Society», 179, 1977, p. 433. Bohm, D. e Hìley, B., The Undivided Universe, Routledge, London 1994. Bojowald, M. Absence ofsingularity in loop quantum cosmology, «Physical Review Letters», 86, 2001, pp. 5227-5230. Bondi, H., Negative mass in generai relativity, «Review of Modem Physics», 29, 1957, pp. 423-428, [anche in «Mathematical Review», 19, p. 814]. Bondi, H., Gravitational waves in generai relativity, «Nature» (London), 186, 1960, p. 535. Bondi, H., Cosmology, Cambridge University Press, Cambridge 1961 (trad. it. Cosmologia, Lampugnani Nigri, Milano 1970). Bondi, H., Relativity and Common Sense, Heinemann, London 1964 (trad. it. La relatività e il senso comune. Nuova introduzione alle idee di Einstein, Zanichelli, Bologna 1975). Bondi, H., Assumption and Myth in Physical The01y, Cambridge University Press, Cambridge 1967 (trad. it. Miti e ipotesi nella teoria fisica: demistificazione di alcune grandi idee della fisica, Zanichelli, Bologna 1971). Bondi, H. e Gold T., The Steady-State Theo,y of the Expanding Universe, «Monthly ofthe Royal Astronomica! Society», 108, 1948, pp. 252-270. Bondi, H., van der Burg, M.G.J. e Metzner, A.WK., Gravitational waves in generai relativity, VII. Waves from axisymmetric isolated systems, «Proceedings of the Royal Society ofLondon», A269, 1962, pp. 21-52. Bonnor, W.B. e Rotenberg, M.A., Gravitational waves fi·om isolated sources, «Proceedings ofthe Royal Society ofLondon», A289, 1966, pp. 247-274. Borner, G., The Early Universe, Universe-Verlag, Berlin 2003. Bouchet, F.R., Peter, P., Riazuelo, A. e Sakellariadou, M., Evidence against or for topologica/ defects in the BOOMERanG data?, «Physical Review», D65, (2002), 021301, 2000, [astro-ph/0005022]. Boyer, C.B., A History of Mathematics, 2m1 ed., John Wiley & Sons, New York 1968 (trad. it. Storia della matematica, Mondadori, Milano 1990). Braginsky, V, The Detection of Gravitational Waves and Experimental Gravitation Physics, (a cura di V De Sabbata e J. Weber), Plenum Press, New York 1977, pp. 105-122. Brauer, R. e Weyl, H., Spinors in n dimensions, «American Journal of Mathematics», 57, 1935, pp. 425-449. Brekke, L. e Freund, P.G.O., p-adic numbers in physics, North-Holland, Amsterdam 1993. Bremennann, H., Distributions, Complex Variables and Fourier Transforms, Addison Wesley, Reading, Massachusetts 1965. Brody, D.C. e Hughston, L.P., «Geometrie models for quantum statistica! inference», in The Geometrie Universe; Science, Geometry, and the Work ofRoger Penrose (a cura di S.A. Huggett, L.J. Mason, K.P. Tod, S.T. Tsou e N.M.J. Woodshouse), Oxford University Press, Oxford 1998a. Brody, D.C. e Hughston, L.P., The quantum canonica/ ensemble, «Journal ofMathematical Physics», 39(12), 1998b, pp. 6502-6508. Brody, D.C. e Hughston, L.P., Geometrie Quantum Mechanics, «Journal ofGeometry and Physics», 38(1), 2001, pp. 19-53. Brown, J.W e Churchill, R.V, Complex Variables and Applications, McGraw-Hìll, New York & London 2004. Bryant, R.L., Chern, S.-S, Gardner, R.B., Goldschmidt, H.L. e Griffiths, P.A., Exterior Differential Systems, MSRI Publications, 18, Springer-Verlag, New York 1991. 1057
LA STRADA VERSO LA REALTÀ
Bucher, M., Goldhaber, A. e Turok, N., An open Universefìnm Inflation, «Physical Review», D52, 1995, [hep-ph/9411206]. Buckley, P. e Peat, F.D., Glimpsing Reality, University of Toronto Press, Toronto 1996. Budinich, P. e Trautman, A., The Spinorial Chessboard, Trieste Notes in Physics, Springer-Verlag, Berlin 1988. Burbidge, G.R., Burbidge, E.M., Fowler, WA. e Hoyle, F., Synthesis ofthe Elements in Stars, Revs. Mod. Phys., 29, 1957, pp. 547-650. Burkert, W, Lare and Science inAncient Pythagoreanism, Harvard University Press, Harvard 1972. Burkill, J.C., A First Course in Mathematica!Analysis, Cambridge University Press, Cambridge 1962. Byerly, WE., An Elementary Treatise on Fourier Series and Spherical, Cylindrical
s
and Ellipsoidal Harmonics, with Applications to Problems in Mathematical Physics, Dover, New York 2003. Cachazo, F., Svrcek, P. e Witten E., MHV Vèrtices and Tree Amplitudes in Gauge Theory, 2004, [hep-th/0403047]. Candelas, P, de la Ossa, X.C., Green, P.S. e Parkes, L., A pair of Calabi-Yau manifolds as an exactly soluble superconformal theory, «Nuclear Physics», B359, 1991,p. 21. Cartan, E., Les Systèmes Diffèrentiels Extérieurs et leurs Applications Géométriques, Hermann, Paris 1945. Cartan, É., The Theory ofSpinors, Hermann, Paris 1966. Carter, B., Cambridge Ph. D. Thesis, 1962. Carter, B., Complete Analytic Extension of the Symmet,y Axis of Kerr Solution of Einstein Equations, «Physical Review» 141, 1966, p. 4. Carter, B., «Large Number Coincidences and the Anthropic Principle», in Confimztation o/Cosmologica! Theory WithAstronomical Data (a cura di M.S. Longair), Reidel, Dordrecht 1974, pp. 291-298. (Ristampa: Leslie 1990). Cercignani, C., Ludwig Boltzmann: The Man Who TrustedAtoms, Oxford University Press, Oxford 1999. Chan, H-M. e Tsou, S.T., Some Elementary Gauge The01y Concepts, World Scientific Lecture Notes in Physics, Vol. 47, London 1993. Chan, H-M. e Tsou, S.T. Fermion Generations and Mixing/rom Dualized Standard Model, «Acta Physica Polonica», B12, 2002. Chandrasekhar, S., The maximum mass ofideal white dwarfs, «Astrophysical Journal», 74, 1981 pp. 81-82. Chandrasekhar, S., The Mathematical The01y of Black Holes, Clarendon Press, Oxford 1983. Chari, V. e Pressley, A., A Guide to Quantum Groups, Cambridge University Press, Cambridge 1994. Chen, WWL., Linear Functionà!Analysis, 2002 [sito internet: http://www.maths.mq.edu.au/~wchen/lnlfafolder/lnlfa.html]. Cheng, K.S. e Wang, J., The Formation and merger o/compact objects in centrai en-
s
s
gine ofactive galactic nuclei and quasars: gamma-ray burst and gravitational radiation, «Astrophysical Journal», 521, 1999, p. 502. Chern, S.S., Complex Manifolds Without Potential Theo,y, Springer-Verlag, New York 1979. Chernoff, P.R. e Marsden, J.E., Properties of infinite hamiltonian System, Lecture Notes in Mathematics, Vol. 425, Springer-Verlag, Berlin 1974. Chevalley, C., Theory ofLie Groups, Princeton University Press, Princeton 1946. 1058
Bibliografia
Chevalley, C., The Algebraic Theory of Spinors, Columbia University Press, New York 1954. Chew, G.F., S-Matrix Theory of Strong Interactions, Pearson Benjamin Cummings, 1962. Choquet-Bruhat, Y. e DeWitt-Morette, C., Analysis, Manifolds, and Physics, Parts I e II, North-Holland, Amsterdam 2000. Christian, J., Definite events in Newton-Cartan quantum gravity, «Physical Review» D. 1995. Claudel, C.M. e Newman, K.P., Isotropie Cosmologica! Singularities I. Polytropic Perfect Fluid Spacetimes, «Proceedings of the Royal Society of London», 454, 1998, pp. 1073-1107. Clauser, J.F., Horne M.A., Shimony, A e Holt, R.A., Proposed experiment to test loca! hidden-variable theories, «Physical Review Letters», 23, 1969, p. 880. Clifford, WK., Prelimina,y Sketch of Biquaternions, «Proceedings of the London Mathematical Society», 4, 1873, pp. 381-395. Clifford, WK., Applications of Grassmann s extensive algebra. «American Journal ofMathematics», 1, 1878, pp. 350-358. Clifford, WK., Mathematical papers by William Kingdon Clifford (a cura di R. Tucker), London 1882. Cohen, P., J., Set Themy and the Continuum Hypothesis, WA. Benjamin, New York 1966 (trad. it. La teoria degli insiemi e l'ipotesi del continuo, Feltrinelli, Milano 1973). Collins, P.D.B., An Introduction to Regge Themy and High Energy Physics, Cambridge University Press, Cambridge 1977. Colombeau, J.F., A multiplication ofdistributions, «Journal ofMathematical Analysis andApplications», 94, 1983, pp. 96-115. Colombeau, J.F., Elementary Introduction to New Generalized Functions, North Holland, Amsterdam 1985. Connes, A, «Essay on physics and non-commutative geometry», in The Interface of Mathematics and Particle Physics (a cura di D.G. Quillen, G.B. Segai e S.T. Tsou). Clarendon Press, Oxford 1990. Connes, A, Noncommutative differential geomet,y and the structure of space-time, in The Geometrie Universe; Science, Geometry, and the Work of Roger Penrose (a cura di S.A. Hugget, L.J. Mason, K.P. Tod, S.T. Tsou e N.M.J. Woodhouse), Oxford University Press, Oxford 1998. Connes, A e Berberian, S.K., Noncommutative Geomehy, Academic Press, 1995. Connes, A e Kreimer, D., Hopf Algebras, Renormalization and Noncommutative Geometry, 1998, [hep-th/9808042]. Conway, J.H. e Norton, S.P., Monstrous Moonshine, «Bulletin ofthe London Mathematical Society», 11, 1979, pp. 308-339. Conway, J.H. e Smith, D.A., On Quaternions and Octonions, A.K. Peters, 2003. Corson, E.M., Introduction to Tensors, Spinors, and Relativistic Wave-equations, Blackie and Son Ltd., London 1953. Costa de Beauregard, O. Macroscopic retrocausation, «Found. Phy. Lett.», 8(3), 1995, pp. 287-291. Cox, D.A. e Katz, S., Mirror symmetry and algebraic geometry, Mathematical Surveys and Monographs 68, American Mathematical Society, Providence, RI 1999. Cramer, J.G. An overview ofthe transactional interpretation ofquantum mechanics, «International Journal ofTheoretical Physics», 27(2), 1988. pp. 227.236. Crowe, M.J., A Hist01y of Vector Analysis: The Evolution of the Idea of a Vectorial 1059
LA STRADA VERSO LA REALTÀ
System, University of Notre Dame Press, Toronto, 1967. (Ristampato con aggiunte e correzioni da Dover, New York 1985.) Cvitanovic, P. e Kennedy, A.D, Spinors in negative dimensions, «Physica Scripta», 26, 1982, pp. 5-14. Das, A. e Ferbel, T., Introduction to Nuclear and Particle Physics, World Scientific Publishing Company, Singapore 2004. Davies, P., How to Build a Time Machine, Penguin, USA 2003 (trad. it. Come costruire una macchina del tempo, Mondadori, Milano 2003). Davis, M., «What is a Computation?», in Mathematics Today: Twelve Informai Essays (a cura di L. A. Steen), Springer-Verlag, New York 1978. Davis, M., «Mathematical logie and the origin ofmodem computers», in The Universai Turing Machine: A Half-Centwy Survey (a cura di R. Herken), Kammerer and Unverzagt, Hamburg 1988. Davydov, A.S., Quantum Mechanics, Pergamon Press, Oxford 1976. de Bernardis, P. et al. A Flat Universe ji-om High- Resolution Maps of the Cosmic Microwave Background Radiation, «Nature», 404, 2000, pp. 955-959. Del due, F., Galperin A., Howe, P. e Sokatchev, E., A twistorformulation of the heterotic D= I Osuperstring with manifest (8, O) worldsheet supersymmetry, «Physical Review», 047, 1993, pp. 578-593, [hep-th/9207050]. Derbyshire, J., Prime Obsession: Bernhard Riemann and the Greatest Unsolved Problem in Mathematics, Joseph Henry Press, Washington, DC 2003. Deser, S., Nonrenormalizability of D= Il supergravity, 1999, [hep-th/9905017]. Deser, S., lnflnities in quantum gravities, «Annalen Phys.», 9, 2000, pp. 299-307, [gr.-qc/9911073]. Deser, S. eTeitelboim, C., Supergravity Has Positive Energy, «Physical Review Letters», 39, 1977, pp. 248-252. Deser, S. e Zumino, B., Consistent supergravity, «Phys. Lett.», 62B, 1976, pp. 335-337. de Sitter, W., «Phys. Zeitz.», 14, 1913, p. 429, (in tedesco). Deutsch, D., The Fabric of Reality, Penguin, London 2000 (trad. it. La trama della realtà, Einaudi, Torino 1997). Devlin, K., Mathematics: The New GoldenAge, Penguin Books, London 1988 (trad. it. Dove va la matematica, Bollati Boringhieri, Milano 2001). Devlin, K., The Millennium Problems: The Seven Greatest Unsolved Mathematical Puzzles of Our Time, Basi e Books, London/Perseus Books, New York 2002. Dewitt, B.S., Supermanifòlds, Cambridge University Press, Cambridge 1984. Dewitt, B.S. e Graham, R.D., (a cura di), The Many-Worlds Inte,pretation ofQuantum Mechanics, Princeton University Press, Princeton 1973. Diòsi, L., Gravitation and quantum mechanical localization of macro-objects, «Phys. Lett.», 105A, 1984, pp. 199-202. Diòsi, L., Models for universal reduction of macroscopic quantum fluctuations, «Physical Review» A40, 1989, pp. 1165-1174. Dicke, R.H. Dirac 's Cosmology and Mach 's Principle, «Nature», 192, 1961, pp. 440-441. Dicke, R.H., Interaction-free quantum measurements: Aparadox?, «American Journal of Physics», 49, 1981, p. 925. Dicke, R.H., Peebles, P.J.E., Roll, P.G. e Wilkinson, D.T., Cosmic Black-Body Radiation, «Astrophysical Journal», 142, 1965, pp. 414-419. Dine, M., Some rejlections on Moduli, their Stabilization and Cosmology, 2000, [hep-th/0001157]. Dirac, P.A.M., The quantum theory of the electron, «Proceedings of the Royal Society ofLondon», A117, 1928, pp. 610-624, ibid, parte II, A118, pp. 351-361. 1060
Bibliografia
Dirac, P.A.M., «Proceedings ofthe Royal Society ofLondon», Al36, 1932, p. 453. Dirac, P.A.M., The Lagrangian in Quantum Mechanics, «Physicalische Zeitschrift der Sowjetunion», Band 3, Heft 1, 1933. Dirac P.A.M., The Cosmologica! Constants, «Nature», 139, 1937, p. 323. Dirac, P.A.M., A new basis for cosmology, «Proceedings of the Royal Society of Londom>, A165, 1938, p. 199. Dirac, P.A.M., Generalìzed Hamìltonian Dynamics, «Canadian Joumal of Mathematics», 2, 1950, p. 129. Dirac, PA.M., Lectures on Quantum Mechanics, Yeshiva University, New York 1964. Dirac, P.A.M., Lectures in Quantum Field Theory, Academic Press, New York 1966. Dirac, P.A.M., The Principles of Quantum Mechanics 411' edn, Clarendon Press, Oxford 1982a. Dirac, P.A.M., Pretty mathematics, «International Journal ofTheoretical Physics», 21, 1982b,pp. 603-605. Dirac, P.A.M., «The Origin of Quantum Field Theory», in The Birth ofParticle Physics (a cura di Brown e Hoddeson), Cambridge University Press, New York 1983. Dixon, G., Division Algebras, Quaternions, Complex Numbers and the Algebraic Design ofPhysics, Kluwer Academic Publishers, Boston 1994. Dodelson, S., Modern Cosmology, Academic Press, London 2003. Dolan, L., Superstring twisted conformalfleld the01y: Moonshine, the Monster and related topics, (South Hadley, MA, 1994), «Contemporary Mathematics», 193, 1996, pp. 9-24. Donaldson, S.K. e Kronheimer, P.B., The Geometry ofFour-Manifolds, Oxford University Press, Oxford 1990. Douady, A. e Hubbard, J., On the dynamics ofpolynomial-like mappings, «Annales Scientifiques de l'École Normale Superiéure», 18, 1985, pp. 287-343. Dowker, F. e Kent, A., On the consistent histories approach to quantum mechanics, «Journal of Statistica! Physics», 82, 1996, [gr-qc/9412067]. Drake, S., Discoveries and Opinions o/Galileo, Doubleday, New York 1957. Drake, S., Galileo Galilei: Dialogue Concerning the Two Chief World Systems-Ptolemaic and Copernican, University ofCalifornia, Berkeley 1953. Dray, T. e Manogue, C.A., The Exceptional Jordan Eigenvalue Problem, «International Joumal of Theoretical Physics», 38, 1999, pp. 2901-2916, [mathph/99110004]. Dunajski, M., Anti-self-dual four-manifolds with a parallel real spinar, «R. Soc. Lond. Proc. Ser. A Math. Phys. Eng. Sci.», 458(2021), 2002, pp. 1205-1222. du Sautoy, M., The Music of the Primes, Perennial, New York 2004 (trad. it. L'enigma dei numeri primi, Rizzoli, Milano 2004). Dunham, W. Euler: The Master ofUs Ali, Math. Assoc. Amer., Washington 1999. Dyson, F.J., Symmetry groups in nuclear and particle physics: a lecture-note and reprint volume, W.A. Benjamin, New York 1966. Eastwood, M.G., Penrose, R. e Wells, R.O., Jr, Cohomology and massless flelds, «Communications in Mathematical Physics», 78, 1981, pp. 305-351. Eddington, A.S., The Nature of the Physical World, Cambridge University Press, Cambridge 1929 (trad. it. La natura del mondo fisico, Laterza, Roma 1987). Eddington, A.S., A Symmetrical Treatment of the Wave Equation, «Proceedings of the Royal Society ofLondon», Al21, 1929b, pp. 524-542. Eddington, A.S., Fundamental Theory, Cambridge University Press, Cambridge 1946. Edwards, C.H. e Penney, D.E., Calculus with Analytic Geometly, Prentice Hall; 6 th edition, 2002. Ehrenberg, W. e Siday, R.E., The rej,-active index in electron optics and the prin1061
LA STRADA VERSO LA REALTÀ
cip/es of dynamics, «Proceedings of the Physical Society», LXIIB, 1949, pp. 8-21. Ehrenfest, P. e Ehrenfest, T., The Conceptual Foundations ofthe Statistica!Approach in Mechanics, Comell University Press, lthaca, NY 1959. Eilenberg, S. e Mac Lane, S., Generai theory ofnatural equivalences, «Transactions of the American Mathematical Society», 58, 1945, pp. 231-294. Einstein, A., S.B. Preuss. Akad. Wìss. 22, 1925, p. 414. Einstein, A., A generalization of the relativistic the01y of gravitation, «Annals of Mathematics», 46, 1945, p. 578. Einstein, A., A generalized theory ofgravitation, «Review ofModem Physics», 20, 1948, p. 35. Einstein, A., «Relativistic theory ofthe non-symmetric field», in Appendix II: The Meaning ofRelativity, 5'" ed., Princeton University Press, Princeton, New Jersey 1955, pp. 133-166. Einstein, A. e Kaufinan, B., A new form of the generai relativistie field equations, «Annals ofMathematics», 62, 1955, p. 128. Einstein, A. e Strauss, E.G., A generalization ofthe relativistic theory ofgravitation II, «Annals ofMathematics», 47, 1946, p. 731. Einstein, A., Podolsky, P. e Rosen, N., «Can quantum-mechanical description of physical reality be considered complete?», in Quantum Theo,y and Measurement (a cura di J.A. Wheeler a W.H. Zurek), Princeton University Press, Princeton, New Jersey 1983; originariamente in «Physical Review», 47, 1935, pp. 777-780. Elitzur, A.C. e Vaidman, L., Quantum mechanical interaction-fì'ee measurements, «Foundation Physics», 23, 1993, pp. 987-997. Elliot, J.P. e Dawber, P.G., Symmehy in Physics, Vol.l, Macmillan, London 1984. Ellis, J., Mavromatos, N.E. e Nanopoulos, D.V, vacuum jluctuations and decoherence in mesoscopic and microscopie system, in Symposium on Flavour-Changing Neutra! Currents. Present and Future Studies, UCLA, 1997. Ellis, J., Mavromatos, N.E. e Nanopoulos, D.V., Quantum decoherence in a D-foam background, «Modem Physics Letters», A12, 1977b, pp. 2029-2036. Engelking, E., Outline of Generai Topology, North-Holland & PWN, Amsterdam 1968. Everett, H., «Relative State» formulation of quantum mechanics», in Quantum Theory and Measurement (a cura di J.A. Wheeler e W.H. Zurek), Princeton University Press, Princeton, New Jersey 1983; originariamente in «Review of Modem Physics», 29, 1957, pp. 454-462. Fauvel, J. e Gray, J., The Hist01y of Mathematics: A Reader, Macmillan, London 1987. Ferber, A., Supertwistors and conformai supersymmetry, «Nuclear Physics», B132, 1978, pp. 55-64. Femow, R.C., Introduction to Experimental Particle Physics, Cambridge University Press, Cambridge 1989. Feynman, R.P., Space-time approach to nonrelativistic quantum mechanics, «Review ofModem Physics», 20, 1948, pp. 367-387. Feynman, R.P., The theory ofpositrons, «Physical Review» 76, 1949, p. 749. Feynman, R.P. Elementmy Particles and the Laws of Physics: The 1986 Dirac Memoria! Lectures, Cambridge University Press, Cambridge 1987. Feynman, R.P. e Hibbs, A., Quantum Mechanics and Path Integrals, McGraw-Hill, New York 1965. Fierz, M., Uber die Relativitische Theorie krafiefì'eier Teichlen mit beliebigem Spin, «Helvetica PhysicaActa», 12, 1938, pp. 3-37. 1062
Bibliografia
Fierz, M., Uber den Drehimpuls von Teichlen mit Ruhemasse null und beliebigem Spin, «Helvetica Physica Acta», 13, 1940, pp. 45-60. Fierz, M. e Pauli, W, On relativistic wave equations for particles of arbitrary spin in an electromagnetic field, «Proceedings of the Royal Society of London», Al 73, 1939, pp. 211-232. Finkelstein, D., Space-time code, «Physical Review», 184, 1969, pp. 1261-1279. Finkelstein, D.E. Rubinstein, J., Connection between spin, statistic, and kinks, «Journal of Mathematical Physics», 9, 1968, 1972. Flanders, H., Differential Forms, Academic Press, 1963. (Ripubblicato da Dorfnel 1989.) Floyd, R.M. e Penrose, R., Extraction ofRotational Energyfrom a BlackHole, «Nature Physical Science», 229, 1971, p. 117. Fortney, L.R., Principles of Electronics, Analog and Digita!, Harcourt Brace Jovanovich, 1997. Frankel, T., The Geomehy of Physics, Cambridge University Press, Cambridge 2001. Frenkel, A., A Tentative Expression ofthe Karolyhazy Uncertainty ofthe Space-time Structure through vé1cuum Spreads in Quantum Gravity, 2000, [quantph/0002087]. Friedlander, F.G ., Introduction to the theory ofdistributions, Cambridge University press, Cambridge 1982. Friedric, WL., Fire in the Sea: The Santorini Volcano: Natural Hist01y and the Legend of'Atlantis, (traduzione di A.R. McBirney), Cambridge University Press, Cambridge 2000. Frittelli, S., Kozameh, C. e Newman, E.T., Dynamics of light eone cuts at null infini(y, «Physical Review», D56, 1997, p. 8. Frohlich, J. e Pedrini, B., «New applications ofthe chiral anomaly», in Mathematical Physics 2000 (a cura di A. Fokas, A. Grigoryan, T. Kibble, e B. Zegarlinski). Imperia! College Press, London 2000, pp. 9-47. Gambini, R. e Pullin, J., Nonstandard opticsfrom quantum spacetime, «Physical Review», D59, 1999, 124021. Gandy, R., «The confluence ofideas in 1936» in The Universal Turing Machine: A Hal/Century Survey (a cura di R. Herken) Kammerer and Unverzagt, Hamburg 1988. Gangui, A., Cosmology fiwn Topologica! Defects, «AIP Conference Proceeding», 668, 2003, [astro-ph/0303504]. Gardner, M., The New Ambidextrous Universe, W H. Freeman, New York 1990 (trad. it. L'universo ambidestro: nel mondo degli specchi, delle asimmetrie, delle inversioni temporali, Mondadori-De Agostini, Novara 1996). Gauss, C.F., Werke, Voi. VIII, Leipzig 1900, pp. 357-362. Gelfand, I. E Shilov, G., Generalized Functions, vol. I, Academic Press, New York 1964. Gell-Mann, M., The Quark and the Jaguar: Adventures in the Simple and the Compiex, WH. Freeman, New York 1994. Gell-Mann, M. e Ne'eman, Y., Eightfold T#iy, Perseus Publishing, 2000. Geroch, R. e Hartle, J., Computability and physical theories, «Foundation Physics», 16, 1986, p. 533. Geroch, R., Spinor structure of space-times in generai relativity I, «Journal of Mathematical Physics», 9, 1968, pp. 1739-1744. Geroch, R., Spinm· structure of space-times in genera! relativity Il, «Journal of Mathematical Physics», 11, 1970, pp. 343-348. 1063
LA STRADA VERSO LA REALTÀ
Geroch, R., (non pubblicato), Geometrica! Quantum Mechanics, lettura presso I'Università di Chicago. Geroch, R., Kronheimer, E.H. e Penrose, R., Ideai points far space-times, «Proceedings ofthe Royal Society ofLondon», A347, 1972, pp. 545-567. Ghirardi, G.C., Grassi, R. e Rimini, A., Continuous-spontaneous-reduction model involving gravity, «Physical Review», A42, 1990, pp. 1057-1064. Ghirardi, G.C., Rimini, A. e Weber, T., Unified dynamics far microscopie and macroscopic systems, «Physical Review», D34, 1986, p. 470. , Gibbons, G. W., «The isoperimetric and Bogomolny inequalities for black holes», in · Global Riemannian Geometry (a cura di T. Wilmore e N.J. Hitchin). Ellis Horwood, Chichester 1984. Gibbons, G.W., Collapsing Shells and the Isoperimetric Inequality far Black Holes, «Classica! and Quantum Gravity», 14, 1997, pp. 2905-2915, [hep-th/9701049). Gibbons, G.W. e Hartnoll, S.A., Gravitational instability in higher dimensions, 2002, [hep-th/0206202). Gibbons, G.W. e Perry, M.J., Blac!c Holes and Thermal Green s Function, «Proceedings ofthe Royal Society ofLondon», A358, 1978, pp. 467-494. Gibbs, J., Elementary Principles in Statistica! Mechanics, Dover, New York 1960. Gindikin, S.G., On one construction o.f hyperkahler metries, «Funct. Anal. Appl.», 20, 1986,pp. 82-83. Gindikin, S.G., «Between integrai geometry and twistors», in Twistors Mathematies and Physics (a cura di T.N. Bailkey e R.J. Baston), LMS Lecture Note series 156, Cambridge University Press, Cambridge 1990. Gisin, N., Stochastic quantum dynamies and relativity, «Helvetica Physica Acta», 62, 1989, p. 363. Gisin, N., «Phys. Lett.», 143A, 1990, p. 1. Gisin, N. et al., Two independent photon pairs versus four-photon entangled states in parametric down conversion. [quant-ph/ 031 O167). Glashow, S., The renormalizability ofvector meson interaetions, «Nuclear Physics», 10, 1959, p. 107. Gleason, A.M., In More Mathematical People (a cura di D.J., Albers, G.L. Alexanderson e C. Reid). Harcourt Brace Jovanovich, Boston 1990, p. 94. Goddard, P. et al., Quantum dynamies of a massless, relativistic string, «Nuclear Physics», B56, p. 109. Gold, T., The Arrow o/Time, «Am. J. Phys.» 30, 1962, p. 403. Goldberg, J.N., Macfarlane, A.J., Newman, E.T., Rohrlich, F. e Sudarshan, E.C.G., Spin-s spherical harmonies and eth, «Journal ofMathematical Physics», 8, 1967, pp. 2155-2161. Goldblatt, R., Topoi: The Categoria/ Analysis of Logie. North-Holland Publishing Company, Oxford & New York 1979. Goldstein, S., Stochastic mechanies and quantum the01y, «Journal of Statistical Physics», 47, 1987. Gottesman, D. e Preskill, J., Comment on «The black hole final state», 2003 [hepth/0311269). Gouvea, F.Q., P-Adic Numbers: An Introduction, Springer-Verlag, 2nd edition (2000), Berlin & New York 1993. Grassmann, H.G., Die lineare Ausdehnungslehre, 4th edition, Springer-Verlag, 1844. Grassmann, H.G., Die lineare Ausdehnungslehre Vollstiindig und in strenger Form bearbeitit, 1862. Green, M.B., «Superstrings and the unification ofphysical forces», in Mathematical 1064
Bibliografia
Physics 2000 (a cura di A. Focas, T.W.B. Kibble, A. Grigouriou, e B. Zegarlinski), Imperia! College Press, London 2000, pp. 59-86. Green, M.B., Schwarz, J.H. e Witten, E., Superstring The01y, Voli. I&II, Cambridge University Press, Cambridge 1988. Greene, B., The Elegant Universe; Superstrings, Hidden Dimensions, and the Quest for the Ultimate Theory, Random House, London 1999 (trad. it. L'universo elegante: superstringhe, dimensioni nascoste e la ricerca della teoria ultima, Einaudi, Torino 2000). Griffiths, P. e Harris, J., Principies ofAlgebraic Geometry, John Wiley & Sous, New York 1978. Grishchuk, L.P. et al. Gravitational Tfave Astronomy: in Anticipation of First Sources to be Detected, «Phys. Usp.», 44, 2001, pp. 1-51. [astro-ph/000848 I). Groemer, H., Geometrie Applications of Fourier Series and Spherical Harmonics, Cambridge University Press, Cambridge 1996. Gross, D.J. e Periwal, V, String Perturbation Theory Diverges, «Physical Review Letters», 60, 1988, p. 2105. Gross, M.W., Huybrechts, D., Joyce, D. e Winkler, G.D., Calabi-Yau Manifolds and Related Geometries, Springer Verlag 2003. Grosser, M., Kunzinger, M., Oberguggenberger, M. e Steinbauer, R., Geometrie Theory of Generalized Functions withApplications to Generai Relativity, Kluwer Academic Publishers, Boston and Dordrecht, The Netherlands 2001. Guenther, D.B., Krauss, L.M. e Demarque, P., Testing the Constancy ofthe Gravitational Constant Using Helioseismology, «Astrophysical Journal», 498, 1998, pp. 871-876. Gunning, R.C. e Rossi, H., Analytic Functions of Severa! Compiex Variables, Prentice-Hall, Englewood Cliffs, New Jersey 1965. Gilrsey, F., Quaternionic and octonionic structures in physics: episodes in the relation between physics and mathematics, Symm. Phys. (1600-1980), pp. 557-592, San Feliu de Guixols, Univ. Autònoma Barcelona, Barcelona 1987. Gilrsey, F. e Tze, C.-H, On the Raie of Division, Jordan, and Related Algebras in Particle Physics, World Scientific, Singapore 1996. Gurzadyan, V.G. et al., Ellipticity analysis of the BOOMERANG CMB maps, «International Journal ofModern Physics», D12, 2002, pp. 1859-1874, [astro-ph/0210021]. Gurzadyan, V.G. et al., Is there a common originfor the WMAP low multipole and far the ellipticity in BOOMERANG CMB maps?, 2003, [astro-ph/0312305]. Gurzadyan, V.G. et al., WMAP confirming the ellipticity in BOOMERANG and COBE CMB maps, 2004, [astro-ph/0402399]. Gurzadyan, VG. e Kocharyan, A.A., On the problem of isotropization of cosmic background radiation, «Astronomy andAstrophysics», 260, 1992, p. 14. Gurzadyan, V.G. e Kocharyan, A.A., Paradigms ofthe Large-Scale Universe, Gordon and Breach, Lausanne, Switzerland 1994. Gurzadyan, V.G. e Torres, S., Testing the effect ofgeodesie mixing with COBE data to reveal the curvature of the universe, «Astronomy and Astrophysics», 321, 1997, pp. 19-23, [astro-ph/9610152]. Guth, A., The Jnjlationmy Universe, Jonathan Cape, London 1997. Haag, R., Locai Quantum Physics: Fields, Particles, Algebras, Springer-Verlag, Berlin 1992. Haehnelt, M.G., «Joint Formation of Supermassive Black Holes and Galaxies», in Carnegie Observatories Astrophysics Series, voi. 1: Coevolution of Black Holes and Galaxies (a cura di L. C. Ho), Cambridge University Press, Cambridge 2003, [astro-ph/0307378]. 1065
LA STRADA VERSO LA REALTÀ
Halverson, N.W, DASI First Results: A Measurement o.f the Cosmic Microwave Background Angular Power Spectrum, 2001, [astro-ph/0104489]. Halzen, F. e Martin A.D., Quarks and Leptons: an introductory course in modern particle physics, John Wiley & Sons, New York 1984. Hameroff, S.R., «Funcla-mental geometry: the Penrose-Hameroff «Orch OR» model of consciousness», in The Geometrie Universe, Science, Geometry and the Work ofRoger Penrose (a cura cli S.A. Huggett, L.J. Mason, K.P. Tocl, S.T. Tsou e N.M.J. Wooclhouse), Oxford University Press, Oxford 1998. Hameroff, S.R., Ultimate Computing. Biomolecular Consciousness and Nano-Technology, North-Holland, Amsterdam 1987. Hameroff, S.R. e Penrose, R., Conscious events as orchestrateci space-time selec~ tions. «Journal of Consciousness Study», 3, 1996, pp. 36-63. Hameroff, S.R. e Watt, R.C., In.formation processing in microtubules, «Journal of Theoretical Biology», 98, 1982, pp. 549-561. Hamilton, E., Mythology: Timeless Tales o.f Gods and Heroes, Warner Books, New York 1999. Han, M.Y. e Nambu, Y., Three-Triplet Model ,vith Double SU(3) Symmet,y, «Physical Review», 139, 1965, Bl006-1010. Hanany, S. et al. MAXIMA-1: A Measurement o.fthe Cosmic Microwave Background Anisotropy on angular scales o.f I Oarcminutes to 5 degrees, «Astrophysical Journal», 545, 2000, L5. Hanbury Brown, R. and Twiss, R.Q., A new type o.finter.ferometer far use in radio astronomy, «Philosophical Magazine», 45, 1954, pp. 663-682. Hanbury Brown, R. e Twiss, R.Q., Correfation between photons in 2 coherent beams o.flight, «Nature», 177, 1956. Hansen, B.M.S. e Murali, C., Gamma Ray Bursts jì-om Stellar Collisions, 1998, [astro-ph/9806256]. Hansen, R.O. Newmman, E.T., Penrose, R., e Tod, K.P, The metric and curvature properties o.f H-space, «Proceedings of the Royal Society of London», A363, 1978, pp. 445-468. Hardy, G.H., A Mathematician '.I· Apology, Cambridge University Press, Cambridge 1940. Hardy, G.H. e Wright, E.M., An lntroduction to the Themy of"Numbers, (2 nd ed.), Clarendon Press, Oxford 1945. Hardy, L., Quantum mechanics, locai realistic theories, and Lorentz-invariant realistic theories, «Physical Review Letters», 68, 1992, p. 2981, [/astract/PRL/v68 /i20/p298 l_l ]. Hardy, L., Nonlocality.for two particles without inequalitiesfor almost ali entangled states, «Physical Review Letters», 71(11), 1993, p.1665. Hartle, J. B., Gravity: An lntroduction to Einstein:~ Generai Relativity, Addison-Wesley, San Francisco, CA & London 2002. Hartle, J.B., The Physics o.f «Now», 2004, [gr-qc/0403001 ]. Harde, J.B. e Hawking, S.W., The wave .fimction o.f the Universe, «Physical Review», D28, 1983, p. 2960. Harvey, F.R., Hyperf"unctions and linear dij}èrential equations, «Proceedings ofthe National Academy of Sciences», 5, 1966, pp. l 042-1046. Harvey, F.R., Spinors and Calibrations, Academic Press, San Diego 1990. Haslehurst, L. e Penrose, R., «The rnost generai (2,2) self-dual vacuum: a googly approach», in FurtherAdvances in Twistor Themy, Voi. III: Curved Twistor Spaces (a cura di L.J. Mason, L.P. Hughston, P.Z. Kobak e K. Pulvere), 2001, pp. 345-349. Hawking, S.W., Black ho/e explosions, «Nature», 248, 1974, p. 30. 1066
Bibliografia
Hawking, S.W., Particle Creation by black holes, «Communications in Mathematical Physics», 43, 1975. Hawking, S.W., Black holes and thermodynamics, «Physical Review», D13(2) 1976a, p. 191. Hawking, S. W. Breakdown ofpredictability in gravitational collapse, «Physical Review», D14, 1976b, p. 2460. Hawking, S.W., King, A.R. e McCarthy, PJ., A new topology far curved space-time which incorporates the causa!, differential and conformai structures, «Journal of Mathematical Physics», 17, 1976, pp. 174-181. Hawking, S.W. e Ellis, G.F.R., The Large-Scale Structure of Space-Time, Cambridge University Press, Cambridge 1973. Hawking, S.W. e lsrael, W., (a cura di), 300 Years of Gravitation, Cambridge University Press, Cambridge 1987. Hawking, S.W. e Penrose, R., The singularities of gravitational collapse and cosmology, «Proceedings ofthe Royal Society ofLondon», A314, 1970, pp. 529-548. Hawking, S.W. e Penrose R., The nature of Space and Time, Princeton University Press, Princeton, New Jersey 1996 (trad. it. La natura dello spazio e del tempo, BUR, Milano 2002). Hawking, S.W. e Turok, N., Open Jnjlation Without False Vacua, «Phys. Lett.», B425, 1998, [hep-th/9802030]. Hawking. T., Weiestrass and the theory of matrices, «Archive for History and Exact Sciences», 17, 1977, pp. 119-163. Hawkins, T., Emergence ofthe theory ofLie groups, Springer-Verlag, New York 2000. Heisenberg, W., Physics and Beyond, Addison Wesley, London 1971 (trad. it. Fisica e oltre: incontri con i protagonisti 1920-1965, Bollati Boringhieri, Torino 2000). Heisenberg, W., «What is an elementary particle?», in Encounters with Einstein, Princeton University Press, Princeton 1989. Helgason, S., Differential Geometry and Symmetric Spaces, AMS Chelsea Publishing, Providence, RI 2001. Hestenes, D., The Zitterwebegung Interpretation of Quantum Mechanics, «Foundation Physics», 20(10), 1990, pp. 1213-1232. Hestenes, D. e Sobczyk, G., Clifford Algebra to Geometrie Calculus: A Unified Language for Mathematics and Physics, Reidel, Dordrecht, Holland 1999. Heyting, A., Intuitionism, Studies in Logie and the Foundations of Mathematics, North-Holland, Amsterdam 1956. Hicks, N.J., Notes on Differential Geometry, Van Nostrand, Princeton 1965. Hirschfeld, J.W.P, Projective Geometries aver Finite Fields (Seconda edizione), Clarendon Press, Oxford 1998. Hodges, A.P, Twistor diagrams, «Physica», 114A, 1982, pp. 157-175. Hodges, A.P, A twistor approach to the regularization ofdivergences, «Proceedings ofthe Royal Society ofLondon», A397, 1985, pp. 341-374. Mass eigenstatates in twistor theo,y, ibid., pp. 375-396. Hodges, A.P., «String Amplitudes and Twistor Diagrams: An Analogy», in The Jnterface of Mathematics and Particle Physics (a cura di D.G. Quillen, G.B. Segai e S.T. Tsou), Oxford University, Press, Oxford 1990a. Hodges, A.P., «Twistor diagrams of Feynman diagrams», in Twistors in Mathematics and Physics, LMS Lect. Note Ser., 156 (a cura di T.N. Bailey e R.J. Baston), Cambridge University Press, Cambridge 1990b. Hodges, A.P., «The twistor diagram programme», in The Geometrie Universe; Science, Geomehy, and the Work of Roger Penrose (a cura di S.A. Huggett, L.J. Mason, K.P Tod, S.T. Tsou e N.M.J. Woodhouse), Oxford University Press, Oxford 1998. 1067
LA STRADA VERSO LA REALTÀ
Hodges, A.P., Penrose, R. e Singer M.A., A twistor conformalfield the01y for four space-time dimensions, «Phys. Lett.», B216, 1989, pp. 48-52. Home, D., Conceptual Foundations of Quantum Physics: An Overview From Modern Perspectives, Plenum Press, New York & London 1997. Horgan J., The End ofScience, Perseus Publishing, New York 1996 (trad. it. Lafine della scienza, Adelphi, Milano 1998). Horowitz, G.T., «Quantum states ofblack holes», in Blac!c Holes and Relativistic Stars (a cura di R.M. Wald), University ofChicago Press, Chicago 1998, pp. 241-266. Horowitz, G.T. e Maldacena, J., The black holefinal state, 2003, [hep-th/0310281). Horowitz, G.T. e Perry, M. J, Gravitational energy cannot become negative, «Physical Review Letters», 48, 1982, pp. 371-374. Howie, J., On the SQ-universality ofT(6)-groups, «Forum Mathematicum», 1, 1989, pp. 251-272. Hoyle, C.D. et al., Submillimeter Test ofthe Gravitational lnverse-Square Law: A Search for «Large» Extra Dimensions, «Physical Review Letters», 86(8), 2001, pp. 1418-1421. Hoyle, F.,A New Model/or the Expanding Universe, «Mon. Not. Roy. Astron. Soc.», 108, p. 372. Hoyle, F., Fowler, WA., Burbidge, G.R. e Burbidge, E.M., Origin ofthe elements in stars, «Science», 124, 1956,pp. 611-614. Huang, On the zitterbewegung of the electron, «American Journal of Physics», 47, p. 797. Huggett, S.A. e Jordon, D., A Topologica! Aperitif, Springer-Verlag, London 2001. Hughston, L.P., 'Rvistors and Particles, Lecture Notes in Physics No. 97, SpringerVerlag, Berlin 1979. Hughston, L.P., «Geometrie Aspects of Quantum Mechanics», in Twistor Theory (a cura di S.A. Huggett), Marce! Dekker, New York 1995, pp. 59-79. Hughston, L.P., Jozsa, R. e Wooters, WR., A complete classification ofquantum ensembles having a given density matrix, «Physical Review Letters», A183, 1993, pp. 14-18. Ilyenko, K., Twistor Description of Null Strings, Oxford D. Phil. Thesis, 1999, non pubblicato. Immirzi, G., Quantum Gravity and Regge Calculus, 1997, [gr-qc/9701052). Infeld, L. e van der Waerden, B.L., Die Wellengleichung des Elektrons in der allgemeinen Relativitiitstheorie, «Sitz. Ber. Preuss. Akad. Wiss. Phisik. Math.», Kl. 9, 1933, pp. 380-401. lsenberg, J., Yasskin, P.B. e Green, P.S., Non-se(f-dual gauge fields, «Phys. Lett.», 78B, 1978, pp. 462-464. lsham, C.J., Quantum Gravity: An Oxford Symposium, Oxford University Press, Oxford 1975. Isham, C.J., Canonica! Quantum Gravity and the Problem of Time, 1992, [grqc/9210011). Israel, W, Event horizons in static vacuum space-time, «Physical Review», 164, 1967,pp.1776-1779. Jackson, J.D., Classica! Electrodynamics, John Wiley & Sons, New York & Chichester 1998. Jennewein, T., Weihs, G., Pan J. e Zeilinger, A., Experimental Nonlocality Proof of Quantum Teleportation and Entanglement Swapping, «Physical Review Letters», 88, 2002, 017903. Jensen, G., Einstein Metrics on Principal Fibre Bundles, J. Diff. Geom. 8, 1973, pp. 599-614. Johnson, C., D-Branes, Cambridge University Press, Cambridge 2003. 1068
Bibliograjìa
Jones, H.F., Groups, Representations, and Physics, Institute of Physics Publishing, Bristol 2002. Jozsa, R., Models in Categories and Twistor The01y, Oxford D. Phil. thesis, 1981, 11011 pubblicato. Jozsa, R.O., «Entanglement and quantum computation», in The Geometrie Universe (a cura di S.A. Huggett, L.J. Mason, K.P. Tod, S.T. Tsou e N.M.J. Woodhouse), Oxford University Press, Oxford 1998, pp. 369-379. Karolyhazy, F. Gravitation and quantum mechanics of macroscopic bodies, «Nuovo Cimento», A42, 1966, p. 390. Karolyhazy, F. Gravitation and Quantum Mechanics of Macroscopic Bodies, «Magyar Fizikai Foly6irat», 22, 1974, pp. 23-24. [Tesi, in ungherese]. Karolyhazy, F., Frenkel, A. e Luckas, B., «On the possible role of gravity on the reduction ofthe wave function», in Quantum Concepts in Space and Time (a cura di R. Penrose e C.J. Isham), Oxford University Press, Oxford 1986, pp. 109-128. Kahn, D.W, Topology: An lntroduction to the Point-Set and Algebraic Areas, Dover Publications, New York 1995. Kaku, M., Quantumfìeld theory: a modern introduction, Oxford University Press, Oxford 1993. Kane, G., (a cura di), Perspectives on Supersymmet,y (Advanced Series on Directions in High Energy Physics), World Scientific Pub. Co, Singapore 1999. Kane, G., Supersymmetly: Unveiling the Ultimate Laws of Nature, Perseus Publishing, New York 2001. Kamberov, G. et al., Quaternions, Spinors, and Surfàces (Contemporary Mathematics -American Mathematical Society - v. 299.), American Mathematical Society, Providence, RIO, 2002. Kapusta, J.I., Primordial Black Holes and Hot Matter, 2001, [astro-ph/0101515.] Kasper, J.E. e Feller, S.A., The Complete Boole of Holograms: How They Work and How to Ma ke Them, Dover Publications 200 I. Kauffman, L.H., Knots and Physics, World Scientific Publishing, Singapore 2001. Kay, B.S., Entropy defined, entropy increase and decoherence understood, and some black ho/e puzzles solved, 1998a, [hep-th/9802172]. Kay, B.S., Decoherence of Macroscopic Closed System within Newtonian Quantum Gravity, «Classica! and Quantum Gravity», 15, 1998b, L89-98, [hep-th/9810077]. Kay, B.S., Application of"linear hyperbolic PDE to linear quantum in curved spacetimes: especially black holes, time machines, and a new semilocal vacuum concept, «Journées Equations aux Dérivées Partielles», Nantes 5-9 Juin 2000. Groupement de Recherche 1151 du CNRS. 2000, [gr-qc/0103056]. Kay, B.S. e Wald R.M., Theorems on the uniqueness and thermal properties of stationary, non-singulm; quas(jì-ee states on space-time with a bifurcate Killing horizon, «Physics Reports», 207, 1991, pp. 49-136. Kelley, J.L., Generai Topolog)~ van Nostrand, Princeton, New Jersey 1965. Kerr, R. P., Gravitational.fìeld ofa spinning mass as an example ofalgebraically special metrics, «Physical Review Letters», 11, 1963, pp. 237-238. Ketov, S.V, Quantum Non-Linear Sigma-Models: from Quantum Field The01y to Supersymmefly, Conformai Field Theories, Black Holes, and Strings, SpringerVerlag, Berlìn-London 2000. Kibble, T.W.B., Geometrization of quantum mechanics, «Communications in Mathematical Physics», 65, 1979, p. 189. Kibble, T.WB., fa a semi-classica! theory ofgravity viable?, in Quantum Gravity 2: A Second Oxford S)lmposium (a cura di C.J. Isham, R. Penrose e D.W. Sciama), Oxford University Press, Oxford 1981, pp. 63-80. 1069
LA STRADA VERSO LA REALTÀ
Klein, F. Uber den Stand der Herausgabe von Gauss' Werken, «Annals of Mathematics», 51, 1898, pp. 128-133. Knott, C.G., Professor Klein s view o( quaternions: A criticism, «Proceedings ofthe Royal Society of Edinburgh», 23, 1900, pp. 24-34. Kobayashi, S. e Nomizu, K., Foundations ofDifferential Geomefly, Interscience Publishers, New York & London 1963. Kodaira, K., A theorem of completeness o( characteristic systems for analytic submanifòlds of a complex man(fold, «Annals of Mathematics», 75, 1962, pp. 146162. Kodaira, K. e Spencer, D.C., On dejòrmations o( complex analytic structures I, II, «Annals ofMathematics», 67, 1958, pp. 328-401, 403-466. Kolb, E. W. e Turner, M.S., The Ear(JJ Uni verse, Perseus Publishing, New York 1994. Komar, A.B., Undecidability of macroscopically distinguishable states in quantum field theory, «Physical Review», 133B, 1964, pp. 542-544. Kontsevich, M., Homological algebra of mirror symmetry. «Proceedings ofthe International Congress of Mathematicians», Voli. I, 2. (Ziirich, 1994 ), Birkhaiiser, Base! 1994. Kontsevich, M., «Enumeration of rational curves via toric actions». ln The Moduli Space of Curves (a cura di R. Dijkgraaf, C. Faber e G. van der Geer), «Progress in Mathematics», 129, 1995, pp. 335-368, [hep-th/9405035]. Koruga, D., Hameroff, S., Withers, J., Loutfy, R. e Sundareshan, M., Fullerene C60 : Hist01y, physics, nanobiology, nanotechnology, North-Holland, Amsterdam 1993. Kraus, K., States, effects and operations: fimdamental notions o( quantum the01y, «Lecture Notes in Physics», Voi. 190, Springler-Verlag, Berlin 1983. Krauss, L.M., Quintessence: The Myste,y ofthe Missing Mass, Basic Books, New York 2001. Kreimer, D., Knots and Feynman Diagrams, Cambridge University Press, Cambridge 2000. Kronheimer, E. H. e Penrose, R., On the structure ofcasual spaces, «Proceedings of the Cambridge Philophical Society», 63, 1967, pp. 481-501. Kruskal, M. D, Maximal Extension of Schwarzschild Metric, «Physical Review», ll9, 1960,pp. 1743-1745. Kuchar, K., «Canonica! methods of quantization», in Quantum Gravity 2 (a cura di D.W. Sciama, R. Penrose e C.J. Isham), Oxford University Press, Oxford 1981. Kuchar, K. V., «Time and interpretations of quantum gravity», in Pmceedings ~fthe 4th Canadian Conference on Genera! Relativity and Relativistie Astrophysics (a cura di G. Kunstatter, D. Vincente J. Williams), World Scientific, Singapore 1992. Labastida, J.M.F. e Lozano, C., Lectures in Topologica! Quantum Field Theory, 1998, [hep-th/9709192]. Landsman, N.P, Mathematical Topics Between Classica! and Quantum Mechanics, Springer-Verla:g, Berlin 1998. Lang, S., D(fjèrentiable Manifolds, Addison-Wesley, Reading, MA, 1972. Lange, A.E., et al., First Estimation of Cosmologica! Parameters fiwn BOOMERANG, «Physical Review», D63, 2001, 042001, [astro-ph/0005004]. Laplace, PS., Allgemeine geographische Ephemeriden herausgegeben von F von Zach., ivBd. 1st , 1 Abhandl., Weimar 1799. Laporte, O. e Uhlenbeck, G.E., Application ofspinor analysis to the Maxwell and Dirac equations, «Physical Review», 37, 1931, pp. 1380-1552. Lasenby, J., Lasenby, A.N. e Doran J.L., A unifìed mathematical language fòr physics and engineering in the 21 st centllfJJ, «Philosophical Transactions of the Royal Society ofLondon», A358, pp. 21-39. 1070
Bibliografia
Lawrie, I., A Unified Grand Tour ofTheoretical Physics, Institute of Physics Publishing, Bristol 1998. Lawson H.B. e Michelson, M.L., Spin Geomehy, Princeton University Press, Princeton 1990. Lawvere, W e Schanuel, S., Conceptual Mathematics: Afìrst Introduction to Categories, Cambridge University Press, Cambridge 1997. LeBrun, C.R., Ambi-twistors and Einstein s equations, «Classica! and Quantum Gravity», 2, 1985, pp. 555-563. LeBrun, C.R., «Twistors, ambitwistors, and conforma! gravity», in Twistors in Mathematical Physics (a cura di T.N. Bailey e R.J. Baston), LMS Lecture Note Series 156, Cambridge University Press, Cambridge 1990. Lebrun, C. e Mason, L.J., Zoll manifolds and complex surfaces, «Journal ofDifferential Geometry», 61(3), 2002, pp. 453-535. Lefshetz, J., Introduction to Topology, Princeton University Press, Princeton, New Jersey 1949. Leggett, A.J., Testing the limits of quantum mechanics: motivation, state of play, prospect, «Journal of Physics», CM 14, 2002, R415-451. Levitt, M.H., Spin Dynamics: Basics of Nuclear Magnetic Resonance, John Wiley & Sons, New York 2001. Lichnerowicz, A. (a cura di), Physics on Manifòlds: Proceeding of the International Colloquium in Honour ofYvonne Choquet-Bruhat, Paris, lune 3-5, 1992. Kluwer Academic Publishers, Boston and Dordrecht, The Netherlands 1994. Liddle A.R., An Introduction to Modern Cosmology, John Wiley & Sons, New York 1999. Liddle, A.R. e Lyth, D.H., Cosmologica! lnflation and Large-Scale Structure, Cambridge University Press, Cambridge 2000. Lifshitz, E.M. e Khalatnikov, I.M., Investigations in relativistic cosmology, «Advances in Physics», 12, 1963, pp. 185-249. Linda, A., Comments on Inflationa,y Cosmology, 1993, [astro-ph/9309043]. Linde, A., Injlation with Variable Omega, «Phys. Lett.», B351, 1995, [hepth/9503097]. Littlewood, J.E., Littlewoods miscellany, Cambridge University Press, Cambridge 1949. Ristampato nel 1986. Livio, M., TheAccelerating Universe, John Wiley & Sons, New York 2000 (trad. it. La bellezza impe1fetta del cosmo, UTET, Torino 2003). Llewellyn, Smith, C.H., High energy behaviour and gauge symmetry, «Phys. Lett.», B46(2), 1973, pp. 233-236. [disponibile online]. Lockwood, M., Mind, Brain and the Quantum; the Compoud 'I'. Basi! Blackwell, Oxford 1989. Lounesto, P., Clif.ford Algebras and Spinors, Cambridge University Press, Cambridge 2001. Liiders, G., Ober die Zustandsanderung durch den Messprozess, «Ann. Physik», 8, 1951, pp. 322-328. Ludvigsen, M. e Vickers, J.A.G., A simple proo_f of the positivity of the Bandi mass, «Journal of Physics», A15, 1982, L67-70. Luminet, J.-P et al., Dodecahedral space topology as an explanation far weak wideangle temperature correlations in the cosmic microwave back-ground, «Nature», 425,2003,pp. 593-595. Lyttleton, R.A. e Bondi, H., «Proc. Roy. Soc.» (London), A252, 1959, p. 313. MacDuffee, C.C., The themy ofmatrices, Springer-Verlag, Berlin 1933. (Ristampato da Chelsea). 1071
LA STRADA VERSO LA REALTÀ
MacLane, S., Categoriesfor the FVorking Mathematician, Springer-Verlag, Berlin 1988. MACRO Collaboration, Search jòr massive rare particles with MACRO, «Nuclear Physics Proceedings Supplement», 110, 2002, pp. 186-188, [hep-ex/0009002]. Magueijo, J., Faster Than the Speed o[Light: The Story ofa Scientifìc Speculation, Perseus Publishing, New York 2003 (trad. it. Più veloce della luce: l'avventura di una rivoluzione scientifìca, Rizzoli, Milano 2003). Magueijo, J. e Smolin, L., Lorentz invariance with an invariant energy scale, 2002, [gr-qc/0112090]. Mahler, P-Adic Numbers ami Functions, Cambridge University Press, Cambridge 1981. Majorana, E., Teoria relativistica di particelle con momento intrinsico arbitrario, «Nuovo Cimento», 9, 1932, pp. 335-344. Majorana, E., Teoria asimmetrica de/l'elettrone del positrone, «Nuovo Cimento», 14, 1937,pp. 171-184. Maldacena, J., The Large N Limit of Superconformal Field Theories and Supergravity, 1997, [hep-th/ 9711200]. Manogue, C.A. e Dray T., Dimensionai Reduction, «Modem Physics Letters», A14, 1999, pp. 93-97, [hep-th/9807044]. Manogue, C.A. e Schray, J., Finite Lorentz trans.formations, autommphisms, and division algebras, «Journal ofMathematical Physics», 34, 1993, pp. 3746-3767. Markopoulou, F., Dual fòrmulation o.fspin network evolution, 1997, [gr-qc/970401 ]. Markopoulou, F., The internal description of a casual set: What the universe looks like jì-mn the inside, «Commun. Math. Phys.», 211, 1998, pp. 559-583, [grqc/9811053]. Makopoulou, F. e Smolin, L., Casual evolution ofspin networks, «Nuclear Physics», B508, 1997, pp. 409-430, [gr-qc/9702025]. Marsden, J.E. e Tromba, A.J., véctor Calculus, W. H. Freeman & Co., New York 1966. [Nuova ediz. 2004]. Marshall, W., Simon, C., Penrose, R. e Bouwmeester, D.. Towards Quantum Super1, in Quantum Concepts in Space and Time (a cura di C.J. Isham e R. Penrose), Oxford University Press, Oxford 1985, pp. 84-108. Pearle, P. e Squires, E.J., Gravity, energy conservation and parameter values in collapse models, Durham University preprint, 1995, DTP/95/13. Peitgen, H.-O. e Reichter, P.H., The Beauty of Fractals: Images of Compiex Dynamical System, Springer-Verlag, Berlin & Heidelberg 1986. Peitgen, H.-O. e Saupe, D., The Science of Fractal Jmages, Springer-Verlag, Berlin 1988. Penrose, R., The apparent shape of relativistically moving sphere, «Proceedings of the Cambridge Philosophical Society», 55, 1959, pp. 137-139. Penrose, R., «The Light Cone at Infinity», in Proceedings of the 1962 Conference on Relativistic Theories of Gravitation Warsaw, Polish Academy of Sciences, Warsaw 1962. (Pubblicato nel 1965). Penrose, R., Asymptotic properties offlelds and space-time, «Physical Review Letters», 10, 1963, pp. 66-68. Penrose, R., «Conformai approach to infinity», in Relativity, Groups and Topology: The 1963 Les Houches Lectures (a cura di B.S. DeWitt e C.M. DeWitt), Gordon e Breach, New York 1964. Penrose, R., Zero rest-mass fields including gravitation: asymptotic behaviour, «Proceedings ofthe Royal Society ofLondon», A284, 1965a, pp. 159-203. Penrose, R., Gravitational collapse and space-time singularities, «Physical Review Letters», 14, pp. 57-59. Penrose, R., An analysis of the structure of space-time, saggio del Premio Adams, Cambridge University, Cambridge 1966. Penrose, R., «Structure of space-time», in Battelle Rencontres, 1967 (a cura di C.M. Dewitt e J.A. Wheeler), Lectures in Mathematics and Physics, Benjamin, New York 1968a.
s
1074
Bibliografia
Penrose, R., Twistor quantization and curved space-time, «Int. J. Theor. Phys.», 1, 1968b, pp. 61-69. Penrose, R., Gravitational collapse: the raie ofgenerai relativity, «Rivista del Nuovo Cimento», Numero speciale 1, l 969a, pp. 252-276. Penrose, R., Solutions of the zero rest-mass equations, «Journal of Mathematical Physics», 10, 1969b, pp. 38-39. Penrose, R., «Angular momentum: an approach to combinatorial space-time», in Quantum The01y and Beyond (a cura di T. Bastin), Cambridge University Press, Cambridge 1971 a. Penrose, R., «Applications of negative dimensiona! tensors», in Combinatoria! Mathematics and its Applications (a cura di D.J.A. Welsh), Academic Press, London 1971b. Penrose, R., «Twistor theory: its aims and achievements», in Quantum gravity, on Oxford Symposium (a cura di C. J. lsham, R. Penrose e D. W. Sciama), Oxford University Press, Oxford 1975. Penrose, R., The non-linear graviton, «Genera! Relativity and Gravitation», 7, 1976a, pp. 171-176. Penrose, R., Non-linear gravitons and curved twistor themy, «Genera! Relativity and Gravitation», 7, 1976b, pp. 31-52. Penrose, R., «Gravitational collapse: a Review», inPhysics andAstrophysics ofNeutron Stars and B!ack Holes, LXV Corso, «Società Italiana di Fisica», Bologna, 1978, pp. 566-582. Penrose, R., «Singularities and time-asymmetry», in Generai Relativity: An Einstein Centenary (a cura di S. W. Hawking e W. Israel), Cambridge University Press, Cambridge 1979. Penrose, R., «On Schwarzschild causality-a problem for "Lorentz-covariant" genera! relativity», in Essays in Generai Relativity (A. Taub Festschrift) (a cura di F.J. Tipler), Academic Press, New York 1980, pp. 1-12. Penrose, R., Quasi-loca! mass and angular momentum in generai relativity, «Proceedings ofthe Royal Society ofLondon», A381, 1982, pp. 53-63. Penrose, R., «Gravity and state-vector reduction», in Quantum Concepts in Space and time (a cura di R. Penrose e C. J. Isham) Oxford University Press, Oxford 1986, pp. 129-146. Penrose, R., «Quantum physics and conscious thought», in Quantum Implications: Essays in Honour of David Bohm (a cura di B. J. Hiley e F. D. Peat), Routledge and Kegan Paul, London & New York 1987a. Penrose, R., «On the origins oftwistor theory», in Gravitation and Geometry: avolume in honour of I. Robinson (a cura di W. Rindler e A. Trautman), Bibliopolis, Naples 1987b. Penrose, R., «Newton, quantum theory, and reality», in 300 Years of Gravity (a cura di S. W. Hawking e W. Israel), Cambridge University Press, Cambridge 1987d, pp. 17-49. Penrose, R., Topologica! QFT and Twistors: Holom01phic Linking; Holomorphic Linking: Postscript. «Twistor Newsletter» 27, 1988a, pp. 1-4. Penrose, R., Fundamental asymmeliJ' in physical laws. Proceedings of Symposia in Pure Mathematics, 48, «American Mathematical Society», 1988b, pp. 317-328. Penrose, R., The Emperor s New Mind: Concerning Computers, Minds, and the Laws of Physics, Oxford University, Press, Oxford 1989 (trad. it. La mente nuova del! 'imperatore, Rizzoli, Milano 2000). Penrose, R., «H-space and Twistors», in RecentAdvances in Generai Relativity, Einstein Studies, Voi. 4 (a cura di A.I. Janis e J.R. Porter), Birkhiiuser, Boston 1992, pp. 6-25. 1075
LA STRADA VERSO LA REALTA
Penrose, R., Shadows of the Mind: An Approach to the Missing Science of Consciousness, Oxford University Press, Oxford 1994 (trad. it. Ombre della mente, Rizzoli, Milano 1996). Penrose, R., On gravity s role in quantum state reduction, «Generai Relativity and Gravitation», 28, 1996, pp. 581-600. Penrose, R., The Large, the Small and the Human Mind, Cambridge University Press, Cambridge 1997a (trad. it. Il grande, il piccolo e la mente umana, Cortina, Milano 2000). Penrose, R., On understanding understanding, «International Studies in the Philosophy ofScience», 11, 1997b, pp. 7-20. Penrose, R., Quantum computation, entanglement and state-reduction, «Philosophical Transactions ofthe Royal Society ofLondon», A356, 1998a, pp. 1927-1939. Penrose, R., «The question of cosmic censorship», in Black Holes and Relativistic Stars (a cura di R. M. Wald), University of Chicago Press, Chicago, Illinois, 1998b. Ristampato in «Journal of Astrophysics and Astronomy», 20, pp. 233-248 (1999). Penrose, R., «Wavefunction collapse as a real gravitational effect», in Mathematical Physics 2000 (a cura di A. Fokas, T.W.B. Kibble, A. Grigouriou e B. Zegarlinski), Imperia! College Press, London 2000, pp. 266-282. Penrose, R., Towards a twistor description ofgeneral space-time; introductory comments, in Further Advances in Twistor Theory, Voi. III: Curved Twistor spaces (a cura di L.J. Mason, L.P Hughston, P.Z. Kobak e K. Pulverer), Chapman & Hall/CRC Research Notes in Mathematics, 424, London 2001, pp. 239-255. Penrose, R., «John Beli, State Reduction, and Quanglement», in Quantum (Un) speakables: From Beli to Quantum Jnformation (a cura di R.A. Bertlmann e A. Zeilinger), Sprinter-Verlag, Berlin 2002. Penrose, R. e MacCallum, M.A.H., Twistor Theory: an approach to the quantization offields and space-time, «Physics Reports», 6C, 1972, pp. 241-315. Penrose, R., On the instability of extra space dimensions. The Future ofTheoretical Physics and Cosmology, Celebrating Stephen Hawldng s 60t1, Birthday (a cura di G.W. Gibbons, E.PS. Shellard, S.J. Rankin), Cambridge University Press, Cambridge 2003. Penrose, R. e Rindler, W., Spinors and Space-Time, Voi. I: Two-Spinor Calculus and Relativistic Fields, Cambridge, University, Press, Cambridge I 984. Penrose, R. e Rindler, W. Spinors and Space-Time, Voi. II: Spinar and Twistor Methods in Space-Time Geometry, Cambridge University Press, Cambridge 1986. Penrose, R., Robinson, I. e Tafel J., Andrzej Mariusz Trautman, «Classica] and Quantum Gravity», 14, Al-A8, 1997. Penrose, R., Sparling, G.A.J. e Tsou, S.T., Extended Regge Trajectories, «Journal of Physics A. Mathematical and Generai», 11, L23 l-L325, 1978. Penzias, A.A. e Wilson R.W., A Measurement of Excess Antenna Temperature at 4080 Mc/s,