123 48 20MB
italian Pages 408 Year 2017
Gli Autori
Richard Feynman Richard P. Feynman è nato nel 1918 a New York e ha conseguito il dottorato nel 1942 alla Princeton University. Malgrado la giovane età ha svolto un ruolo chiave nel Progetto Manhattan, condotto a Los Alamos durante la Seconda guerra mondiale. In seguito Feynman ha insegnato alla Cornell University e al California Institute of Technology. Nel 1965 ha ricevuto il Nobel per la fisica, insieme a Julian Schwinger e Sin-Itiro Tomonaga, per le sue ricerche sull’elettrodinamica quantistica, più di preciso per aver risolto alcune inconsistenze della teoria. Ha inoltre formulato una teoria matematica per spiegare il fenomeno della superfluidità nell’elio liquido. Tempo dopo ha svolto con Murray Gell-Mann ricerche fondamentali sulle interazioni deboli, per esempio sul decadimento beta. Nell’ultima parte della sua vita Feynman ha contribuito in maniera essenziale allo sviluppo della teoria dei quark, elaborando il modello a partoni per descrivere le collisioni di protoni ad alta energia. Oltre a questi risultati teorici, Feynman ha introdotto in fisica nuove tecniche per calcoli fondamentali e notazioni innovative; una fra tutte, i diagrammi di Feynman, che sono diventati imprescindibili e che, forse più di qualsiasi altro formalismo nella storia recente della scienza, hanno influenzato in profondità la concezione e il calcolo di processi fisici fondamentali. Feynman aveva grandi doti didattiche. Fra i suoi molti riconoscimenti, era particolarmente orgoglioso della Medaglia Ørsted per l’insegnamento della fisica, assegnatagli nel 1972. La Fisica di Feynman, pubblicata originariamente nel 1963, è stata descritta su Scientific American come «tosta, ma nutriente e ricca di sapore. Venticinque anni dopo, è ormai il manuale di riferimento tanto per gli insegnanti quanto per i migliori studenti dei primi anni». Per diffondere la comprensione della fisica nel grande pubblico, Feynman ha scritto La legge fisica e QED: la strana teoria della luce e della materia. Ha al suo attivo anche diversi testi avanzati divenuti dei classici, e manuali per studenti e ricercatori. Richard Feynman è stato anche un’attiva figura pubblica. Com’è ben noto, ha fatto parte della commissione che ha indagato sul disastro del Challenger, svolgendo la famo-
sa dimostrazione della fragilità delle guarnizioni O-ring a basse temperature: un esperimento elegante per cui sono bastati un morsetto e un bicchiere d’acqua ghiacciata. È forse meno nota la sua partecipazione, negli anni Sessanta, al California State Curriculum Committee. Incaricato di selezionare i libri di testo per le scuole dello stato, Feynman criticò aspramente il basso livello di quei manuali. Nessun elenco delle innumerevoli imprese di Feynman in campo scientifico e didattico potrebbe restituire per intero la sua figura. Come ben sanno i suoi lettori, la personalità vivace e sfaccettata di Feynman risalta in tutte le sue opere, anche nei testi più tecnici. Oltre a svolgere ricerca in fisica, in vari momenti della sua vita Feynman ha riparato radio, scassinato serrature, creato opere d’arte, danzato, suonato i bongos e perfino decifrato geroglifici Maya. Era un esempio perfetto di atteggiamento empirico e sempre curioso verso il mondo circostante. Richard Feynman è morto a Los Angeles il 15 febbraio 1988.
Robert Leighton Robert B. Leighton è nato a Detroit nel 1919. Nel corso della sua vita ha svolto ricerche pioneristiche in vari campi della fisica: stato solido, raggi cosmici, fisica solare, fotografia planetaria, astronomia infrarossa, millimetrica e submillimetrica; ha inoltre contribuito alla nascita della moderna fisica delle particelle. Famoso per i suoi innovativi progetti di strumenti scientifici, era anche un insegnante apprezzatissimo: ancor prima di partecipare alla stesura de La Fisica di Feynman, ha scritto il manuale di grande successo Principles of Modern Physics. Nei primi anni Cinquanta Leighton ha dato un notevole contributo a dimostrare che il muone decade in un elettrone e due neutrini, e ha realizzato la prima misura dello spettro energetico dell’elettrone risultante. Dopo la scoperta delle particelle strane, Leighton ne ha osservato per primo il decadimento, spiegandone varie proprietà. Pochi anni dopo Leighton ha inventato gli spettroeliografi a effetto Doppler e a effetto Zeeman. Grazie allo spettroeliografo a effetto Zeeman, insieme ai suoi studenti ha creato una mappa ad altissima risoluzione del campo
VI
Gli Autori
magnetico solare, giungendo a scoperte sorprendenti: la «super granulazione», e oscillazioni dell’ordine di cinque minuti nelle velocità superficiali locali del Sole; è così nato il nuovo campo della sismologia solare. Leighton ha poi progettato e costruito strumenti con cui realizzare immagini più nitide dei pianeti, e ha inaugurato un altro campo di ricerca: l’ottica adattiva. Le immagini dei pianeti a opera di Leighton sono state considerate le migliori fino agli anni Sessanta, quando è iniziata l’era dell’esplorazione spaziale con le sonde. All’inizio degli anni Sessanta Leighton ha creato un nuovo ed economico telescopio a infrarossi e ha realizzato la prima mappa del cielo a 2,2 µm, individuando così nella nostra galassia un numero sorprendentemente alto di oggetti indistinguibili a occhio nudo perché troppo freddi. A metà degli anni Sessanta ha diretto gli studi sulle immagini nelle missioni Mariner 4, 6 e 7 che il Jet Propulsion Laboratory ha inviato verso Marte. Nello stesso laboratorio, Leighton ha dato un contributo decisivo alla creazione del primo sistema di televisione digitale nello spazio profondo, e ha partecipato alle prime ricerche sull’elaborazione e il miglioramento delle immagini. Negli anni Settanta Leighton è passato a occuparsi dello sviluppo di antenne grandi ed economiche utilizzabili per l’interferometria millimetrica e l’astronomia submillimetrica. Una volta di più le sue spiccate doti sperimentali hanno aperto un nuovo campo di ricerca, tuttora attivamente studiato con vari telescopi, come l’Owens Valley Radio Observatory in California e l’Atacama Large Millimeter/submillimeter Array (ALMA) in Cile. Robert Leighton è morto il 9 marzo 1997 a Pasadena, in California.
Matthew Sands Matthew Sands è nato nel 1919 a Oxford, nel Massachusetts; ha conseguito il Bachelor of Arts alla Clark University nel 1940 e il Master of Arts alla Rice University nel 1941. Durante la Seconda guerra mondiale ha partecipato al Progetto Manhattan, a Los Alamos, occupandosi di elet-
© 978-8808-22107-0
tronica e strumentazione. Dopo la guerra ha contribuito a fondare la Los Alamos Federation of Atomic Scientists, che si opponeva a usi ulteriori delle armi nucleari. Nello stesso periodo ha conseguito il dottorato al MIT, studiando i raggi cosmici sotto la direzione di Bruno Rossi. Nel 1950 il Caltech ha assunto Sands perché partecipasse alla costruzione di un elettrosincrotrone da 1,5 GeV e ne seguisse il funzionamento. Sands è stato il primo a dimostrare, sul piano teorico e sperimentale, l’importanza degli effetti quantistici negli acceleratori di elettroni. Dal 1960 al 1966 Sands ha fatto parte della Commission on College Physics e ha supervisionato le riforme nel corso di laurea in fisica del Caltech sfociate nella creazione de La Fisica di Feynman. Nello stesso periodo è stato consulente sulle armi nucleari e il disarmo per il President’s Science Advisory Committee, la Arms Control and Disarmament Agency e il Department of Defense. Nel 1963 Sands è diventato vicedirettore per la costruzione e la gestione dello Stanford Linear Accelerator, al laboratorio SLAC, dove si è anche occupato del collisionatore da 3 GeV, Stanford Positron Electron Asymmetric Rings (SPEAR). Dal 1969 al 1985 Sands è stato professore di fisica alla University of California a Santa Cruz, di cui è anche stato Vice Chancellor for Science dal 1969 al 1972. Nel 1972 l’American Association of Physics Teachers gli ha conferito il Distinguished Service Award. Ha continuato a occuparsi di ricerca con gli acceleratori di particelle anche da professore emerito, fino al 1994. Nel 1998 la American Physical Society ha conferito a Sands il Robert R. Wilson Prize «per i suoi vari contributi alla fisica degli acceleratori e allo sviluppo di collisionatori a protoni e a elettronipositroni». Negli anni della pensione Sands ha seguito insegnanti di scienze delle scuole primarie e secondarie di Santa Cruz, aiutandoli a creare attività didattiche in laboratorio e al computer. Ha inoltre curato la pubblicazione dei Consigli per risolvere i problemi di fisica, cui ha partecipato nell’Edizione completa de La Fisica di Feynman. Matthew Sands è morto il 13 settembre 2014 a Santa Cruz, in California.
Prefazione a La Fisica di Feynman - Edizione Millennium
È passato quasi mezzo secolo da quando Feynman ha tenuto al Caltech il corso di fisica generale da cui sono stati tratti i tre volumi de La Fisica di Feynman. In questi cinque decenni la nostra concezione del mondo fisico ha fatto enormi progressi, ma La Fisica di Feynman non ha perso di attualità. Grazie agli straordinari metodi didattici e all’intuito fisico di Feynman, le sue lezioni non hanno perso il loro smalto dall’epoca della prima edizione. Principianti ed esperti di fisica le studiano in tutto il mondo; se ne contano almeno una decina di traduzioni, e nella sola lingua inglese ne sono state stampate oltre un milione e mezzo di copie. È forse l’unico testo di fisica ad aver avuto una risonanza tanto vasta e duratura. Con l’Edizione Millennium, La Fisica di Feynman entra nell’era dell’editoria elettronica. Grazie alle nuove tecnologie, il testo e le equazioni sono stati espressi in LaTeX, linguaggio elettronico di composizione tipografica, e tutte le figure sono state ricreate con moderni programmi di grafica. La versione a stampa di questa edizione non ne esce stravolta: è quasi identica agli originali volumi rossi ben noti agli studenti di fisica e apprezzati da decenni. Le differenze principali risiedono nell’ampliamento e miglioramento dell’indice analitico, nella correzione di 885 errori scovati dai lettori nei cinque anni seguenti alla prima ristampa dell’edizione precedente, e nella facilità con cui si potranno apportare correzioni eventualmente segnalate dai lettori futuri. Ne riparlerò più avanti.
Ricordi delle lezioni di Feynman I tre volumi de La Fisica di Feynman sono un vero e proprio trattato di didattica. Sono anche una documentazione storica delle lezioni di fisica generale tenute da Feynman nel 1961-1964, obbligatorie per gli studenti dei primi due anni di tutte le facoltà scientifiche del Caltech. Mi sono sempre chiesto, e forse anche i lettori, che effetto abbiano avuto le lezioni di Feynman sugli studenti che le hanno frequentate. Nella sua Introduzio-
ne a questi volumi, Feynman era piuttosto pessimista: «non credo che il mio corso abbia avuto molto successo con gli studenti». Matthew Sands, nella sua rievocazione in Consigli per risolvere i problemi di fisica, esprime un parere assai più positivo. Per curiosità, nella primavera del 2005 ho contattato a voce o per e-mail un insieme quasi casuale di diciassette studenti che hanno seguito il corso di Feynman negli anni 1961-63 (tra i circa centocinquanta originari), includendone alcuni che l’avevano trovato molto difficile, e altri che l’avevano assimilato senza problemi; studenti di biologia, chimica, ingegneria, geologia, matematica e astronomia, oltre che di fisica. I ricordi sono forse diventati più rosei col passare degli anni, ma per circa l’80% degli studenti le lezioni di Feynman sono state il clou degli anni universitari. «Era come andare a messa». «Ne uscivi cambiato», era «un’esperienza unica, forse la cosa più importante che mi ha dato il Caltech». «Studiavo biologia, ma le lezioni di Feynman svettavano su tutti gli altri corsi [...] anche se devo ammettere che all’epoca non riuscivo a risolvere gli esercizi e non li consegnavo quasi mai». «Ero tra gli studenti meno promettenti del corso, ma non ho mai fatto un’assenza. [...] Ricordo bene l’entusiasmo della scoperta trasmesso da Feynman e posso riviverlo ancora oggi. [...] Nelle sue lezioni c’era un [...] coinvolgimento emotivo che probabilmente è andato perso nella versione stampata». Al contrario, molti studenti hanno ricordi negativi, soprattutto per due ragioni: (1) «Le lezioni non insegnavano a risolvere i problemi. Feynman era troppo abile. Conosceva diversi trucchi e le approssimazioni utilizzabili, rispetto ai principianti poteva avvantaggiarsi di un intuito basato sulla sua esperienza e genialità». Consci di questa lacuna del corso, Feynman e colleghi vi hanno parzialmente rimediato con il materiale incluso nei Consigli per risolvere i problemi di fisica: tre lezioni di Feynman sulla risoluzione di problemi e un insieme di esercizi completi di soluzione compilato da Robert B. Leighton e Rochus Vogt. (2) «C’erano aspetti molto frustranti: l’incertezza sul probabile argomento della lezione seguente, la mancanza di un libro di testo o di una bibliografia in qual-
VIII
Prefazione a La Fisica di Feynman - Edizione Millennium
che modo collegata a quanto visto a lezione, e quindi l’impossibilità di leggere qualcosa in anticipo. [...] In aula trovavo le lezioni interessanti e comprensibili, ma diventavano sanscrito una volta fuori [quando cercavo di ricostruirne i dettagli]». Questo problema, naturalmente, è stato risolto grazie ai tre volumi della versione stampata de La Fisica di Feynman. Sono poi diventati il libro di testo degli studenti del Caltech per molti anni e a oggi rimangono una delle maggiori eredità di Feynman.
Storia delle correzioni La Fisica di Feynman è stata prodotta molto rapidamente da Feynman e dai suoi coautori, Robert B. Leighton e Matthew Sands, che hanno sfruttato e poi ampliato le registrazioni audio e le foto della lavagna realizzate durante le lezioni di Feynman(1). Data la velocità a cui hanno lavorato Feynman, Leighton e Sands, era inevitabile che nella prima edizione fossero sfuggiti molti errori. Negli anni seguenti Feynman aveva accumulato lunghe liste di presunti errori, scovati dagli studenti e dai professori del Caltech e dai lettori di tutto il mondo. Negli anni Sessanta e nei primi anni Settanta Feynman ha sottratto del tempo alle sue molteplici attività per controllare gran parte degli errori presunti nei volumi I e II e correggerli nelle edizioni seguenti. Ma poiché il suo senso del dovere ha avuto la peggio rispetto all’eccitazione di fare nuove scoperte, Feynman non è mai arrivato a rivedere gli errori del volume III(2). Dopo la sua morte prematura, nel 1988, alcune liste di errori in tutti e tre i volumi sono state depositate negli archivi del Caltech e completamente dimenticate. Nel 2002, Ralph Leighton (figlio di Robert Leighton, ormai deceduto, e grande amico di Feynman) mi ha informato dell’esistenza dei vecchi errori e di una nuova lunga lista stilata dal suo amico Michael Gottlieb. Leighton ha proposto che il Caltech pubblicasse una nuova edizione de La Fisica di Feynman, correggendo tutti gli errori e accompagnandola a un nuovo volume di materiale supplementare, Consigli per risolvere i problemi di fisica, che stava preparando insieme a Gottlieb. (1)
Per una descrizione della genesi delle lezioni di Feynman e de La Fisica di Feynman, si vedano la prefazione di Feynman e le introduzioni a ciascun volume, la rievocazione di Matthew Sands nei Consigli per risolvere i problemi di fisica, e anche la prefazione speciale all’Edizione commemorativa de La Fisica di Feynman, scritta nel 1989 da David Goodstein e Gerry Neugebauer e inclusa anche nell’Edizione completa del 2005.
(2)
Nel 1975 ha iniziato a rivedere gli errori del terzo volume, ma preso da altri impegni ha lasciato la cosa a metà, senza apportare correzioni.
© 978-8808-22107-0
Feynman era il mio eroe e uno dei miei amici più cari. Quando ho visto la lista di errori e l’indice del nuovo volume proposto, ho subito accettato di dirigere il progetto per conto del Caltech (la patria accademica di Feynman per tanti anni, cui aveva ceduto tutti i diritti e gli obblighi per La Fisica di Feynman, congiuntamente a Leighton e Sands). Dopo un anno e mezzo di lavoro meticoloso da parte di Gottlieb, e una revisione minuziosa di Michael Hartl (un brillante ricercatore post-dottorato del Caltech che ha ricontrollato tutti gli errori e il nuovo volume), nel 2005 è uscita l’Edizione completa de La Fisica di Feynman, dove erano stati corretti circa 200 errori, accompagnata dai Consigli per risolvere i problemi di fisica di Feynman, Gottlieb e Leighton. Credevo proprio che quell’edizione sarebbe stata definitiva. Ma non avevo previsto la reazione entusiasta dei lettori di tutto il mondo all’appello di Gottlieb a scovare altri errori e segnalarli al sito che Gottlieb ha creato e continua a curare, The Feynman Lectures Website, www.feynmanlectures.info. Nei cinque anni successivi, sono stati segnalati 965 nuovi errori che sono sopravvissuti alla verifica scrupolosa di Gottlieb, Hartl e Nate Bode (un brillante studente di dottorato del Caltech, che ha preso il posto di Hartl nella verifica degli errori per conto del Caltech). Di questi 965 errori assodati, 80 sono stati corretti nella quarta ristampa della versione originale dell’Edizione completa (agosto 2006) e i restanti 885 sono stati corretti nella prima ristampa della nuova Edizione Millennium (332 nel volume I, 263 nel volume II e 200 nel volume III). Per maggiori informazioni sugli errori, si veda www.feynmanlectures.info. La ripulitura de La Fisica di Feynman dagli errori è chiaramente diventata un’impresa globale, seguita da una vasta comunità di appassionati. A nome del Caltech vorrei ringraziare i cinquanta lettori che hanno dato il proprio contributo dal 2005 a oggi, e i molti altri che lo faranno in futuro. Tutti i nomi sono elencati al seguente indirizzo: www.feynmanlectures.info/flp_errata.html. La stragrande maggioranza degli errori rientra in tre categorie: (1) refusi nel testo; (2) refusi ed errori matematici nelle equazioni, tabelle e figure – errori di segno o cifre sbagliate (per esempio un 5 al posto di un 4), elementi mancanti come pedici, segni di sommatoria, parentesi e termini nelle equazioni; (3) riferimenti sbagliati a capitoli, tabelle e figure. Errori di questo genere, benché non particolarmente gravi per i fisici esperti, possono frustrare e confondere i lettori principali cui Feynman aveva destinato il libro: gli studenti. È notevole che, tra tutti e 1165 gli errori corretti sotto la mia supervisione, quelli che considererei veri e propri errori di fisica siano soltanto una manciata. Un esempio si trova nel paragrafo 5.10 del volume II, dove ora è scritto «[...] distribuzioni statiche di cariche all’interno di un conduttore chiuso messo a terra non possono pro-
© 978-8808-22107-0
Prefazione a La Fisica di Feynman, Edizione Millennium
durre alcun campo [elettrico] all’esterno» (nelle edizioni precedenti mancava la precisazione «messo a terra»). Feynman ha ricevuto la segnalazione di questo errore da vari lettori, fra cui Beulah Elizabeth Cox, studentessa all’università The College of William and Mary, che in un esame aveva fatto affidamento sulla frase sbagliata di Feynman. Nel 1975 Feynman ha scritto a Cox(3): «il suo professore ha ragione a non darle punti, perché la sua risposta è sbagliata – come le ha dimostrato con il teorema di Gauss. Nella scienza bisogna credere alla logica e al ragionamento, non all’autorità. Lei ha quindi letto e inteso il libro correttamente. Io ho commesso un errore; in altre parole, il libro è sbagliato. Probabilmente stavo pensando al caso di una sfera conduttrice messa a terra, o forse al fatto che spostare le cariche in posizioni differenti all’interno di un conduttore non ha alcun effetto su ciò che accade all’esterno. Non so bene come mai, ma ho preso una cantonata; e l’ha presa anche lei, perché mi ha creduto».
Genesi della nuova Edizione Millennium Tra il novembre del 2005 e il luglio del 2006, il sito The Feynman Lectures Website (www.feynmanlectures.info) ha ricevuto 340 segnalazioni di errori. La cosa notevole è che in gran parte provenivano da una persona sola: Rudolf Pfeiffer, all’epoca ricercatore post-dottorato in fisica all’università di Vienna. L’editore, Addison Wesley, ha corretto 80 errori ma esitava a procedere per via dei costi: i libri erano stampati in fotolitografia, a partire da immagini fotografiche delle pagine risalenti agli anni Sessanta. Per correggere un errore occorreva rifare la composizione tipografica dell’intera pagina; per evitare l’introduzione di errori nuovi, la pagina veniva ricomposta due volte da persone diverse, poi confrontata e rivista da altri: un sistema davvero costoso, se gli errori da correggere sono centinaia. Gottlieb, Pfeiffer e Ralph Leighton, frustrati dalla situazione, hanno ideato un progetto per facilitare la correzione di tutti gli errori, mirato anche alla produzione di versioni elettroniche de La Fisica di Feynman. Nel 2007 hanno sottoposto la loro idea a me, in quanto rappresentante del Caltech. Ero entusiasta, ma esitante. Dopo aver visto ulteriori dettagli, tra cui un capitolo di prova della versione elettronica, ho consigliato al Caltech di coadiuvare Gottlieb, Pfeiffer e Leighton nella realizzazione pratica della loro idea. Il progetto è stato approvato da tre successivi direttori della Division of Physics, Mathematics and Astro(3)
Deviazioni perfettamente ragionevoli dalle vie battute: le lettere di Richard Feynman, a cura di Michelle Feynman, traduzione di Franco Ligabue (Adelphi, Milano, 2006), p. 244.
IX
nomy del Caltech – Tom Tombrello, Andrew Lange e Tom Soifer – e i complessi dettagli legali e contrattuali sono stati chiariti dal consigliere del Caltech per la proprietà intellettuale, Adam Cochran. Con la pubblicazione di questa nuova Edizione Millennium, il progetto è stato realizzato con successo, malgrado la sua complessità. Più di preciso: Pfeiffer e Gottlieb hanno convertito in LaTeX tutti e tre i volumi de La Fisica di Feynman. Le figure sono state ridisegnate in moderna forma elettronica in India, sotto la guida del traduttore tedesco de La Fisica di Feynman, Henning Heinze, a beneficio dell’edizione tedesca. Gottlieb e Pfeiffer hanno concesso l’uso non esclusivo delle loro equazioni in LaTeX nella versione tedesca (pubblicata da Oldenbourg) in cambio dell’uso non esclusivo delle figure di Heinze nella versione inglese dell’Edizione Millennium. Pfeiffer e Gottlieb hanno controllato scrupolosamente tutto il testo e le equazioni in LaTeX e tutte le figure ridisegnate, apportando le correzioni necessarie. Per conto del Caltech, io e Nate Bode abbiamo fatto controlli a campione sul testo, le equazioni e le figure; siamo stati piacevolmente sorpresi di non trovare alcun errore. Pfeiffer e Gottlieb sono stati di una precisione e accuratezza incredibili. Pfeiffer e Gottlieb hanno incaricato John Sullivan della Huntington Library di digitalizzare le foto della lavagna delle lezioni di Feynman del 1962-64, e la George Blood Audio di digitalizzare le registrazioni delle letture – con l’incoraggiamento e il sostegno finanziario di Carver Mead, professore del Caltech, l’assistenza logistica di Shelley Erwin, archivista del Caltech, e l’assistenza legale di Cochran. Le questioni legali non erano di poco conto: il Caltech aveva autorizzato Addison Wesley a pubblicare l’edizione stampata negli anni Sessanta, la versione audio delle lezioni di Feynman e una variante di un’edizione elettronica negli anni Novanta. All’inizio del nuovo millennio, tramite una serie di acquisizioni, i diritti per la stampa erano stati trasferiti al gruppo editoriale Pearson, mentre quelli per le versioni audio ed elettronica erano stati trasferiti al gruppo editoriale Perseus. Cochran, con l’aiuto di Ike Williams, un legale specializzato nell’editoria, è riuscito a riunificare tutti questi diritti sotto l’egida di Perseus / Basic Books, rendendo possibile la nuova Edizione Millennium.
Ringraziamenti Desidero ringraziare a nome del Caltech le persone che hanno reso possibile l’Edizione Millennium. In particolare quelle che, come già accennato, hanno svolto un ruolo essenziale: Ralph Leighton, Michael Gottlieb, Tom Tombrello, Michael Hartl, Rudolf Pfeiffer, Henning Heinze, Adam Cochran, Carver Mead, Nate Bode,
X
Prefazione a La Fisica di Feynman - Edizione Millennium
Shelley Erwin, Andrew Lange, Tom Soifer, Ike Williams e i cinquanta lettori che hanno inviato correzioni (elencati su www.feynmanlectures.info). Ringrazio anche Michelle Feynman (figlia di Richard Feynman) per i consigli e l’instancabile sostegno, Alan Rice del Caltech per i consigli e l’aiuto dietro le quinte, Stephan Puchegger e Calvin Jackson per aver consigliato e assistito Pfeiffer nella conversione de La Fisica di Feynman in LaTeX, Michael Figl, Manfred Smolik e Andreas Stangl per di-
© 978-8808-22107-0
scussioni sulla correzione degli errori; infine, Perseus/ Basic Books e (per le edizioni precedenti) Addison Wesley. KIP S. THORNE Feynman Professor of Theoretical Physics, Emeritus California Institute of Technology
Ottobre 2010
Le risorse multimediali All’indirizzo online.universita.zanichelli.it / feynman sono disponibili i link per consultare il testo originale in lingua inglese messo a disposizione dal California Institute of Technology. Inoltre, chi acquista il libro può scaricare gratuitamente l’ebook, seguendo le istruzioni presenti nel sito sopra
indicato. L’ebook si legge con l’applicazione Booktab, che si scarica gratis da AppStore (sistemi operativi Apple) o da Google Play (sistemi operativi Android). Per accedere alle risorse protette è necessario registrarsi su myzanichelli.it inserendo la chiave di attivazione personale contenuta nel libro.
Prefazione alla prima edizione italiana
Il corso di lezioni di Feynman riscosse fin dal suo apparire numerosi giudizi positivi. Colpiva, nel libro, la freschezza del linguaggio, un linguaggio più «parlato» che «scritto», l’originalità dell’esposizione, ma soprattutto l’acume critico e la profondità con cui i diversi argomenti venivano presentati. Dal punto di vista didattico si trattava in molti casi di un modo nuovo e moderno di insegnare la fisica. Raramente, di fronte ad argomenti complessi, Feynman scende al compromesso di semplificare la materia, ma in generale, affronta le difficoltà, anche se con rara abilità riesce a farle sembrare più facili. Per il lettore privo di una buona conoscenza della lingua inglese, le difficoltà del linguaggio si aggiungono alle difficoltà di comprensione dei concetti esposti. Per questo
crediamo di aver fatto opera gradita ai lettori italiani accettando il non facile compito di traduzione. Il libro esce nell’edizione italiana in una versione bilingue, con testo originale a fronte (*). La traduzione è quindi necessariamente letterale, oltre il limite di eleganza e di scorrevolezza che una traduzione più libera avrebbe permesso. In questo modo crediamo di aver rispettato totalmente lo spirito con cui è stato scritto il libro, libro che riteniamo particolarmente utile per ampliare la preparazione di fisica generale, per il colloquio di cultura generale e per la preparazione di esami di concorso. E. CLEMENTEL, S. FOCARDI, L. MONARI Bologna, maggio 1968
Bibliografia italiana e siti web Freeman Dyson, Turbare l’universo, Bollati Boringhieri, Torino, 2010: è la bellissima autobiografia di questo geniale fisico-matematico inglese. In un capitolo di questo libro, magistrale dal punto di vista narrativo, viene raccontato come Feynman elaborò la teoria dei diagrammi, per la quale vinse il premio Nobel, attraverso la sua descrizione di uomo e di scienziato. Lawrence M. Krauss, L’uomo dei quanti. La vita e la scienza di Richard Feynman, Codice Edizioni, Torino, 2011: il ritratto originale ed emozionante dell’uomo che è diventato una vera e propria leggenda per un’intera generazione di scienziati. Volumi di Richard Feynman disponibili in edizione italiana
La legge fisica, Bollati Boringhieri, Torino, 1993: raccolta di conferenze su cosa è la fisica e come funziona. D.L. Goodstein, J.R. Goodstein, Il moto dei pianeti intorno al sole, Zanichelli, Bologna, 1997: raccolta delle lezioni in cui Feynman analizza le leggi del moto dei pianeti seguendo le orme di Newton e utilizzando solo strumenti geometrici semplici (fuori catalogo).
James Gleick, Genio, la vita e la scienza di Richard Feynman, Garzanti, Milano, 1994 e 1998: la più completa biografia finora pubblicata. Presenta una minuziosa ricerca delle fonti e un’accurata ricostruzione dell’ambiente in cui Feynman si trovò a vivere e a operare (fuori catalogo). Sei pezzi facili, Adelphi, Milano, 2000: raccolta di alcune introduzioni tratte dai primi capitoli de La Fisica di Feynman.
Il piacere di scoprire, Adelphi, Milano, 2002: una raccolta di saggi vari, tra i quali la relazione con cui Feynman dimostrò che il disastro dello Space Shuttle Challenger, nel 1986, fu causato da una semplice guarnizione di gomma. Sei pezzi meno facili, Adelphi, Milano, 2004: raccolta di altre introduzioni su argomenti di fisica quantistica. Deviazioni perfettamente ragionevoli dalle vie battute, Adelphi, Milano, 2006: una raccolta di lettere rese disponibili dalla figlia Michelle, con i destinatari più disparati: eminenti scienziati, ma anche ammiratori, studenti, gente comune. Lettere che confermano la leggendaria versatilità di Feynman e la sua anticonformistica vocazione dialettica. (*)
Per questa edizione, come indicato a pag. X, il testo inglese è disponibile tra le risorse multimediali.
XII
Prefazione alla prima edizione italiana
«Sta scherzando Mr. Feynman!» Vita e avventure di uno scienziato curioso, Zanichelli, Bologna, 2007: racconto di una vita piena di eventi incredibili, resi possibili da un impasto unico di acuta intelligenza, curiosità irrefrenabile, costante scetticismo e radicato umorismo. «Che t’importa di ciò che dice la gente?» Altre avventure di uno scienziato curioso, Zanichelli, Bologna, 2007: il testamento spirituale di Feynman, redatto, nel suo ultimo anno di vita, assieme all’amico Ralph Leighton. Il senso delle cose, Adelphi, Milano, 2010: raccolta di tre conferenze sulla natura della scienza, sui rapporti tra la scienza, la religione e la politica, e sull’impatto della scienza nella società. QED, la strana teoria della luce e della materia, Adelphi, Milano, 2010: raccolta di lezioni in cui, senza far uso della matematica, spiega la teoria quantistica dei campi. Un vero coup de theatre. Le battute memorabili di Feynman, Adelphi, Milano, 2017: idee, intuizioni, battute, riflessioni raccolte dalla figlia Michelle tra carte personali, registrazioni di conferenze, lezioni e interviste del padre, a testimonianza di un’insaziabile curiosità e di una intelligenza analitica giocosa e spietata.
© 978-8808-22107-0
R.B. Leighton, M.L. Sands, La Fisica di Feynman, edizione completa, Zanichelli, Bologna, 2007. La raccolta delle Feynman Lectures on Physics, il cosiddetto Libro Rosso della fisica, già edita in Italia da Masson. Incredibile a dirsi, esiste in commercio anche la registrazione su CD del sonoro originale delle lezioni per poterle ascoltare dalla voce di Feynman. Per i più volenterosi segnaliamo: R. Feynman, A. Hibbs, Quantum Mechanics and Path Integrals, Mc Graw-Hill, New York, 1965: uno dei testi cardine della letteratura scientifica, solo per addetti ai lavori. www.caltech.edu È il sito del California Institute of Technology, l’università dove Feynman ha insegnato per decenni; la sua cattedra è attualmente ricoperta da Kip Thorne. Questo sito è ricchissimo di materiale su Feynman, e comprende anche una ricca sezione fotografica e le sue pubblicazioni scientifiche. www.feynman.com e www.richard-feynman.net Sono i
siti (quasi) ufficiali su Feynman creati da appassionati cultori del personaggio. Rappresentano la partenza ideale per ulteriori ricerche su Feynman, grazie anche al web ring a lui dedicato.
Introduzione di Feynman
Queste sono le lezioni di fisica che ho tenuto negli ultimi due anni agli studenti del secondo corso e alle matricole del Caltech (California Institute of Technology). Le lezioni naturalmente non sono ripetute parola per parola – sono state pubblicate, talvolta ampliando talvolta riassumendo l’argomento. Le lezioni formano soltanto una parte del corso completo. L’intero gruppo di 180 studenti si riuniva in una grande aula due volte la settimana per ascoltare queste lezioni, e poi si divideva in piccoli gruppi di 15 o 20 studenti nelle sezioni per le ripetizioni sotto la guida di un assistente. In più vi era una sessione di laboratorio una volta alla settimana. Lo scopo particolare che cercavamo di raggiungere con queste lezioni era di conservare l’interesse degli studenti più entusiasti e più svegli provenienti dalle scuole superiori e ammessi al Caltech. Essi hanno appreso quanto sia interessante ed eccitante la fisica – la teoria della relatività, la meccanica quantistica e altre idee moderne. Al termine dei due anni dei nostri precedenti corsi parecchi studenti si sentivano scoraggiati perché venivano loro presentate ben poche idee affascinanti. Essi dovevano studiare piani inclinati, elettrostatica e così via, e dopo due anni questo era proprio avvilente. Il problema era se si potesse o no fare un corso che salvasse lo studente più bravo e più interessato mantenendo il suo entusiasmo. Le presenti lezioni non intendono essere in alcun modo una rassegna, ma sono molto serie. Pensai di indirizzarle al migliore della classe e di fare in modo, se possibile, che persino lo studente più intelligente fosse incapace di comprendere completamente tutto il contenuto delle lezioni – suggerendo di applicare idee e concetti in varie direzioni estranee alla linea maestra di applicazione. Per questa ragione comunque ho cercato costantemente di rendere tutta l’esposizione la più esatta possibile, per mettere in rilievo ogni caso in cui equazioni e idee si adattavano al campo della fisica, e come – quando si fosse andati più a fondo – sarebbero state modificate le cose. Pensavo anche che per
questi studenti era importante indicare che cosa essi – se sufficientemente intelligenti – avrebbero dovuto essere in grado di dedurre da quanto già detto, e che cosa veniva introdotto come componente nuovo. Quando entravano in ballo nuove idee cercavo o di dedurle, se erano deducibili, oppure di spiegare che si trattava di una nuova idea che non aveva alcun rapporto con cose già imparate e che non si poteva dimostrare – ma semplicemente aggiungere. All’inizio di queste lezioni ho supposto che gli studenti conoscessero già dalla scuola superiore cose quali l’ottica geometrica, semplici concetti di chimica e così via. D’altronde non mi è parso che vi fosse una qualsiasi ragione di fare le lezioni con un determinato ordine, nel senso che non avrei potuto far menzione di qualcosa finché non fossi stato pronto a discuterla nei particolari. C’erano da fare cenni a molti argomenti senza una discussione completa. Queste discussioni più complete sarebbero venute in seguito, quando la preparazione fosse stata più avanzata. Esempi ne sono le discussioni sull’induttanza e sui livelli energetici, che vengono dapprima presentati in modo molto qualitativo e sono in seguito sviluppati più completamente. Nello stesso tempo in cui mi indirizzavo allo studente più attivo, volevo anche curarmi dello studente per il quale le impennate e le applicazioni collaterali sono semplicemente causa di disorientamento e dal quale non ci si può affatto aspettare che impari la maggior parte della materia della lezione. Per tale studente ho voluto che vi fosse almeno un nucleo centrale, o spina dorsale della materia, che egli potesse comprendere. Anche se non poteva capire tutto nella lezione avevo la speranza che non se ne sarebbe innervosito. Non mi aspettavo che capisse tutto, ma soltanto i lineamenti centrali e più diretti. Occorre naturalmente una certa intelligenza da parte sua per vedere quali siano i teoremi e le idee fondamentali, e quali siano le questioni secondarie e le applicazioni più avanzate che egli potrà capire soltanto negli anni seguenti.
XIV
Introduzione di Feynman
Nel presentare queste lezioni vi era una seria difficoltà. Nel modo in cui il corso veniva fatto, non vi era alcuna reazione degli studenti per indicare, a chi le presentava, se le lezioni venivano bene assimilate. Questa è indubbiamente una difficoltà molto seria, e io non so quanto buone in realtà fossero le lezioni stesse. L’intera cosa fu essenzialmente un esperimento. E se dovessi ripeterlo non lo rifarei allo stesso modo – spero di non doverlo ripetere! Penso tuttavia che l’esperimento si risolse – per quanto concerne la fisica – del tutto soddisfacentemente nel primo anno. Nel secondo anno io non fui altrettanto soddisfatto. Nella prima parte del corso, che tratta dell’elettricità e del magnetismo, non riuscii a trovare alcun modo realmente unico o diverso di presentarla – nessun modo che fosse particolarmente più eccitante del modo solito di presentazione. Così non penso di aver fatto molto nelle lezioni sull’elettricità e il magnetismo. Alla fine del secondo anno avevo pensato originariamente di proseguire, dopo l’elettricità e il magnetismo, facendo alcune lezioni in più sulle proprietà dei materiali, ma principalmente per parlare di cose quali i modi fondamentali, le soluzioni dell’equazione di diffusione, i sistemi vibranti, le funzioni ortogonali, ... sviluppando i primi stadi di quelli che comunemente sono detti «i metodi matematici della fisica». In retrospettiva penso che se dovessi rifare il corso tornerei all’idea originale. Ma poiché non era in progetto che io dovessi ripetere tali lezioni, fu suggerito che poteva essere una buona idea cercare di dare un’introduzione alla meccanica quantistica – cosa che il lettore troverà nel terzo volume. È perfettamente chiaro che gli studenti che vogliono specializzarsi in fisica possono attendere fino al terzo anno per la meccanica quantistica. D’altra parte si arguiva che parecchi degli studenti del corso studiano fisica come fondamento ai loro interessi primari in altri campi. E il modo solito di trattare la meccanica quantistica rende tale soggetto quasi inaccessibile per la grande maggioranza degli studenti, perché essi devono spendere tanto tempo per impararla. Eppure nelle sue applicazioni effettive – specialmente in quelle più complesse di ingegneria elettrotecnica e di chimica – l’intero meccanismo della trattazione mediante le equazioni differenziali non è in realtà usato. Così ho cercato di descrivere i princìpi della meccanica quantistica in un modo che non richiedesse che uno già conoscesse la matematica delle equazioni differenziali a derivate parziali. Anche per un fisico penso che sia una cosa interessante il presentare la meccanica quantistica così a rovescio – per diverse ragioni che risulteranno chiare dalle lezioni stesse. Tuttavia penso che l’esperimento, per quanto riguarda la meccanica quantistica, non sia stato un completo successo – in gran parte per il fatto che in realtà non ho avuto tempo sufficiente verso la fine (avrei dovuto avere, per esempio, tre o quattro lezioni in più per trattare con maggior completezza argomenti quali le bande di energia e la dipendenza spaziale delle ampiezze). Inoltre, non avevo mai presentato prima l’argomento in questo modo, per cui la mancanza di una risposta era partico-
© 978-8808-22107-0
larmente grave. Credo ora che la meccanica quantistica debba essere presentata in un tempo successivo. Può darsi che un giorno abbia la possibilità di rifarla. Allora la farò bene. La mancanza di lezioni sul come risolvere i problemi dipende dal fatto che vi erano sezioni preposte a tale compito. Benché abbia svolto tre lezioni del primo anno su come risolvere i problemi, esse non sono incluse qui. Vi era anche una lezione sulla guida inerziale, che era certamente appropriata dopo la lezione sui sistemi rotanti, ma che è stata sfortunatamente omessa. La quinta e la sesta lezione sono in realtà dovute a Matthew Sands, essendo io fuori città. Il problema, naturalmente, è quanto bene sia riuscito questo esperimento. Il mio punto di vista – che però non sembra essere condiviso dalla maggior parte delle persone che hanno lavorato con gli studenti – è pessimista. lo non penso di aver fatto molto bene nei riguardi degli studenti. Se osservo come la maggioranza di loro ha affrontato i problemi agli esami, penso che il sistema abbia fallito. Naturalmente i miei amici mi sottolineano che vi erano una o due dozzine di studenti che – sorprendentemente – capirono quasi tutto in tutte le lezioni e che furono attivissimi nel lavorare col materiale e nell’affrontare parecchi punti con entusiasmo e interesse. Queste persone hanno ora, io credo, una preparazione di base di prima classe in fisica e sono, dopo tutto, quelli ai quali avevo cercato di indirizzarmi. Ma allora, «Il potere dell’insegnamento è raramente di molta efficacia tranne che in quelle felici situazioni dove è quasi superfluo» (Gibbons). Pure, non volevo lasciare indietro completamente alcuno studente come forse ho fatto. Penso che un modo di aiutare di più gli studenti sarebbe di dedicare un lavoro più intenso allo sviluppo di un insieme di problemi atti a illustrare alcune delle idee delle lezioni. I problemi offrono una buona opportunità di allargare la materia delle lezioni e di rendere più realistiche, più complete e più salde nella mente le idee che sono state esposte. Penso, tuttavia, che non esista alcuna soluzione a questo problema dell’istruzione oltre a quella di rendersi conto che il miglior insegnamento può essere realizzato soltanto quando vi sia un rapporto individuale e diretto fra uno studente e un buon insegnante – una situazione in cui lo studente discute le idee, riflette sulle cose, conversa sulle cose. È impossibile imparare molto, presenziando semplicemente a una lezione, o anche risolvendo semplicemente i problemi che vengono assegnati. Ma nei nostri tempi dobbiamo insegnare a un così gran numero di studenti che dobbiamo cercare di trovare un qualche surrogato della situazione ideale. Forse le mie lezioni possono dare un certo contributo. Forse in qualche piccolo posto dove vi siano docenti singoli per i singoli studenti, essi possono avere qualche ispirazione o qualche idea dalle lezioni. Forse essi si divertiranno meditandole – o proseguendo nello sviluppo di qualche idea.
RICHARD P. FEYNMAN Giugno 1963
Indice
1
Comportamento quantistico 1.1 1.2 1.3 1.4 1.5 1.6 1.7 1.8
2
Relazione tra il punto di vista ondulatorio e quello corpuscolare 2.1 2.2 2.3 2.4 2.5 2.6
3
Leggi di combinazione delle ampiezze Interferenza da due fenditure Diffusione da un cristallo Particelle identiche
Particelle identiche 4.1 4.2 4.3 4.4 4.5 4.6 4.7
5
Ampiezze d’onda di probabilità Misure di posizione e di impulso Diffrazione dai cristalli Le dimensioni di un atomo I livelli d’energia Conseguenze di natura filosofica
Ampiezze di probabilità 3.1 3.2 3.3 3.4
4
Meccanica atomica Un esperimento con pallottole Un esperimento con onde Un esperimento con elettroni Interferenza delle onde elettroniche Osservazione degli elettroni Principi base della meccanica quantistica Il principio di indeterminazione
Particelle di Bose e particelle di Fermi Stati di due particelle di Bose Stati con n particelle di Bose Emissione e assorbimento di fotoni Lo spettro del corpo nero L’elio liquido Il principio di esclusione
Spin uno 5.1
Filtraggio degli atomi con un apparecchio di Stern-Gerlach
1
1 2 3 4 6 7 10 11
13
13 14 17 18 20 21 24
24 28 30 33 37
37 39 42 43 45 48 49 53
53
XVI
Indice
© 978-8808-22107-0
5.2 5.3 5.4 5.5 5.6 5.7 5.8
6
Spin un mezzo 6.1 6.2 6.3 6.4 6.5 6.6
7
Atomi in quiete. Stati stazionari Moto uniforme Energia potenziale. Conservazione dell’energia Forze. Il limite classico La «precessione» di una particella a spin un mezzo
La matrice hamiltoniana 8.1 8.2 8.3 8.4 8.5 8.6
9
Trasformazione delle ampiezze Trasformazione a un sistema di coordinate ruotato Rotazioni intorno all’asse z Rotazioni di 180° e di 90° intorno all’asse y Rotazioni intorno all’asse x Rotazioni arbitrarie
La dipendenza delle ampiezze dal tempo 7.1 7.2 7.3 7.4 7.5
8
Esperimenti con atomi filtrati Filtri di Stern-Gerlach in serie Stati di base Interferenza delle ampiezze L’armamentario della meccanica quantistica Passaggio a una base diversa Altri casi
Ampiezze e vettori Decomposizione dei vettori di stato Quali sono gli stati di base dell’universo? Come gli stati cambiano col tempo La matrice hamiltoniana La molecola di ammoniaca
Il maser ad ammoniaca 9.1 9.2 9.3 9.4 9.5 9.6
Gli stati di una molecola di ammoniaca La molecola in un campo elettrico stazionario Transizioni in un campo dipendente dal tempo Transizioni alla risonanza Transizioni lontano dalla risonanza L’assorbimento della luce
10 Altri sistemi a due stati Lo ione di idrogeno molecolare Forze nucleari La molecola di idrogeno La molecola del benzene Coloranti L’hamiltoniana di una particella a spin un mezzo in un campo magnetico 10.7 L’elettrone con spin in un campo magnetico
10.1 10.2 10.3 10.4 10.5 10.6
57 59 60 62 65 67 70 71
71 73 76 80 83 84 87
87 89 92 96 97 101
101 103 106 108 110 112 116
116 120 125 127 129 130 133
133 138 140 143 144 145 148
Indice
© 978-8808-22107-0
11 Ancora sui sistemi a due stati 11.1 11.2 11.3 11.4 11.5 11.6
Le matrici di spin di Pauli Le matrici di spin come operatori La soluzione delle equazioni per i sistemi a due stati Gli stati di polarizzazione del fotone Il mesone K neutro Generalizzazione ai sistemi a N stati
12 La struttura iperfine dell’idrogeno 12.1 12.2 12.3 12.4 12.5 12.6
Stati di base per un sistema di due particelle a spin un mezzo L’hamiltoniana per lo stato fondamentale dell’atomo di idrogeno I livelli di energia L’effetto Zeeman Gli stati in un campo magnetico La matrice di proiezione per lo spin uno
13 Propagazione in un reticolo cristallino 13.1 13.2 13.3 13.4 13.5 13.6 13.7 13.8
Stati di un elettrone in un reticolo unidimensionale Stati di energia definita Stati che dipendono dal tempo L’elettrone in un reticolo tridimensionale Altri possibili stati in un reticolo Diffusione da parte delle imperfezioni di un reticolo Cattura da parte di un’imperfezione del reticolo Ampiezze di diffusione e stati legati
14 Semiconduttori 14.1 14.2 14.3 14.4 14.5 14.6
Elettroni e lacune nei semiconduttori Semiconduttori impuri L’effetto Hall Giunzioni a semiconduttori La giunzione a simiconduttore come raddrizzatore Il transistor
15 L’approssimazione a particelle indipendenti 15.1 15.2 15.3 15.4 15.5 15.6
Onde di spin Due onde di spin Particelle indipendenti La molecola del benzene Ancora un po’ di chimica organica Altri usi di questa approssimazione
16 Dipendenza delle ampiezze dalla posizione 16.1 16.2 16.3 16.4
Ampiezze in una dimensione La funzione d’onda Stati di impulso definito Normalizzazione degli stati in x
151
151 155 158 159 163 171 176
176 178 182 184 188 191 194
194 197 200 201 203 204 206 207 209 209 213 215 217 219 220 223 223 227 228 230 233 235 237 237 241 243 245
XVII
XVIII
Indice
© 978-8808-22107-0
16.5 L’equazione di Schrödinger 16.6 Livelli energetici quantizzati
17 Simmetria e leggi di conservazione 17.1 17.2 17.3 17.4 17.5 17.6
Simmetria Simmetria e leggi di conservazione Leggi di conservazione Luce polarizzata La disintegrazione della particella 10 Sommario delle matrici di rotazione
18 Il momento angolare 18.1 18.2 18.3 18.4 18.5 18.6 18.7 18.8
Radiazione di dipolo elettrico Diffusione della luce Annichilimento del positronio Matrice di rotazione per uno spin qualsiasi Misura di uno spin nucleare Composizione dei momenti angolari Nota aggiuntiva 1: deduzione della matrice di rotazione Nota aggiuntiva 2: conservazione della parità nell’emissione di un fotone
19 L’atomo di idrogeno e il sistema periodico degli elementi 19.1 19.2 19.3 19.4 19.5 19.6
L’equazione di Schrödinger per l’atomo di idrogeno Soluzioni a simmetria sferica Stati con dipendenza angolare La soluzione generale per l’idrogeno Le funzioni d’onda dell’idrogeno Il sistema periodico
20 Operatori 20.1 20.2 20.3 20.4 20.5 20.6 20.7
Operazioni e operatori Energie medie L’energia media di un atomo L’operatore di posizione L’operatore dell’impulso Il momento angolare Variazione dei valori medi con il tempo
248 250 254 254 257 260 263 265 270 272 272 274 276 281 286 287 294 297 299 299 300 305 309 312 314 319 319 321 324 326 328 332 334
21 L’equazione di Schrödinger in un ambito classico: un seminario sulla superconduttività 21.1 21.2 21.3 21.4 21.5 21.6 21.7 21.8 21.9
L’equazione di Schrödinger in presenza di un campo magnetico L’equazione di continuità per le probabilità Due tipi d’impulso Il significato della funzione d’onda La superconduttività L’effetto Meissner Quantizzazione del flusso La dinamica della superconduttività La giunzione di Josephson
337 337 339 341 342 343 345 347 349 351
Indice
© 978-8808-22107-0
APPENDICE r Capitoli dal volume 2
34 Il magnetismo della materia 34.1 34.2 34.3 34.4 34.5 34.6 34.7 34.8
Diamagnetismo e paramagnetismo Momenti magnetici e momento angolare La precessione dei magneti atomici Il diamagnetismo Il teorema di Larmor La fisica classica non prevede né il diamagnetismo né il paramagnetismo Il momento angolare nella meccanica quantistica L’energia magnetica degli atomi
361 361 363 364 365 366 368 369 371
35 Paramagnetismo e risonanza magnetica
373
Stati magnetici quantizzati L’esperienza di Stern e Gerlach Il metodo di Rabi dei raggi molecolari Il paramagnetismo dei materiali in massa Il raffreddamento per smagnetizzazione adiabatica La risonanza magnetica nucleare
373 375 376 379 382 383
35.1 35.2 35.3 35.4 35.5 35.6
Indice analitico
387
Le risorse multimediali All’indirizzo online università zanichelli / feynman
sono disponibili i link per consultare il testo originale in lingua inglese messo a disposizione dal California Institute of Technology. Inoltre, chi acquista il libro può scaricare gratuitamente l’ebook, seguendo le istruzioni presenti nel sito sopra indicato. L’ebook si legge con l’applicazione Booktab, che si scarica gratis da AppStore (sistemi operativi Apple) o da Google Play (sistemi operativi Android). Per accedere alle risorse protette è necessario registrarsi su myzanichelli inserendo la chiave di attivazione personale contenuta nel libro.
XIX
Comportamento quantistico
Questo capitolo è quasi del tutto uguale al cap. 37 del vol. 1.
1.1
Meccanica atomica
La «meccanica quantistica» è la descrizione del comportamento della materia e della luce in tutti i suoi dettagli e, in particolare, di ciò che avviene su scala atomica. Gli oggetti su scala molto piccola non si comportano come nessuna cosa di cui si possa avere diretta esperienza. Non si comportano come onde, non si comportano come particelle, non si comportano come nuvole, né come palle da biliardo, o come pesi attaccati a molle, o come qualsiasi altra cosa che mai possiate aver visto. Newton pensava che la luce fosse composta da particelle, ma fu poi scoperto che essa si comporta come un’onda. In seguito, tuttavia (all’inizio del ventesimo secolo), fu trovato che in effetti la luce talvolta si comporta da particella. Per fare un altro esempio, una volta si pensava che l’elettrone si comportasse come una particella e si scoprì poi che, sotto molti aspetti, si comporta come un’onda. Cosicché, in realtà, non si comporta in nessuno dei due modi. Ora abbiamo lasciato perdere. Diciamo: «Non è né l’una né l’altra cosa». Fortunatamente c’è uno spiraglio: gli elettroni si comportano esattamente come la luce. Il comportamento quantistico degli oggetti atomici (elettroni, protoni, neutroni, fotoni e così via) è lo stesso per tutti, sono tutti «onde-particelle», o qualunque altro nome vi piaccia dare loro. Così ciò che apprendiamo sulle proprietà degli elettroni (che useremo nei nostri esempi) vale anche per tutte le altre «particelle», compresi i fotoni della luce. Il graduale accumularsi di informazioni sul comportamento atomico e su scala microscopica durante il primo quarto del nostro secolo, che aveva dato qualche indicazione su come in realtà si comportano gli oggetti piccoli, ha generato uno stato di crescente confusione, superato poi nel 1926 e 1927 da Schrödinger, Heisenberg e Born, che sono riusciti a dare una descrizione coerente del comportamento della materia su scala microscopica. In questo capitolo considereremo i principali aspetti di tale descrizione. Proprio perché il comportamento atomico è così diverso dalla comune esperienza, è assai difficile abituarvicisi, ed esso appare strano e misterioso a chiunque, sia al principiante, sia al fisico ormai sperimentato. Perfino gli esperti non lo capiscono nel modo che essi desidererebbero, ed è assai ragionevole che non ci riescano, poiché tutto quanto riguarda la diretta esperienza e l’intuizione umana si riferisce a oggetti grandi. Sappiamo come si comportano gli oggetti grandi, ma quelli su piccola scala fanno altrimenti. Perciò, per apprendere ciò che riguarda questi ultimi, dobbiamo usare metodi più astratti e concettuali, piuttosto che cercare dei legami con la nostra diretta esperienza. In questo capitolo affronteremo subito l’elemento essenziale di questo misterioso comportamento, in una delle sue forme che più colpiscono. Sceglieremo cioè un fenomeno che è impossibile, assolutamente impossibile, spiegare in forma classica, e che contiene in sé il cuore della meccanica quantistica. In effetti, questo fenomeno contiene l’unico mistero. Non possiamo eliminare il mistero «spiegando» come avviene. Ci limiteremo a descrivere come avviene; e nel far questo avremo descritto le principali caratteristiche della meccanica quantistica.
1
2
Capitolo 1 • Comportamento quantistico
1.2
© 978-8808-22107-0
Un esperimento con pallottole
Per cercare di capire il comportamento quantistico degli elettroni, li metteremo a confronto, in una particolare situazione sperimentale, con particelle a noi più familiari, come per esempio dei piccoli proiettili, e poi anche con delle onde, per esempio come quelle che si formano sull’acqua. Consideriamo dapprima il comportamento dei proiettili nella situazione sperimentale mostrata schematicamente nella FIGURA 1.1. C’è una mitragliatrice che spara raffiche di pallottole. Non è una mitragliatrice molto buona, perché sparge le pallottole (casualmente) su una regione angolare piuttosto grande, come è indicato in figura. Di fronte alla mitragliatrice c’è una parete (fatta da una piastra corazzata) in cui sono praticati due fori di dimensioni appena sufficienti a lasciar passare un proiettile. Dietro la parete c’è un tabellone (diciamo una spessa parete di legno) che «assorbe» i proiettili che lo colpiscono. Sul tabellone, di fronte alla parete coi fori, c’è un oggetto, che si potrebbe chiamare un «rilevatore» di pallottole. Potrebbe essere fatto con una scatola riempita di sabbia. Tutti i proiettili che entrano nel rilevatore vengono fermati e accumulati. Quando vogliamo, possiamo vuotare la scatola e contare i proiettili che contiene. Il rilevatore può essere spostato avanti e indietro (in quella che chiameremo la direzione x). Con questo apparato, possiamo trovare sperimentalmente la risposta alla domanda: «Qual è la probabilità che un proiettile che passa attraverso i fori sulla parete arrivi sul tabellone a una distanza x dal centro?». Prima di tutto, notate che dobbiamo parlare di probabilità, perché non possiamo dire con precisione dove andrà a finire un particolare proiettile. Una pallottola che infili uno dei fori può rimbalzare sulla parete del foro e finire chissà dove. La «probabilità» a cui ci riferiamo, cioè quella che un proiettile giunga al rilevatore, è quella grandezza che misuriamo contando il numero dei proiettili che arrivano sul rilevatore in un certo tempo e poi facendo il rapporto tra questo numero e il numero totale di proiettili che urtano il tabellone durante quell’intervallo di tempo. O anche, se si suppone che la mitragliatrice spari sempre con lo stesso ritmo durante le misure, la probabilità che cerchiamo è semplicemente proporzionale al numero di proiettili che arrivano al rilevatore in un certo intervallo di tempo prefissato. Per quel che ora ci interessa possiamo immaginare un esperimento un po’ più idealizzato, in cui i proiettili non siano delle pallottole reali, ma siano indistruttibili, cioè non possano spezzarsi in due. Nel nostro esperimento supponiamo che ogni pallottola sia un blocco indivisibile e che nel rilevatore ci siano sempre pallottole intere. Se il ritmo con cui spara la mitragliatrice viene molto diminuito, troviamo che a ogni dato istante al tabellone o non arriva nulla, oppure vi arriva una pallottola, una soltanto ed esattamente una. Inoltre, le dimensioni dei blocchi non dipendono certamente dal ritmo con cui la mitragliatrice spara. Diciamo quindi: «I proiettili arrivano sempre a blocchi identici e distinti». Ciò che misuriamo con il nostro rilevatore è la probabilità di arrivo di uno di tali blocchi. E questa probabilità la misuriamo in funzione di x. Il risultato di queste misure con il nostro apparecchio (l’esperimento non l’abbiamo ancora fatto, quindi noi stiamo in realtà immaginando il risultato) è riportato in grafico nella FIGURA 1.1c.
Rilevatore mobile
x
x
P1
1
2
P2
Mitragliatrice
1.1 Esperimento di interferenza con pallottole. Nella figura (c) si ha: P 12 = P 1 + P 2 .
FIGURA
P12
x
Parete (a)
Tabellone (b)
(c)
3
1.3 • Un esperimento con onde
© 978-8808-22107-0
Nel grafico la probabilità viene riportata alla destra di x, verticalmente, cosicché l’asse x è in corrispondenza con la sezione dell’apparato. Indichiamo la probabilità con P12 perché i proiettili possono provenire sia dal foro 1 sia dal foro 2. Non c’è da meravigliarsi che P12 sia grande vicino al centro del grafico, ma diventi piccola quando x è molto grande. Può tuttavia sorprendere che P12 abbia il suo valore massimo in x = 0. Possiamo capire questo fatto ripetendo il nostro esperimento dopo aver chiuso il foro 2, e un’altra volta ancora chiudendo invece il foro 1. Quando il foro 2 è chiuso i proiettili possono passare solo attraverso il foro 1, e si ottiene la curva segnata con P1 nella FIGURA 1.1b. Com’era prevedibile il massimo di P1 si ha per quel valore di x che giace sulla retta congiungente la mitragliatrice e il foro 1. Quando è il foro 1 a essere chiuso, otteniamo la curva P2 , simmetrica alla precedente, disegnata in figura. P2 è la distribuzione di probabilità per i proiettili che passano attraverso il foro 2. Dal confronto delle FIGURE 1.1b e 1.1c, si deduce l’importante risultato: P12 = P1 + P2 (1.1) Le probabilità vanno semplicemente sommate. L’effetto con entrambi i fori aperti è la somma degli effetti che si hanno quando è aperto solo uno dei fori. Indicheremo questo risultato dicendo che «non si osserva interferenza», per ragioni che appariranno chiare in seguito. E ciò basta per i proiettili. Arrivano interi e la loro probabilità di arrivo non presenta interferenza.
1.3
Un esperimento con onde
Vogliamo ora considerare un esperimento con onde prodotte nell’acqua. L’apparato è mostrato schematicamente nella FIGURA 1.2. C’è un contenitore d’acqua, poco profondo. Un piccolo oggetto, indicato come «sorgente di onde», viene fatto muovere su e giù da un motore e produce onde circolari. Alla destra della sorgente abbiamo ancora una parete con due fori, e dietro c’è una seconda parete che, per semplificare le cose, consideriamo un perfetto «assorbitore», di modo che non si produce la riflessione delle onde che vi incidono. Si può ottenere questo risultato costruendo una «spiaggia» di sabbia in leggero declivio. Davanti alla spiaggia mettiamo un rilevatore che può essere spostato avanti e indietro in direzione x, come prima. In questo caso il rilevatore è un congegno che misura l’«intensità» del moto ondoso. Si può pensare a un apparecchio che misuri l’altezza del moto ondoso, con una scala calibrata con i quadrati dell’altezza effettiva, cosicché la lettura risulti proporzionale all’intensità dell’onda. Il nostro rilevatore registra quindi un qualcosa che è proporzionale all’energia portata dall’onda o piuttosto all’energia che giunge al rilevatore per unità di tempo. Quel che si può notare per prima cosa, con il nostro apparato, è che l’intensità può avere qualsiasi valore. Se la sorgente si muove molto poco, c’è appena un leggero moto ondoso al rilevatore; quando aumenta il moto della sorgente, viene rivelata una maggiore intensità delle onde. L’intensità dell’onda può assumere qualsiasi valore. Non si può certo dire che l’intensità dell’onda abbia una struttura in qualche modo «a blocchi».
Rilevatore x
x
I1
I12
1 Sorgente di onde
2
Parete (a)
I2
Assorbitore (b)
1.2 Esperimento di interferenza con onde d’acqua. Nella figura (b) si ha: I1 = |h1 |2 I2 = |h2 |2 . Nella figura (c) si ha: I12 = |h1 + h2 |2 .
FIGURA
(c)
4
Capitolo 1 • Comportamento quantistico
© 978-8808-22107-0
Misuriamo ora l’intensità dell’onda per vari valori di x (mantenendo costante il moto della sorgente delle onde). Otteniamo la curva, assai interessante, segnata con I12 nella FIGURA 1.2c. Abbiamo già visto come abbiano origine simili curve studiando l’interferenza di onde elettriche nel volume 1. In questo caso osserviamo che 1’onda originale viene diffratta attraverso i fori, e che nuove onde circolari si diffondono da ciascun foro. Se chiudiamo un foro alla volta e misuriamo la distribuzione d’intensità sull’assorbitore troviamo le curve d’intensità, piuttosto semplici, che sono riportate nella FIGURA 1.2b. I1 è l’intensità dell’onda proveniente dal foro 1 (intensità che determiniamo effettuando le misure quando il foro 2 è chiuso) e I2 è l’intensità proveniente dal foro 2 (quando il foro 1 è chiuso). L’intensità I12 , osservata quando entrambi i fori sono aperti, certamente non è la somma di I1 e I2 . Diciamo allora che si ha «interferenza» tra le due onde. In certi punti (cioè dove la curva I12 ha i suoi massimi) le onde sono «in fase» e i picchi delle onde si sommano, dando luogo a una grande ampiezza e, quindi, a una grande intensità. Diremo che nei punti suddetti si ha un’«interferenza costruttiva» tra le due onde. Si avrà interferenza costruttiva in tutti i punti dove la differenza delle distanze del rilevatore dai due fori è uguale a un numero intero di lunghezze d’onda. Nei punti in cui le onde arrivano al rilevatore con una differenza di fase di ⇡ (cioè dove sono «fuori fase»), il moto ondoso che ne risulterà sarà dato dalla differenza delle due ampiezze. Si ha qui un’«interferenza distruttiva», e l’intensità dell’onda ne risulta diminuita. Si può prevedere che questi piccoli valori d’intensità abbiano luogo nei punti in cui la distanza del rilevatore dal foro 1 differisca dalla distanza dal foro 2 di un numero dispari di mezze lunghezze d’onda. I piccoli valori di I12 nella FIGURA 1.2 corrispondono ai punti in cui si ha interferenza distruttiva tra le onde. Ricorderete che la relazione quantitativa tra I1 , I2 e I12 può essere espressa come segue: l’altezza istantanea al rilevatore dell’onda proveniente dal foro 1 può essere scritta come (la parte reale di) h1 ei!t , dove l’«ampiezza» h1 è, in generale, un numero complesso. L’intensità è proporzionale all’ampiezza quadratica media, cioè, visto che stiamo usando numeri complessi, al modulo quadrato |h1 |2 . Analogamente, per il foro 2, l’altezza è h2 ei!t e l’intensità è proporzionale a |h2 |2 . Quando entrambi i fori sono aperti, le altezze singole si sommano dando luogo all’altezza complessiva (h1 + h2 )ei!t e all’intensità |h1 + h2 |2 . Tralasciando la costante di proporzionalità che non interessa per i nostri scopi, le relazioni corrette per onde che interferiscono sono I1 = |h1 | 2 I2 = |h2 | 2 I12 = |h1 + h2 |
(1.2) 2
Noterete che il risultato è completamente diverso da quello ottenuto con i proiettili (equazione (1.1)). Se sviluppiamo |h1 + h2 |2 troviamo che |h1 + h2 |2 = |h1 |2 + |h2 |2 + 2 |h1 ||h2 | cos dove
è la differenza di fase tra h1 e h2 . In funzione delle intensità si può scrivere p I12 = I1 + I2 + 2 I1 I2 cos
(1.3)
(1.4)
L’ultimo termine nella (1.4) è il «termine d’interferenza». E ciò basti per le onde. L’intensità può avere un qualsiasi valore e presenta interferenza.
1.4
Un esperimento con elettroni
Immaginiamo ora di fare un esperimento simile ai precedenti, ma facendo uso di elettroni, com’è mostrato schematicamente nella FIGURA 1.3. C’è un cannone elettronico formato da un filo di tungsteno riscaldato elettricamente e circondato da un involucro metallico provvisto di un foro.
5
1.4 • Un esperimento con elettroni
© 978-8808-22107-0
1.3 Esperimento di interferenza con elettroni. Nella figura (b) si ha: P1 = | 1 | 2 P2 = | 2 | 2 . Nella figura (c) si ha: P12 = | 1 + 2 |2 .
FIGURA
x
x Rilevatore P1
P12
1
Cannone elettronico
2 P2
Parete (a)
Tabellone (b)
(c)
Se il filo è mantenuto a una tensione negativa rispetto all’involucro, gli elettroni emessi dal filo verranno accelerati verso le pareti e alcuni di essi usciranno dal foro. Tutti gli elettroni che escono dal cannone avranno (all’incirca) la stessa energia. Di fronte al cannone vi è di nuovo una parete (per esempio una sottile lastra metallica) in cui sono praticati due fori. Dietro la parete vi è un’altra lastra che ha la funzione di arrestare gli elettroni. Davanti a questa lastra collochiamo un rilevatore mobile. Quest’ultimo potrebbe essere un contatore Geiger o, forse meglio, un moltiplicatore di elettroni collegato con un altoparlante. Vi avvertiamo subito di non cercare di montare questo esperimento (come invece avreste potuto fare con i due che abbiamo già descritto). Questo esperimento non è mai stato fatto in questo modo. Il guaio sta nel fatto che, per rivelare gli effetti che c’interessano, l’apparato dovrebbe essere costruito su una scala talmente piccola da rendere impossibile la cosa. Noi stiamo quindi compiendo un «esperimento concettuale» e lo abbiamo impostato così perché è facile ragionarci su. Noi sappiamo quali sono i risultati che si otterrebbero, perché sono stati fatti molti esperimenti in cui la scala e le proporzioni erano state scelte in modo da mettere in luce gli effetti che ora descriveremo. La prima cosa che notiamo nel nostro esperimento con elettroni è che si sentono dei «click» ben staccati nel rilevatore (cioè nell’altoparlante). E che tutti i «click» sono uguali: non ci sono «mezzi click». Ci accorgiamo anche che i «click» arrivano in modo irregolare. Qualcosa come: click... clickclick... click... click... click-click... click... ecc., così come avrete certamente udito fare da un contatore Geiger in funzione. Se contiamo i click che arrivano in un tempo sufficientemente lungo – diciamo parecchi minuti – e poi li ricontiamo per un altro periodo di tempo uguale, troviamo che i due numeri ottenuti sono assai vicini. Possiamo dunque parlare di una frequenza media con cui i click sono uditi (tanti click per minuto, in media). Se muoviamo il rilevatore, il ritmo con cui arrivano i click risulta più veloce o più lento, ma la grandezza (intensità) di ciascun click è sempre la stessa. Se abbassiamo la temperatura del filo nel cannone elettronico, il ritmo dei click diminuisce, ma il suono di ciascun click rimane lo stesso. Infine, ponendo due diversi rivelatori sullo schermo in fondo, notiamo che il solito click viene emesso da uno oppure dall’altro dei due, ma mai contemporaneamente. (Eccetto che una volta tanto, quando due click sono emessi in tempi assai vicini, cosicché il nostro orecchio non ne avverte la separazione.) Concludiamo, perciò, che quel che arriva al rilevatore, qualunque cosa sia, arriva in «granuli». Tutti i «granuli» hanno le stesse dimensioni: i «granuli» arrivano tutti interi e uno alla volta. Diremo quindi: «Gli elettroni arrivano sempre in granuli, tutti identici tra loro». Così come nel nostro esperimento con i proiettili, si può cercare ora di rispondere sperimentalmente alla domanda: «Qual è la probabilità relativa che un granulo elettronico arrivi sulla lastra di fondo a varie distanze x dal centro?». Come prima, otterremo la probabilità relativa facendo lavorare il cannone elettronico a ritmo costante. La probabilità che un granulo arrivi a un particolare valore di x è proporzionale al ritmo medio dei click, quando il rilevatore è nella posizione x.
6
Capitolo 1 • Comportamento quantistico
© 978-8808-22107-0
Il risultato del nostro esperimento è la curva, assai interessante, segnata con P12 nella 1.3c. Già! Gli elettroni fanno proprio così.
FIGURA
1.5
Interferenza delle onde elettroniche
Cerchiamo ora di analizzare la curva di FIGURA 1.3 per vedere se riusciamo a capire il comportamento degli elettroni. La prima cosa che vorremmo dire è che, poiché quel che arriva sono dei granuli, ciascun granulo, che in fondo potremmo anche chiamare elettrone, è passato attraverso il foro 1 oppure attraverso il foro 2. Scriviamo tutto ciò sotto forma di una «Proposizione»: Proposizione A: Ciascun elettrone o attraversa il foro 1 oppure attraversa il foro 2. Ammettendo la Proposizione A, tutti gli elettroni che arrivano alla lastra di fondo possono venire suddivisi in due classi: (1) quelli che ci sono arrivati passando per il foro 1 e (2) quelli arrivati attraverso il foro 2. Allora la nostra curva deve essere la somma degli effetti degli elettroni venuti dal foro 1 e degli elettroni venuti dal foro 2. Controlliamo quest’idea con un esperimento. Per prima cosa faremo una misura con gli elettroni che vengono dal foro 1. Chiudiamo il foro 2 e contiamo i click al rilevatore. Da questa misura ricaviamo P1 . Il risultato è mostrato dalla curva segnata con P1 nella FIGURA 1.3b. Tale risultato è assai ragionevole. In maniera analoga, misuriamo P2 , distribuzione di probabilità per gli elettroni che provengono dal foro 2. Anche il risultato di tale misura è riportato in figura. Il risultato P12 ottenuto con entrambi i fori aperti non è certo la somma di P1 e P2 , le probabilità per ciascun foro soltanto. In analogia con il nostro esperimento con le onde diciamo: «C’è interferenza». Per gli elettroni: P12 , P1 + P2 (1.5) Ma da dove sbuca questa interferenza? Forse si potrebbe dire: «Bene, questo probabilmente significa che non è vero che i granuli passano attraverso l’uno o l’altro dei fori 1 e 2, perché, se così fosse, le probabilità si sommerebbero. Forse vanno in modo più complicato. Si dividono a metà e...». Ma no! Non possono farlo, arrivano sempre tutti interi... «Allora, forse qualcuno passa attraverso il foro 1, poi anche attraverso il foro 2 e così via per un po’ di volte, oppure fanno qualche altra strada complicata... cosicché, chiudendo il foro 2, abbiamo alterato la probabilità di arrivo sul fondo degli elettroni che avevano attraversato il foro 1...» Ma attenti! Vi sono alcuni punti in cui arrivano pochi elettroni quando sono aperti tutti e due i fori, ma che ricevono molti elettroni se chiudiamo uno dei fori, cosicché la chiusura di un foro aumenta il numero di elettroni proveniente dall’altro. Notate, poi, che al centro della curva, P12 è maggiore del doppio di P1 + P2 . È come se la chiusura di un foro diminuisse il numero di elettroni che escono dall’altro. Sembra assai difficile spiegare entrambi questi effetti, proponendo che gli elettroni viaggino per cammini complicati. Tutto è assai misterioso. E più ci pensate, più misterioso diventa. Si sono rimuginate molte idee per cercare di spiegare la curva P12 pensando ai singoli elettroni che se ne vanno in modo complicato attraverso i fori. Ma nessuna di esse ha avuto successo. Nessuna può rendere conto della curva P12 a partire da P1 e P2 . Quel che è abbastanza sorprendente è che la matematica, che serve per collegare P1 e P2 a P12 , è estremamente semplice. Perché P12 è proprio una curva come I12 di FIGURA 1.2, e quel caso era semplice. Quel che succede sulla lastra di fondo può essere descritto da due numeri complessi, che chiameremo 1 e 2 (che sono, naturalmente, funzioni di x). Il modulo quadrato di 1 ci dà l’effetto col solo foro 1 aperto. Cioè, P1 = | 1 |2 . Allo stesso modo l’effetto col solo foro 2 aperto è dato da 2 . Cioè, P2 = | 2 |2 . L’effetto combinato dei due fori è perciò P12 = |
1
+
2|
2
La matematica è proprio quella che avevamo con le onde! (È difficile vedere come uno possa ottenere un così semplice risultato da un complicato gioco di elettroni che se ne vanno avanti e indietro attraverso la lastra lungo strane traiettorie.)
7
1.6 • Osservazione degli elettroni
© 978-8808-22107-0
Conclusione: gli elettroni arrivano in «granuli», come delle particelle, e la loro probabilità di arrivo varia con la distribuzione d’intensità propria di un’onda. È in questo senso che gli elettroni si comportano «talvolta come una particella e talvolta come un’onda». Tra l’altro, trattando le onde classicamente, avevamo definito l’intensità come la media nel tempo del quadrato dell’ampiezza dell’onda, e avevamo usato i numeri complessi come espediente matematico per semplificarne l’analisi. In meccanica quantistica risulta invece che le ampiezze devono essere rappresentate da numeri complessi. Le parti reali non bastano. Questa per il momento è soltanto una nota tecnica, visto che le formule appaiono le stesse. Poiché la probabilità di arrivo attraverso i due fori si ottiene in modo così semplice, anche se non è uguale a P1 + P2 , questo è in realtà tutto quello che c’è da dire. Ma c’è un gran numero di sottigliezze che sono connesse con questo modo di comportarsi della natura. Ora vi illustreremo alcune di queste sottigliezze. Primo, poiché il numero di elettroni che arriva in un particolare punto non è uguale al numero di elettroni che arrivano passando dal foro 1 più quelli che passano dal foro 2, così come avemmo concluso a partire dalla Proposizione A, senza dubbio, dovremmo concludere che la Proposizione A è falsa. Non è vero che gli elettroni passano attraverso l’uno o l’altro dei fori 1 e 2. Ma questa conclusione deve essere provata da un altro esperimento.
1.6
Osservazione degli elettroni
Faremo ora il seguente esperimento. Aggiungiamo al nostro apparato elettronico una sorgente di luce molto intensa, posta dietro lo schermo a metà tra i due fori, com’è mostrato nella FIGURA 1.4. Sappiamo che le cariche elettriche diffondono la luce. Cosicché quando un elettrone riesce in un modo qualsiasi a oltrepassare lo schermo, prima di raggiungere il rilevatore devierà verso il nostro occhio della luce e potremo vedere il cammino dell’elettrone stesso. Per esempio, se l’elettrone passa attraverso il foro 2, seguendo la traiettoria disegnata nella FIGURA 1.4, dovremmo vedere un lampo di luce proveniente dalle vicinanze del punto A in figura. Se l’elettrone passa attraverso il foro 1, ci aspetteremmo di vedere invece un lampo nelle vicinanze del foro superiore. Se dovesse accadere di osservare luce da tutte e due le parti allo stesso tempo, è perché l’elettrone si divide a metà... Ma facciamo l’esperimento! Ecco ciò che si vede: ogni volta che udiamo un «click» dal nostro rilevatore di elettroni (sulla parete di fondo), vediamo anche un lampo di luce vicino al foro 1 oppure al foro 2, ma mai tutti e due insieme! E otteniamo questo stesso risultato indipendentemente dalla posizione del rilevatore. Da quest’esperienza concludiamo che quando osserviamo gli elettroni troviamo che essi passano attraverso l’uno o l’altro dei fori. Sperimentalmente la Proposizione A è necessariamente vera. Ma allora cosa c’è di sbagliato nel nostro ragionamento contro la Proposizione A? Perché P12 non è uguale a P1 + P2 ? Ritorniamo all’esperienza! Ricostruiamo il cammino degli elettroni e scopriamo ciò che fanno. Per ogni posizione (sull’asse x) del rilevatore contiamo gli elettroni che arrivano e registriamo anche il foro attraverso il quale sono passati, osservando i lampi di luce. Possiamo procedere in questo modo: ogni volta che udiamo un «click» facciamo un segno
x
1
Cannone elettronico
2
x
Sorgente di luce
P'1
A
P'12
P'2
1.4 Un diverso esperimento con elettroni. Nella figura (c) si ha: P012 = P01 + P02 . FIGURA
(a)
(b)
(c)
8
Capitolo 1 • Comportamento quantistico
© 978-8808-22107-0
nella colonna 1 se vediamo il lampo vicino al foro 1, mentre se questo appare in prossimità del foro 2, lo annotiamo nella colonna 2. Tutti gli elettroni che arrivano sono registrati in due classi: quelli che sono giunti attraverso 1 e quelli che sono giunti attraverso 2. Dal numero riportato nella colonna 1 ricaviamo la probabilità P10 che un elettrone arrivi al rilevatore attraverso il foro 1; dal numero riportato nella colonna 2 ricaviamo la probabilità P20 che un elettrone arrivi al rilevatore attraverso il foro 2. Se ora ripetiamo queste misure per molti valori di x, otteniamo per P10 e P20 le curve mostrate nella FIGURA 1.4b. Orbene, ciò non è molto sorprendente! Otteniamo per P10 qualcosa di molto simile a ciò che si era ottenuto prima per P1 chiudendo il foro 2; mentre P20 è molto simile a quello che si era ottenuto chiudendo il foro 1. Dunque non c’è niente di complicato come il passare attraverso tutti e due i fori. Quando li osserviamo, gli elettroni arrivano proprio come ci aspettavamo che arrivassero. Sia che i fori siano aperti o chiusi, quelli che vediamo arrivare attraverso il foro 1 sono distribuiti nello stesso modo, indipendentemente dalla situazione del foro 2. Ma un momento! Cosa otteniamo ora per la probabilità totale, cioè la probabilità che un elettrone arrivi al rilevatore con un cammino qualsiasi? Noi conosciamo già questo risultato. Basta fingere di non avere mai osservato i lampi di luce, e sommare insieme i conteggi del rilevatore che avevamo separato nelle due colonne. Dobbiamo semplicemente sommare i numeri. Per la probabilità che un elettrone giunga sulla parete di fondo passando attraverso un foro qualsiasi, troviamo 0 P12 = P1 + P2 Così, pur essendo riusciti a osservare attraverso quale dei fori passano i nostri elettroni, non 0 , che non mostra traccia di otteniamo più la vecchia curva d’interferenza P12 , ma una nuova, P12 interferenza! Se si spegne la luce si ritrova P12 . Dobbiamo concludere che la distribuzione degli elettroni sullo schermo quando li osserviamo è diversa da quella ottenuta quando non li osserviamo. Che sia l’accensione della sorgente di luce che disturba le cose? Deve essere il fatto che gli elettroni sono molto delicati, e la luce, nell’essere diffusa dagli elettroni, dà loro un colpo che ne fa mutare il movimento. Sappiamo che il campo elettrico della luce, agendo su di una carica, esercita una forza su di essa. Forse ci dovrebbe effettivamente essere una differenza nel moto. A ogni modo, la luce esercita una grande influenza sugli elettroni. Tentando di «guardare» gli elettroni ne abbiamo cambiato il movimento. Precisamente, l’urto subito dall’elettrone nel deviare il fotone, ne modifica talmente il moto, da far sì che l’elettrone, che sarebbe andato a finire dove la curva P12 ha un massimo, si posi invece dove P12 ha un minimo; per questo non vediamo più gli effetti ondulatori d’interferenza. Voi starete pensando: «Non usare una sorgente così forte! Abbassa la luce! Le onde luminose saranno così più deboli e non disturberanno tanto gli elettroni. Rendendo sempre più fievole la luce, alla fine le onde saranno certo abbastanza deboli da avere un effetto trascurabile». Benissimo. Proviamo. La prima cosa che si osserva è che i lampi di luce diffusi dagli elettroni al loro passaggio non diventano più deboli. I lampi sono sempre uguali. L’unica differenza che si ottiene affievolendo la luce è che qualche volta udiamo un «click» del rilevatore, ma non vediamo alcun lampo. L’elettrone passa senza essere «visto». Ciò di cui ci stiamo rendendo conto è che anche la luce si comporta come gli elettroni; sapevamo che era «a onde», ma adesso troviamo che è anche «a corpuscoli». Essa arriva sempre – oppure è diffusa – in grani che chiamiamo «fotoni». Quando diminuiamo l’intensità della sorgente luminosa, non cambiamo le dimensioni dei fotoni, ma solo il ritmo con cui essi sono emessi. Ciò spiega perché, quando la nostra sorgente è debole, alcuni elettroni passano senza essere visti. È successo che non c’era un fotone mentre l’elettrone passava. Questo è un po’ scoraggiante. Se è vero che ogni volta che «vediamo» un elettrone, vediamo un lampo delle stesse dimensioni, allora gli elettroni che osserviamo sono sempre quelli disturbati. Tuttavia facciamo l’esperimento con una luce debole. Adesso ogni volta che udiamo un conteggio del rilevatore facciamo un segno in una di tre colonne: nella colonna (1) segniamo gli elettroni visti passare attraverso il foro 1, nella colonna (2) quelli visti attraverso il foro 2, e nella colonna (3) quelli che non sono stati visti affatto. Quando elaboriamo i nostri dati (calcolando le probabilità) troviamo questi risultati: quelli «visti attraverso il foro 1» hanno una distribuzione come P10 ; quelli «visti attraverso il foro 2» hanno una distribuzione come P20 (cosicché quelli «visti attraverso il
© 978-8808-22107-0
1.6 • Osservazione degli elettroni
0 ); e quelli «non visti affatto» hanno una foro 1 oppure 2» hanno una distribuzione come P12 distribuzione «tipo onda» proprio come P12 di FIGURA 1.3! Se gli elettroni non si vedono, si ha interferenza! Ciò è comprensibile. Quando non vediamo un elettrone, nessun fotone lo perturba, mentre quando lo vediamo, un fotone lo ha disturbato. Si ha sempre un’identica alterazione perché i fotoni di luce producono effetti di uguale entità e il risultato della diffusione dei fotoni è sufficiente a cancellare ogni effetto di interferenza. Non c’è qualche modo di vedere gli elettroni senza disturbarli? Abbiamo imparato in un precedente capitolo che l’impulso trasportato da un «fotone» è inversamente proporzionale alla sua lunghezza d’onda (p = h/ ). Certamente la spinta che l’elettrone riceve, quando il fotone è diffuso verso il nostro occhio, dipende dall’impulso portato dal fotone. Aha! Se volevamo disturbare l’elettrone solo leggermente non avremmo dovuto abbassare l’intensità della luce, ma la sua frequenza (che è la stessa cosa che aumentare la sua lunghezza d’onda). Usiamo una luce più rossa. Potremmo anche usare luce infrarossa, o onde radio (come il radar), e «guardare» per dove passa l’elettrone con l’aiuto di qualche apparecchio capace di «vedere» luce di queste lunghezze d’onda maggiori. Se usiamo una luce più «delicata» forse riusciremo a non perturbare così tanto gli elettroni. Rifacciamo l’esperienza con onde più lunghe. Seguitiamo a ripetere il nostro esperimento, ogni volta con luce di maggiore lunghezza d’onda. Al principio, nulla sembra cambiare. I risultati sono gli stessi. Poi succede una cosa terribile. Vi ricorderete che quando abbiamo discusso il microscopio, abbiamo rilevato che, a causa della natura ondulatoria della luce, vi è una limitazione per la distanza minima di due punti affinché possano essere visti ancora come punti separati. Questa distanza è dell’ordine della lunghezza d’onda della luce. Così adesso, non appena rendiamo la lunghezza d’onda della luce maggiore della distanza dei nostri fori, vediamo un grosso lampo sfocato quando la luce è diffusa dagli elettroni. Non possiamo più dire attraverso quale foro è passato l’elettrone! Sappiamo solo che è passato da qualche parte! Ed è proprio con luce di questo colore che troviamo che le spinte ricevute dall’elettrone sono abbastanza piccole da rendere 0 simile a P , cioè da cominciare a ottenere effetti di interferenza. Ed è solo per lunghezze P12 12 d’onda molto maggiori della separazione dei due fori (allorché non abbiamo più alcuna possibilità di dire da dove è passato l’elettrone) che l’alterazione dovuta alla luce diviene abbastanza piccola da riottenere la curva P12 di FIGURA 1.3. Con il nostro esperimento troviamo che è impossibile scegliere la luce in modo tale da poter dire attraverso quale foro è passato l’elettrone, e allo stesso tempo non perturbarne la distribuzione. Fu suggerito da Heisenberg che le allora nuove leggi della natura potevano risultare coerenti solo se esisteva una basilare limitazione nelle nostre possibilità sperimentali, non riconosciuta precedentemente. Egli propose, come principio generale, il suo principio di indeterminazione, che possiamo enunciare come segue riferendoci al nostro esperimento: «È impossibile costruire un apparato per determinare da quale foro è passato l’elettrone, e che allo stesso tempo non perturbi l’elettrone sufficientemente da distruggere l’interferenza». Se un apparecchio è capace di determinare da quale foro è passato l’elettrone, non può essere così delicato da non alterare in modo essenziale la figura d’interferenza. Nessuno ha mai trovato (né immaginato) un modo di sfuggire al principio di indeterminazione. Così noi dobbiamo ammettere che esso rappresenti una caratteristica fondamentale della natura. L’intera teoria della meccanica quantistica che ora usiamo per descrivere gli atomi, e quindi tutta la materia, dipende dalla correttezza del principio di indeterminazione. Poiché la meccanica quantistica è una teoria che ha avuto così tanti successi, la nostra fiducia nel principio di indeterminazione è rafforzata. Ma se si dovesse scoprire un modo di «demolire» il principio di indeterminazione, la meccanica quantistica darebbe risultati incoerenti e non potrebbe più essere considerata come una valida teoria della natura. «Ebbene», voi direte, «cosa ne è della Proposizione A? È vero, o non è vero, che l’elettrone passa o attraverso il foro 1 oppure attraverso il foro 2?». La sola risposta che si può dare è che l’esperienza c’insegna che per non incorrere in contraddizioni è necessario ragionare in un certo modo particolare. Ciò che dobbiamo dire (per evitare di fare predizioni errate) è quanto segue. Se si guardano i fori o, più precisamente, se si ha un apparato che è capace di determinare se gli elettroni passano attraverso il foro 1 o il foro 2, allora si può dire attraverso quale foro è passato
9
10
Capitolo 1 • Comportamento quantistico
x
x P12
P12 (mediata)
© 978-8808-22107-0
ciascun elettrone. Ma, quando non si prova a determinare da che parte passa l’elettrone, quando non c’è niente nell’esperimento che perturbi l’elettrone, allora non si può dire se l’elettrone passa attraverso il foro 1 oppure il foro 2. Se si afferma ciò, e lo si prende come punto di partenza per una qualsiasi deduzione, si faranno degli errori nella propria analisi. Questa, dal punto di vista logico, è la fune sulla quale dobbiamo camminare se vogliamo descrivere la natura con successo.
(b)
(a)
Se il moto di tutta la materia – come degli elettroni – deve essere descritto in termini di onde, cosa possiaFIGURA 1.5 Figura di interferenza con proiettili: (a) effettiva (schematizzata), mo dire per i proiettili del nostro primo esperimento? (b) osservata. Perché non abbiamo visto frange d’interferenza in quel caso? Si trova che, per le pallottole, le lunghezze d’onda erano così piccole da rendere le frange d’interferenza molto sottili e fitte. Così fitte, in realtà, da non poter distinguere con alcun rilevatore di dimensioni finite i vari massimi e minimi. Quello che abbiamo osservato era solo una sorta di media, che è la curva classica. In FIGURA 1.5 abbiamo provato a indicare schematicamente ciò che accade con oggetti di grandi dimensioni. La FIGURA 1.5a mostra la distribuzione di probabilità per i proiettili come la si può calcolare dalla meccanica quantistica. Le rapide oscillazioni sono intese a rappresentare lo schema di interferenza che si ottiene per onde di lunghezza d’onda molto piccola. Ogni rilevatore fisicamente realizzabile, tuttavia, media diverse oscillazioni della curva di probabilità, di modo che la misura riproduce la curva continua disegnata nella FIGURA 1.5b.
1.7
Principi base della meccanica quantistica
Scriveremo adesso un sommario delle principali conclusioni dei nostri esperimenti. Porremo, tuttavia, i risultati in una forma che li rende veri per una classe più generale di tali esperienze. Possiamo stendere il nostro sommario più semplicemente se prima definiamo come «esperimento ideale» quello in cui non c’è alcuna influenza esterna imprecisata; cioè non deve esserci alcuna vibrazione o altro di cui non sappiamo tener conto. Per essere del tutto precisi bisognerebbe dire: «un esperimento ideale è un esperimento in cui tutte le condizioni iniziali e finali sono completamente specificate». Ciò che designeremo come un «evento» è, in generale, proprio un insieme particolare di condizioni iniziali e finali. (Per esempio: «un elettrone parte dalla sorgente, raggiunge il rilevatore, e non accade nient’altro».) E veniamo adesso al sommario. Sommario
1 La probabilità di un evento in un esperimento ideale è data dal quadrato del modulo di un numero complesso che viene detto ampiezza di probabilità: P = probabilità = ampiezza di probabilità P=| |
(1.6)
2
2 Quando un evento può avvenire secondo varie alternative, l’ampiezza di probabilità per l’evento è la somma delle ampiezze di probabilità per le varie alternative considerate separatamente. Si ha perciò interferenza: = 1+ 2 (1.7) P = | 1 + 2 |2
1.8 • Il principio di indeterminazione
© 978-8808-22107-0
3 Se si effettua un esperimento capace di determinare se una o l’altra delle possibili alternative è effettivamente realizzata, la probabilità per l’evento è la somma delle probabilità per ciascuna delle alternative. Non si ha più interferenza: P = P1 + P2
(1.8)
Qualcuno potrebbe ancora domandare: «Come funziona tutto ciò? Qual è il meccanismo che sta dietro a questa legge?». Nessuno ha mai trovato un tale meccanismo. Nessuno può «spiegare» niente di più di quanto abbiamo «spiegato» noi. Nessuno vi saprà dare una rappresentazione più approfondita della situazione. Non abbiamo idea di un meccanismo più fondamentale da cui questi risultati possano essere dedotti. Vogliamo sottolineare una differenza molto importante tra la meccanica classica e quella quantistica. Abbiamo parlato di probabilità che in una data situazione un elettrone arrivi. Abbiamo con ciò voluto implicare che con il nostro dispositivo sperimentale (anche con il migliore possibile) non siamo in grado di predire esattamente ciò che accadrà. Possiamo solo dare delle probabilità! Se ciò è vero, ne segue che la fisica deve rinunciare all’idea di voler prevedere esattamente ciò che accadrà in una data situazione. Sì! La fisica vi ha rinunciato. Non sappiamo prevedere ciò che accadrà in una data situazione, anzi adesso crediamo che ciò sia impossibile, e che l’unica cosa che siamo in grado di prevedere è la probabilità di eventi differenti. Si deve riconoscere che questo è un ripiegamento rispetto al nostro antico ideale di comprensione della natura. Può darsi che sia un passo indietro, ma nessuno ha trovato il modo di evitarlo. Facciamo ora qualche considerazione su una proposta che è stata avanzata più volte per cercare di evitare la descrizione che abbiamo dato: «Forse l’elettrone ha qualche strano meccanismo dentro di sé, qualche variabile interna, che noi ancora non conosciamo. Forse questa è la ragione per cui non possiamo prevedere ciò che avverrà. Se potessimo guardare più da vicino l’elettrone, saremmo in grado di dire dove andrà a finire». Per quel che ne sappiamo, ciò è impossibile. Ci sarebbero ancora delle difficoltà. Supponiamo di essere portati ad assumere che dentro l’elettrone vi sia un qualche meccanismo che determini dove questo andrà a finire. Questo meccanismo deve anche fissare per quale foro esso andrà a passare nella sua traiettoria. Ma non dobbiamo dimenticare che ciò che è dentro l’elettrone non può dipendere da ciò che noi facciamo, e in particolare dal nostro aprire o chiudere uno dei fori. Perciò, se un elettrone, prima di partire, ha già deciso (a) quale foro userà e (b) dove andrà a finire, dovremmo trovare P1 per quegli elettroni che hanno scelto il foro 1, P2 per quelli che hanno scelto il foro 2, e necessariamente la somma P1 + P2 per quelli che arrivano attraverso i due fori. Non sembrano esistere altre alternative. Ma noi abbiamo verificato sperimentalmente che ciò non è vero. E nessuno è riuscito a immaginare una soluzione per questo enigma. Perciò oggi dobbiamo limitarci a calcolare probabilità. Diciamo «oggi», ma sospettiamo molto fortemente che questo stato di cose ci accompagnerà sempre, che sia impossibile risolvere questo enigma e che questo sia il vero modo di essere della natura.
1.8
Il principio di indeterminazione
La formulazione originale di Heisenberg del principio di indeterminazione è la seguente: se eseguendo la misura per un oggetto qualsiasi, si riesce a determinare la componente x del suo impulso con un’incertezza p, non si può, contemporaneamente, conoscere la sua coordinata x di posizione con una precisione x più accurata di x
~ 2 p
dove ~ è un numero ben definito, dato dalla natura. Esso è detto «costante di Planck ridotta» ed è approssimativamente uguale a 1,05 · 10 34 J·s. In altre parole, se consideriamo le incertezze nella posizione e nell’impulso, in ogni istante il loro prodotto deve essere maggiore o uguale alla metà della costante di Planck ridotta: ~ x p 2
11
12
Capitolo 1 • Comportamento quantistico
© 978-8808-22107-0
Questo è un caso particolare del principio di indeterminazione che è stato formulato precedentemente in forma più generale. La formulazione più generale afCuscinetti fermava che non si possono costruire apparecchi in pa grado di stabilire quale di due alternative è realizza∆px pb ta, senza, allo stesso tempo, distruggere le frange di 1 Rilevatore interferenza. Mostriamo in un caso particolare che il tipo di relazione data da Heisenberg deve essere valida al fiCannone 2 elettronico pa ne di evitare di trovarsi nei pasticci. Immaginiamo Libertà di ∆px una modifica dell’esperimento di FIGURA 1.3, in cui lo muovimento pb schermo con i fori è costituito da una lamina montata Cuscinetti su cuscinetti in modo da potersi muovere liberamente Parete Tabellone in su e in giù (in direzione dell’asse x), come è mostrato in FIGURA 1.6. Osservando attentamente il moto della lamina possiamo provare a determinare attraverFIGURA 1.6 Esperimento nel quale si misura il rinculo della parete. so quale foro passa un elettrone. Immaginate infatti cosa accade quando il rilevatore è posto in x = 0. Ci dobbiamo aspettare che un elettrone che passa per il foro 1 debba essere deflesso verso il basso dalla lamina per poter arrivare al rilevatore. Poiché la componente verticale dell’impulso dell’elettrone è variata, la lamina deve muoversi in direzione opposta con lo stesso impulso. La lamina riceverà quindi una spinta verso l’alto. Se invece l’elettrone passa attraverso il foro inferiore, la lamina dovrebbe subire una spinta verso il basso. È chiaro che per ogni posizione del rilevatore, l’impulso ricevuto dalla lamina avrà un valore differente a seconda che l’elettrone attraversi il foro 1 o il foro 2. Proprio così! Senza per nulla perturbare gli elettroni, ma solo osservando la lamina, possiamo determinare il percorso scelto dall’elettrone. Ma per fare questo occorre conoscere l’impulso dello schermo, prima che l’elettrone lo attraversi. Cosicché, quando misuriamo l’impulso dopo il passaggio dell’elettrone, possiamo ricostruire di quanto è variato l’impulso della lamina. Ma ricordiamoci che, in base al principio di indeterminazione, non possiamo allo stesso tempo conoscere con una precisione arbitraria la posizione della lamina. Ma se non sappiamo esattamente dove sia la lamina, non sappiamo neppure dire con precisione dove siano i due fori. Essi saranno in diverse posizioni per ogni elettrone che li attraversa. Questo significa che il centro delle frange di interferenza avrà una posizione differente per i vari elettroni. Le oscillazioni del grafico di interferenza tenderanno ad appiattirsi. Dimostreremo quantitativamente nel prossimo capitolo che, se determiniamo l’impulso della lamina con precisione sufficiente a determinare, mediante l’osservazione del rimbalzo, quale foro è stato attraversato, allora l’incertezza sulla coordinata x della lamina sarà, secondo il principio di indeterminazione, sufficiente a fare oscillare su e giù lungo l’asse x le frange di interferenza osservate con il rilevatore, di un tratto circa uguale alla distanza da un massimo al minimo più prossimo. Un tale movimento, che avviene a caso, è giusto sufficiente a distruggere le oscillazioni del grafico e quindi a far sì che non si osservi più interferenza. Il principio di indeterminazione «sta a difesa» della meccanica quantistica. Heisenberg riconobbe che, se fosse possibile misurare simultaneamente impulso e posizione con una maggiore accuratezza, la meccanica quantistica crollerebbe. Perciò avanzò l’ipotesi che fosse impossibile. Allora molti si misero a tavolino cercando di inventare maniere di farlo, ma nessuno ha mai trovato un modo di misurare la posizione e l’impulso di un oggetto qualsiasi – uno schermo, un elettrone, una palla da biliardo, o altro – con maggiore precisione. La meccanica quantistica continua la sua pericolosa ma tuttora giustificata esistenza.
2
Relazione tra il punto di vista ondulatorio e quello corpuscolare
Questo capitolo è quasi del tutto uguale al cap. 38 del vol. 1.
2.1
Ampiezze d’onda di probabilità
In questo capitolo discuteremo la relazione tra il punto di vista ondulatorio e quello corpuscolare. Già sappiamo, dal precedente capitolo, che né la rappresentazione ondulatoria né quella corpuscolare sono corrette. A noi piacerebbe sempre poter presentare le cose esattamente, o almeno in forma abbastanza precisa da non doverle poi modificare quando ne sapremo di più: in modo da dover eventualmente fare delle generalizzazioni, ma non dei cambiamenti radicali! Ma i discorsi che si possono fare a proposito del punto di vista ondulatorio e di quello corpuscolare, che sono entrambi approssimativi, sono destinati a subire delle modifiche. Perciò quanto impareremo in questo capitolo non sarà, in un certo senso, del tutto giusto; faremo uso di ragionamenti semiintuitivi che saranno resi più precisi in seguito. Ma alcune cose dovranno essere modificate un poco quando le inquadreremo correttamente nell’ambito della meccanica quantistica. Procediamo in questo modo perché voi abbiate una prima idea qualitativa di alcuni fenomeni quantistici prima di sviluppare i dettagli matematici della meccanica quantistica stessa. Inoltre, poiché tutte le nostre esperienze sono realizzate con onde e particelle, è più comodo, quando ancora non si conosce completamente il formalismo delle ampiezze quantistiche, procedere con i concetti ondulatori e corpuscolari per arrivare a una certa comprensione di ciò che accade in determinate circostanze. Lungo tutta l’esposizione cercheremo di indicare quali sono i punti deboli, ma la maggior parte di essa è quasi perfettamente corretta; si tratta semplicemente di una questione di interpretazione. Anzitutto sappiamo che la novità della rappresentazione del mondo in meccanica quantistica, la nuova teoria, consiste nell’assegnare un’ampiezza a ogni evento possibile, e se l’evento riguarda l’arrivo di una particella, allora si può assegnare l’ampiezza relativa alla rivelazione di quella particella in punti diversi e a tempi diversi. La probabilità di trovare la particella è allora proporzionale al modulo quadrato dell’ampiezza. In generale, l’ampiezza di probabilità di rivelare una particella in punti diversi e a tempi diversi varia con la posizione e il tempo. In qualche caso particolare può avvenire che l’ampiezza vari sinusoidalmente nello spazio e nel tempo come ei(!t k · r ) , dove r è il vettore di posizione a partire da una data origine. (Non dimenticate che queste ampiezze sono numeri complessi, non reali.) Una tale ampiezza varia con frequenza ! e numero d’onda k ben definiti. Si trova allora che questo caso corrisponde, nel limite classico, a una situazione in cui avremmo pensato di avere a che fare con una particella di energia E nota e legata alla frequenza dalla relazione E = ~!
(2.1)
e di impulso p anch’esso noto e correlato al numero d’onde da p = ~k (Il simbolo ~ rappresenta il numero h diviso per 2⇡: ~ = h/2⇡.)
(2.2)
14
Capitolo 2 • Relazione tra il punto di vista ondulatorio e quello corpuscolare
© 978-8808-22107-0
Questo significa che il concetto di particella ha delle limitazioni. Il concetto di particella, ovvero la sua posizione, il suo impulso ecc., che ∆x usiamo così spesso, non è completamente soddisfacente. Per esempio, se l’ampiezza di trovare una particella in punti diversi è data da ei(!t k · r ) , il suo modulo quadrato è una costante, e ciò vuol dire che la probabilità di trovare la particella è la stessa in tutti i punti. Questo comporta a sua volta che non possiamo sapere dove essa sia – può essere in un punto qualsiasi – e vi è una grande incertezza circa la sua posizione. FIGURA 2.1 Pacchetto d’onde di lunghezza �x. D’altro canto, se la posizione di una particella è più o meno ben conosciuta e possiamo prevederla abbastanza accuratamente, allora la probabilità di trovarla in punti diversi deve essere ristretta a una regione limitata, la cui lunghezza indicheremo con x. All’esterno di tale regione la probabilità è zero. Ora, questa probabilità è il modulo quadrato di un’ampiezza, e se il modulo quadrato è zero, anche l’ampiezza è zero, cosicché abbiamo un treno d’onde di lunghezza x (FIGURA 2.1), mentre la lunghezza d’onda propria del treno (cioè la distanza tra due nodi successivi delle onde) è quella che corrisponde all’impulso della particella. Qui ci s’imbatte in un fenomeno strano riguardante le onde; una cosa molto semplice che non ha nulla a che fare con la meccanica quantistica in senso stretto. Si tratta di una questione che chiunque lavori con le onde conosce, anche se non conosce la meccanica quantistica: cioè, che non è possibile definire un’unica lunghezza d’onda per un treno d’onde che sia corto. Quest’ultimo non può avere una lunghezza d’onda definita; si ha un’ambiguità nella definizione del numero d’onda, dovuta proprio alla lunghezza finita del treno, e quindi un’ambiguità nella definizione dell’impulso.
2.2
Misure di posizione e di impulso
Consideriamo due esempi relativi a tale questione – per vedere, se la meccanica quantistica è corretta, quale sia la ragione per la quale vi è una incertezza sulla posizione e (oppure) sull’impulso. Abbiamo già osservato C in precedenza che se una cosa del genere non accadesse – se cioè fosse possibile misurare simultaneamente la posizione e l’impulso di un oggetto qualsiasi – si giungerebbe a un paradosso; è una fortuna che tale paradosso B non si verifichi, e proprio il fatto che questa indeterminazione venga fuori in modo naturale nella rappresentazione ondulatoria, mostra che tutti i ragionamenti sono mutuamente coerenti. Ecco ora un esempio che mostra la relazione tra la posizione e l’impulso in una situazione facilmente comprensibile. Supponiamo di avere una fenditura e delle particelle che arrivano da un punto molto lontano con una certa energia, di modo che esse incidano lungo una direzione che posFIGURA 2.2 Diffrazione di particelle che attraversano una fenditura. siamo considerare orizzontale (FIGURA 2.2). Ci vogliamo concentrare sulle componenti verticali dell’impulso. In senso classico, tutte queste particelle hanno un impulso orizzontale, diciamo p0 . Dunque, classicamente, la componente verticale py dell’impulso, prima che la particella attraversi il foro, è conosciuta perfettamente. La particella non si muove né verso l’alto né verso il basso, perché proviene da una sorgente lontanissima, e così la componente verticale dell’impulso è ovviamente nulla. Ma supponiamo ora che essa attraversi una fenditura di larghezza B. Dopo che essa ha oltrepassato la fenditura, noi ne conosciamo la posizione verticale, cioè la coordinata y, con considerevole precisione, cioè B(1) . Quindi, l’indeterminazione y sulla posizione è dell’ordine di ±B. Ma saremmo anche tentati di affermare, poiché sappiamo che l’impulso è perfettamente orizzontale, che py è zero; ma ciò non è vero. Noi prima sapevamo che l’impulso era orizzontale, ma ora non lo sappiamo più. Prima che le particelle attraversassero (1) Più precisamente, l’errore nella nostra conoscenza di y è ±B/2. Ma a noi qui interessa solo la linea generale del ragionamento, e quindi possiamo tralasciare i fattori 2.
2.2 • Misure di posizione e di impulso
© 978-8808-22107-0
la fenditura, non conoscevamo la loro posizione verticale. Ora che conosciamo la loro posizione verticale, in base al fatto che sono passate attraverso il foro, abbiamo perso l’informazione circa la componente verticale dell’impulso! Perché? Secondo la teoria ondulatoria, vi è uno sparpagliamento, o diffrazione, delle onde dopo aver attraversato la fenditura, proprio come succede per la luce. Quindi c’è una certa probabilità che le particelle uscenti dalla fenditura non vengano fuori perfettamente diritte. Il fascio si allarga per effetto della diffrazione, e la sua apertura, che possiamo definire come l’angolo corrispondente al primo minimo, è una misura dell’indeterminazione angolare nella situazione finale. Come si allarga il fascio? Dire che si allarga significa che le particelle hanno qualche possibilità di muoversi verso l’alto o il basso, cioè di avere una componente dell’impulso verso l’alto o il basso. Diciamo possibilità e particella perché possiamo osservare la figura di diffrazione con un rilevatore di particelle, e quando il rilevatore ne segnala una, poniamo in C nella FIGURA 2.2, a esso è giunta l’intera particella, di modo che, dal punto di vista classico, questa deve avere una componente verticale dell’impulso per poter arrivare dalla fenditura fino a C. Per farci un’idea approssimativa della variazione dell’impulso, osserviamo che la componente verticale dell’impulso py è dell’ordine di p0 ✓, dove p0 è l’impulso orizzontale. Ma quant’è grande ✓ nella figura di diffrazione? Sappiamo che il primo minimo corrisponde a un angolo ✓ tale che le onde provenienti da un estremo della fenditura debbano percorrere una lunghezza d’onda in più di quelle che provengono dall’altro estremo – abbiamo già studiato questo fatto in precedenza (cap. 30 del vol. 1). Perciò ✓ è /B e, conseguentemente, in questo esperimento py è p0 /B. Notate che se facciamo B più piccolo, cioè se si aumenta la precisione della misura di posizione della particella, la figura di diffrazione si allarga ancora di più. Dunque, più stretta rendiamo la fenditura, più si sparpaglia il fascio, e più aumenta la probabilità di trovare che la particella ha una componente trasversale dell’impulso. Quindi l’indeterminazione nella componente verticale dell’impulso è inversamente proporzionale all’indeterminazione in y. Infatti, vediamo che il prodotto delle due è uguale a p0 . Ma è la lunghezza d’onda e p0 è l’impulso e, secondo la meccanica quantistica, il prodotto della lunghezza d’onda per l’impulso è uguale alla costante h di Planck. Otteniamo così la regola che il prodotto delle indeterminazioni nella componente verticale dell’impulso e della posizione è dell’ordine di h: y py
~ 2
(2.3)
Non possiamo realizzare un sistema che ci permetta di determinare la posizione verticale di una particella e di predire come essa si muoverà in direzione verticale con precisione maggiore di quella data dalla (2.3). In altre parole, l’incertezza nella componente verticale dell’impulso deve essere maggiore di ~/2 y, dove y è l’indeterminazione nella conoscenza della posizione. Ogni tanto si sente dire che la meccanica quantistica è tutta sbagliata. Quando la particella è arrivata da sinistra, il suo impulso verticale era zero. E ora che è passata attraverso la fenditura se ne conosce la posizione. Quindi, sia la posizione sia l’impulso sembrano noti con precisione arbitraria. È senz’altro vero che possiamo rivelare una particella, e all’atto della rivelazione determinarne la posizione e quale deve essere stato il suo impulso per farla arrivare là. Questo è vero, ma non è questo ciò a cui si riferisce la relazione di indeterminazione (2.3). L’equazione (2.3) si riferisce alla possibilità di predizione in una certa situazione, e non a osservazioni sul passato. Non serve a niente dire: «Io conoscevo l’impulso prima che la particella attraversasse la fenditura, e adesso conosco la sua posizione», perché ora si è perduta la conoscenza dell’impulso. Il fatto che essa è passata attraverso la fenditura non ci permette più di prevedere la componente verticale dell’impulso. Noi stiamo parlando di una teoria predittiva, non semplicemente di misure a posteriori. Perciò dobbiamo parlare di ciò che possiamo prevedere. Esaminiamo ora il problema da un altro punto di vista. Consideriamo un altro esempio dello stesso fenomeno, un po’ più quantitativamente. Nel caso precedente abbiamo misurato l’impulso con un metodo classico. Precisamente, abbiamo considerato la direzione, la velocità, gli angoli ecc., e abbiamo così ricavato l’impulso con un’analisi classica. Ma, poiché l’impulso è legato al numero d’onda, esiste in natura anche un altro modo di determinare l’impulso di una particella – un fotone o altro – che non ha un analogo classico, perché sfrutta l’equazione (2.2). Misuriamo la lunghezza d’onda delle onde. Proviamo allora a determinare l’impulso in questo modo.
15
16
Capitolo 2 • Relazione tra il punto di vista ondulatorio e quello corpuscolare
Supponete di avere un reticolo con un grande numero di linee (FIGURA 2.3), e di indirizzare sul reticolo un fascio di particelle. Noi abbiamo spesso discusso questo problema; se le particelle hanno un impulso definito, si ottiene una figura ben definita in una certa direzione, a causa dell’interferenza. E abbiamo anche parlato della precisione con cui si può ricavare quell’impulso, cioè del potere risolutivo di un tale reticolo. Piuttosto che ricavare nuovamente la formula, rimandiamo al cap. 30 del vol. 1, dove abbiamo visto che con un dato reticolo la lunghezza d’onda può essere misurata con un errore relativo dato da 1/N m, dove N è il numero di linee del reticolo e m è l’ordine della figura di diffrazione. Cioè
Nmλ = L
=
2.3 Determinazione dell’impulso mediante l’uso di un reticolo di diffrazione. FIGURA
© 978-8808-22107-0
1 Nm
(2.4)
Possiamo riscrivere la formula (2.4) nella forma 2
=
1 Nm
=
1 L
(2.5)
dove L è la distanza mostrata nella FIGURA 2.3. Questa distanza è la differenza tra la distanza totale che la particella, l’onda, o quello che è, deve percorrere se essa è riflessa dal fondo del reticolo e la distanza che deve percorrere se invece è riflessa dalla cima. In altri termini, le onde che formano la figura di diffrazione sono onde provenienti da parti differenti del reticolo. Le prime che arrivano provengono dall’estremo inferiore del reticolo e dal fronte anteriore del treno d’onde, mentre il resto, partito da altri punti del reticolo, proviene da parti successive del treno d’onde, fino a quando non arriva l’ultima, che corrisponde a un punto del treno d’onde a distanza L dal fronte anteriore. Quindi per ottenere una linea netta nel nostro spettro corrispondente a un valore preciso dell’impulso, e con un errore dato dalla (2.4), dobbiamo avere un treno d’onde lungo almeno L. Se il treno d’onde è troppo corto, non viene sfruttato l’intero reticolo. Le onde che formano lo spettro sono quelle riflesse solamente da una porzione molto corta del reticolo e questo non funziona bene e quindi si ottiene una grande imprecisione nell’angolo. Per averne una minore dobbiamo far uso dell’intero reticolo, in modo che almeno in qualche istante l’intero treno d’onde si diffonda simultaneamente da tutte le parti del reticolo. Dunque il treno d’onde deve essere di lunghezza L al fine di ottenere un’imprecisione nella lunghezza d’onda minore di quella data dalla (2.5). Per inciso, 1 k = = (2.6) 2 2⇡ Ne segue che 2⇡ k= (2.7) L dove L è la lunghezza del treno d’onde. Ciò significa che per un treno d’onde di lunghezza inferiore a L, l’incertezza sul numero d’onde sarà maggiore di 2⇡/L. O anche, l’incertezza sul numero d’onde moltiplicato per la lunghezza del treno d’onde – che per il momento indicheremo con x – sarà maggiore di 2⇡. L’abbiamo chiamata x perché essa rappresenta l’indeterminazione sulla posizione della particella. Se il treno d’onde è di lunghezza finita, allora è entro questi limiti che può trovarsi la particella, con un’indeterminazione x. In effetti questa proprietà, che il prodotto della lunghezza del treno d’onde per l’imprecisione sul numero d’onde associato a esso è almeno 2⇡, è un fenomeno noto a chiunque studi le onde. Non ha niente a che vedere con la meccanica quantistica. Si tratta semplicemente del fatto che se si ha un treno di lunghezza finita, non sappiamo contare le onde in esso contenute con grande precisione. Cerchiamo di capire in altro modo la ragione di questo fatto. Supponiamo di avere un treno finito di lunghezza L; allora, per effetto del modo con cui esso si smorza agli estremi (FIGURA 2.1), il numero di onde nella lunghezza L è incerto di qualcosa come ±1. Ma il numero di onde in L è k L/2⇡. Dunque il valore di k è incerto, e si ottiene di nuovo il risultato (2.7), il che è solo una proprietà delle onde. Lo stesso fenomeno si riscontra sia che si tratti di onde nello spazio, con k
2.3 • Diffrazione dai cristalli
© 978-8808-22107-0
uguale al numero di radianti al centimetro e L uguale alla lunghezza del treno, sia che si tratti di onde nel tempo con ! uguale al numero di oscillazioni al secondo e T uguale alla «lunghezza» del tempo durante il quale giungono le onde. Cioè, se si ha un treno d’onde che dura solo per un tempo finito T, allora l’indeterminazione nella frequenza è data da !=
2⇡ T
(2.8)
Abbiamo cercato di sottolineare che queste sono semplicemente proprietà delle onde, e, per esempio, esse sono ben note nella teoria del suono. Il punto importante è che in meccanica quantistica si interpreta il numero d’onde come una misura dell’impulso della particella, in base alla relazione p = ~k, di modo che la formula (2.7) ci dice che h p⇡ x Questa è dunque una limitazione del concetto classico di impulso. (È naturale che esso debba essere in qualche modo rimaneggiato se vogliamo rappresentare con onde delle particelle!) Ed è bello il fatto che abbiamo trovato una relazione che ci dà una qualche idea del punto in cui i concetti classici vengono a trovarsi in difetto.
2.3
Diffrazione dai cristalli
Consideriamo ora la riflessione delle particelle-onde su un cristallo. Un cristallo è un oggetto massiccio composto di un grande insieme di atomi simili – in seguito introdurremo qualche complicazione – disposti in bell’ordine. Il problema è quello di sistemare i piani cristallini in modo da ottenere d un forte picco di diffrazione in una data direzione e per un dato raggio, diciamo, di luce (raggi X), elettroni, neutroni, o qualsiasi altra cosa. Per ottenere un’intensa riflessione, le onde diffuse da tutti gli atomi debbono essere in fase. Non può esserci un uguale numero di onde in fase e fuori fase, altrimenti esse si annullano a vicenda. Il modo di aggiustare le cose è quello di trovare le regioni dove la fase è costante, come abbiamo già spiegato; queste sono i piani che formano angoli uguali con le direzioni iniziale e finale (FIGURA 2.4). Se consideriamo due piani paralleli, come nella FIGURA 2.4, le onde FIGURA 2.4 Diffusione di onde da parte dei piani diffuse dai due piani saranno in fase, purché la differenza dei percorsi per reticolari di un cristallo. un dato fronte d’onda sia uguale a un numero intero di lunghezze d’onda. Si vede che questa differenza è uguale a 2d sen ✓, dove d è la distanza tra i due piani. Perciò, la condizione per una riflessione coerente è 2d sen ✓ = n
(n = 1, 2, . . . )
(2.9)
Se, per esempio, succede che gli atomi del cristallo giacciono in piani che soddisfano alla condizione (2.9) con n = 1, si otterrà una forte riflessione. Se, d’altro canto, ci sono altri atomi della stessa natura (con uguale densità) interposti a metà strada tra i due, allora i piani intermedi diffonderanno anch’essi le onde con uguale intensità e interferiranno con gli altri producendo un effetto totale nullo. Perciò d nella (2.9) va riferita a piani adiacenti; non possiamo prendere un piano cinque strati sotto e usare questa formula! Può essere interessante rilevare che i cristalli reali non sono in generale così semplici come se fossero costituiti da una sola specie di atomi ripetuti con un certo schema. Al contrario, ricorrendo a un analogo in due dimensioni, essi assomigliano molto a una carta da parati, sulla quale una certa figura è ripetuta in lungo e in largo. Per «figura» s’intende, nel caso degli atomi, una struttura – un atomo di calcio, uno di carbonio, tre di ossigeno per il carbonato di calcio, e così via – che può comprendere un numero relativamente grande di atomi. Ma qualunque essa sia, la figura è ripetuta secondo uno schema regolare. Questa figura base viene detta cella elementare.
17
18
2.5 Figura di diffrazione di raggi X: diffusione da salgemma. FIGURA
2.6 Figura di diffrazione di raggi X: diffusione da mioglobina. FIGURA
Capitolo 2 • Relazione tra il punto di vista ondulatorio e quello corpuscolare
© 978-8808-22107-0
Lo schema base di ripetizione definisce quello che si chiama il tipo di reticolo; il tipo di reticolo può essere subito determinato osservando le figure di diffrazione e rilevandone le proprietà di simmetria. In altre parole, dalla posizione delle figure di diffrazione, comunque esse siano fatte, si può determinare il tipo di reticolo; mentre per risalire a cosa ci sia in ognuno degli elementi del reticolo bisogna prendere in considerazione l’intensità di diffusione nelle varie direzioni. In quali direzioni si abbia la diffrazione è qualcosa che dipende dal tipo di reticolo, mentre quanto è intensa la radiazione nelle varie direzioni è determinato da quello che c’è in ogni cella elementare, e in questo modo si ricostruisce la struttura del cristallo. Le FIGURE 2.5 e 2.6 mostrano due fotografie di figure di diffrazione di raggi X; esse illustrano rispettivamente la diffrazione da salgemma e da mioglobina. Per inciso, un caso interessante si ha quando la distanza di due piani adiacenti è minore di /2. In tali condizioni la (2.9) non ammette soluzioni per n. Quindi, se è maggiore del doppio della distanza tra due piani adiacenti, non compaiono lateralmente figure di diffrazione, ma la luce – o quello che è – passerà diritta attraverso il materiale senza deviare o andare perduta. Così, nel caso della luce, la cui lunghezza d’onda è molto maggiore della separazione tra i piani, essa passa senz’altro indisturbata, e non si hanno figure di diffrazione dai piani del cristallo. Questo fatto ha anche una conseguenza interessante nel caso dei reattori che producono neutroni (i quali sono senza dubbio particelle, a detta di tutti!). Se prendiamo questi neutroni e li facciamo incidere su un lungo blocco di grafite, essi si diffondono e si fanno strada all’interno (FIGURA 2.7). Si diffondono perché sono respinti dagli atomi, ma più precisamente, secondo la teoria ondulatoria, è la diffrazione dai piani cristallini che fa sì che gli atomi li respingano. Quello che si trova è che, se si prende un pezzo molto lungo di grafite, i neutroni che riemergono all’estremo opposto sono tutti di lunghezza d’onda molto grande! Precisamente, se si fa un grafico dell’intensità in funzione della lunghezza d’onda, si ottiene zero tranne che per lunghezze d’onda maggiori di un certo minimo (FIGURA 2.8). In altri termini, in questo modo si possono ottenere neutroni molto lenti. Solo i neutroni più lenti escono; essi non sono diffratti né diffusi dai piani cristallini della grafite, ma la trapassano in linea retta proprio come la luce attraversa il vetro, e non vengono deviati lateralmente all’esterno. Si hanno molte altre dimostrazioni della natura ondulatoria dei neutroni così come di altre particelle.
2.4
Le dimensioni di un atomo
Consideriamo ora un’altra applicazione del principio di indeterminazione, equazione (2.3). Questo esempio non va preso troppo sul serio; l’idea è giusta, ma l’analisi non è condotta molto rigorosamente. L’idea riguarda la determinazione delle dimensioni degli atomi e il fatto che, classicamente, gli elettroni dovrebbero irradiare luce e cadere a spirale fino a posarsi sul nucleo. Ma tutto ciò non può essere corretto dal punto di vista della meccanica quantistica perché allora saremmo in grado di sapere dov’era ciascun elettrone e con quale velocità si muoveva. Supponiamo di avere un atomo di idrogeno, e di misurare la posizione dell’elettrone; noi non saremo in grado di stabilire esattamente dove esso sia, altrimenti l’indeterminazione sull’impulso risulterebbe infinita. Ogni volta che osserviamo l’elettrone, esso è da qualche parte ma ha un’ampiezza non nulla in punti diversi, di modo che c’è una probabilità non nulla di trovarlo in posti differenti. Questi punti non possono essere tutti nel nucleo; supporremo che ci sia un’indetermi-
2.7 Diffusione di neutroni prodotti in un reattore attraverso un blocco di grafite.
FIGURA
Neutroni con λ corta
Pila
2.8 Intensità dei neutroni uscenti da una barra di grafite in funzione della lunghezza d’onda.
Grafite
Intensità Neutroni con λ lunga
FIGURA
λmin Neutroni con λ corta
λ
2.4 • Le dimensioni di un atomo
© 978-8808-22107-0
nazione nella posizione di ordine a. Ovvero, la distanza dell’elettrone dal nucleo sia per lo più uguale a circa a. Determineremo a imponendo che l’energia totale dell’atomo sia minima. L’incertezza sull’impulso, per il principio di indeterminazione, è grosso modo ~/a, cosicché se misuriamo l’impulso dell’elettrone in qualche modo, per esempio facendo diffondere dei raggi X su di esso e osservando l’effetto Doppler da un centro diffusore in moto, non ci aspettiamo di trovare sempre zero – l’elettrone non sta fermo – bensì l’impulso deve essere dell’ordine di p ⇡ ~/a. Perciò l’energia cinetica sarà circa 1 p2 ~2 mv 2 = = 2 2m 2ma2 (In un certo qual modo, questa è una sorta di analisi dimensionale per trovare la dipendenza dell’energia cinetica dalla costante di Planck, da m e dalle dimensioni dell’atomo. Non dobbiamo credere al nostro risultato che a meno di fattori come 2, ⇡ ecc. Non abbiamo nemmeno definito con molta precisione a.) Inoltre l’energia potenziale è e2 fratto la distanza dal centro, diciamo e2 /a, dove, secondo la definizione data nel vol. 1, e2 è la carica dell’elettrone al quadrato, divisa per 4⇡✏ 0 . Ora, il fatto è che, se a decresce, l’energia potenziale diminuisce; ma più piccolo è a, più l’impulso deve essere grande, per il principio d’indeterminazione, e quindi maggiore l’energia cinetica. L’energia totale è ~2 e2 E= (2.10) a 2ma2 Noi non conosciamo a, ma sappiamo che l’atomo cercherà di sistemarsi secondo un compromesso che renda l’energia più piccola possibile. Per rendere E minima, deriviamo rispetto ad a, poniamo la derivata uguale a zero e risolviamo in a. La derivata di E è dE = da
~2 e2 + ma3 a2
(2.11)
e ponendo dE/da = 0 si ottiene per a il valore a0 =
~2 = 0,528 Å = 0,528 · 10 me2
10
m
(2.12)
Questa particolare distanza si chiama raggio di Bohr, e così abbiamo imparato che le dimensioni dell’atomo sono dell’ordine dell’angstrom, il che è giusto. Tutto ciò è molto bello – in realtà, stupefacente – perché finora non sapevamo come spiegarci teoricamente le dimensioni dell’atomo! Gli atomi, dal punto di vista classico, sono un assurdo, perché gli elettroni dovrebbero cadere a spirale sul nucleo. Se poniamo il valore (2.12) per a0 nella (2.10) per trovare l’energia, si ottiene E0 =
e2 = 2a0
me4 = 13,6 eV 2~2
(2.13)
Qual è il significato di questa energia negativa? Significa che l’elettrone ha un’energia minore quando è nell’atomo che quando è libero. Significa cioè che è legato. Significa che ci vuole una certa energia per cacciarlo fuori; serve un’energia dell’ordine di 13,6 eV per ionizzare un atomo di idrogeno. Non abbiamo ragione di pensare che non ce ne voglia due o tre volte tanta – o la metà – o (1/⇡) volte questa, perché abbiamo usato un ragionamento tanto impreciso. Però, in realtà, abbiamo barato, in quanto abbiamo preso tutte le costanti in modo da far risultare il numero giusto! Questo numero, 13,6 eV, viene definito come 1 rydberg di energia; esso rappresenta l’energia di ionizzazione dell’idrogeno. Finalmente ora si capisce come mai non cadiamo attraverso il pavimento. Quando camminiamo, le nostre scarpe con la loro massa di atomi pestano il pavimento, e tutti i suoi atomi. Per poter comprimere gli atomi densamente, bisognerebbe confinare gli elettroni in uno spazio minore, ma, per il principio di indeterminazione, ciò porterebbe a impulsi in media maggiori, quindi a energia maggiore; la resistenza alla compressione da parte degli atomi è un effetto quantistico e non classico. Classicamente, ci si aspetta che, avvicinando tra loro gli elettroni e i protoni,
19
20
Capitolo 2 • Relazione tra il punto di vista ondulatorio e quello corpuscolare
© 978-8808-22107-0
l’energia diminuisca, e la migliore sistemazione di cariche positive e negative nella fisica classica si ha quando sono tutte una sull’altra. Questo fatto era ben noto ai fisici classici e l’esistenza degli atomi costituiva un mistero. Naturalmente, i fisici del tempo inventarono qualche sistema per trarsi d’impaccio – ma a noi non interessa, visto che ora conosciamo la risposta giusta! Per inciso, sebbene per il momento non possiamo dare spiegazioni di questo fatto, si trova che, in una situazione in cui ci sono molti elettroni, essi cercano di stare lontani gli uni dagli altri. Se c’è un elettrone in una certa regione di spazio, gli altri se ne tengono al di fuori. Più precisamente, ci sono due stati di spin, e due elettroni possono stare uno sull’altro, il primo con lo spin in un modo, il secondo nell’altro. Ma oltre a questi due non possiamo mettercene altri. Dobbiamo mettere gli altri altrove, e questa è la vera spiegazione della solidità della materia. Se potessimo mettere tutti gli elettroni nello stesso posto, la materia sarebbe ancora più densa di quella che è. È il fatto che gli elettroni non possono stare gli uni sugli altri che rende i tavoli e ogni altra cosa così solida.
2.5
I livelli d’energia
Energia
Abbiamo parlato dell’atomo nella situazione di minima energia possibile, ma si scopre che l’elettrone può fare ben altro. Può vibrare e oscillare con E=0 maggior energia, e quindi ne risultano molti diversi tipi di moto all’inE3 terno dell’atomo. Secondo la meccanica quantistica, in condizioni stazioE2 narie, l’atomo può avere solo certe definite energie. Facciamo un grafico E1 (FIGURA 2.9) in cui riportiamo verticalmente le energie, e tracciamo una linea orizzontale in corrispondenza di ogni valore permesso dell’energia. E0 Quando l’elettrone è libero, cioè quando la sua energia è positiva, questa può assumere un valore qualunque; l’elettrone può muoversi con velocità arbitraria. Ma le energie degli stati legati non sono arbitrarie. L’atomo deve FIGURA 2.9 Diagramma energetico di un atomo che mostra varie transizioni possibili. avere un’energia pari a uno tra un certo insieme di valori permessi, quelli della FIGURA 2.9. Indichiamo i valori permessi dell’energia con E0 , E1 , E2 ed E3 . Se l’atomo si trova inizialmente in uno di questi «stati eccitati», E1 , E2 ecc., non vi rimane indefinitamente. Presto o tardi cade in uno stato più basso e irradia energia sotto forma di luce. La frequenza della luce emessa è determinata dalla conservazione dell’energia più il sottinteso quantistico che la frequenza della luce è legata alla sua energia dalla FIGURA 2.1. Di conseguenza, la frequenza della luce che si libera in una transizione dall’energia E3 all’energia E1 (per esempio) è !31 =
E3
E1 ~
(2.14)
Questa, dunque, è una frequenza caratteristica dell’atomo e definisce una linea dello spettro di emissione. Un’altra transizione possibile è quella da E3 a E0 . A questa corrisponde un’altra frequenza E3 E0 !30 = (2.15) ~ Ancora una diversa possibilità è che l’atomo fosse inizialmente nello stato eccitato E1 e ritorni poi nello stato fondamentale E0 , emettendo un fotone di frequenza !10 =
E1
E0 ~
(2.16)
La ragione per cui abbiamo introdotto tre transizioni è quella di sottolineare una relazione interessante. È facile rilevare dalle (2.14), (2.15) e (2.16) che !30 = !31 + !10
(2.17)
In generale, se troviamo due linee dello spettro, ci possiamo aspettare di trovarne un’altra in corrispondenza della somma delle frequenze (o della differenza), e che tutte le linee possano
© 978-8808-22107-0
2.6 • Conseguenze di natura filosofica
essere interpretate in termini di una serie di livelli, in modo che ogni linea corrisponda alla differenza d’energia tra una coppia di livelli. Questa notevole coincidenza nelle frequenze spettrali fu notata prima della scoperta della meccanica quantistica, e si chiama principio di combinazione di Ritz. Questo principio è un altro mistero per la meccanica classica. Non vogliamo insistere sul fatto che la meccanica classica si rivela un disastro se applicata agli atomi; ci sembra di averlo già dimostrato molto chiaramente. Abbiamo in precedenza trattato la meccanica quantistica in termini di ampiezze, che si comportano come onde, con certe frequenze e numeri d’onda. Vediamo ora come viene fuori, partendo dalle ampiezze, che l’atomo ha stati di energia ben definita. Ciò è qualcosa che non si può comprendere da quanto detto finora, ma siamo tutti al corrente del fatto che onde ristrette a una certa zona di spazio hanno frequenze fisse. Per esempio, se un suono è confinato in una canna d’organo, o qualcosa del genere, allora esso può vibrare in tanti modi, ma per ciascuno di questi modi si ha una frequenza ben precisa. Analogamente, un oggetto nel quale siano confinate delle onde ha certe frequenze di risonanza. È perciò una proprietà delle onde costrette in una regione limitata di spazio che esse esistano solo con frequenze definite; un argomento, questo, che in formule tratteremo in dettaglio più avanti; e, poiché esiste una relazione generale tra le frequenze e le energie, non c’è da sorprendersi se troviamo energie ben definite associate agli elettroni legati negli atomi.
2.6
Conseguenze di natura filosofica
Consideriamo brevemente alcune conseguenze di natura filosofica della meccanica quantistica. Come sempre, ci sono due aspetti del problema: da una parte ci sono le questioni filosofiche relative alla fisica, dall’altra parte le estrapolazioni di carattere speculativo ad altri campi. Generalmente quando i concetti filosofici trattati dalla scienza sono trasportati in un altro settore, essi vengono completamente deformati. Per questa ragione, cercheremo, per quanto è possibile, di limitare le nostre considerazioni all’ambito della fisica stessa. Prima di tutto, l’aspetto più interessante è l’idea del principio di indeterminazione; osservare un fenomeno produce un’influenza sul fenomeno stesso. Si è sempre saputo che fare osservazioni su di un fenomeno lo perturba, ma qui il punto è che questo effetto non può essere trascurato o minimizzato o reso arbitrariamente piccolo modificando l’apparecchiatura. Quando osserviamo un certo fenomeno, non possiamo fare a meno di introdurre un minimo di perturbazione, e questa influenza è necessaria per la coerenza del nostro punto di vista. L’osservatore poteva avere qualche volta importanza nella fisica prequantistica, ma sempre in un senso banale. È stato sollevato il problema: se un albero cade nella foresta e non c’è nessuno a sentirlo, fa rumore lo stesso? Un albero vero che cade in una foresta vera produce un suono, naturalmente, anche se non c’è nessuno. Anche se nessuno è presente a udirlo, restano altre tracce. Il suono farà oscillare qualche foglia, e, se fossimo abbastanza meticolosi, potremmo trovare da qualche parte che una spina ha strisciato contro una foglia producendo un graffietto, che non sapremmo spiegare in altro modo che supponendo che le foglie siano state poste in vibrazione. Quindi in un certo senso saremmo costretti ad ammettere che un suono si è prodotto. Potremmo domandarci: si è avuta una sensazione del suono? No, le sensazioni hanno presumibilmente a che fare con la coscienza. E noi non sappiamo se le formiche sono coscienti e se c’erano formiche nella foresta, o se gli alberi sono coscienti. Lasciamo il problema aperto in questa forma. Un altro fatto che è stato sottolineato da quando si è sviluppata la meccanica quantistica è che non si deve parlare di cose che non si sanno misurare. (In realtà, anche la teoria della relatività portò a questa conclusione.) Non vi è posto in una teoria per un concetto che non può essere definito con una misura. E poiché un valore preciso dell’impulso di una particella localizzata non può essere definito con una misura, non deve entrare nella teoria. Ma l’idea che questo sia ciò che non funziona nella teoria classica è una posizione sbagliata. Rappresenta un’analisi superficiale della situazione. Il solo fatto che non sappiamo misurare con precisione la posizione e l’impulso non significa a priori che non possiamo parlarne. Significa solo che non siamo obbligati a parlarne. La situazione nelle scienze è la seguente: un concetto o un’idea che
21
22
Capitolo 2 • Relazione tra il punto di vista ondulatorio e quello corpuscolare
© 978-8808-22107-0
non può essere misurato o riferito direttamente all’esperimento può essere utile o meno. Non è necessario che entri nella teoria. In altri termini, paragoniamo la teoria classica dell’universo con la teoria quantistica dell’universo e supponiamo che sia sperimentalmente vero che la posizione e l’impulso possano essere misurati solo in modo impreciso. Il problema è di vedere se i concetti di posizione esatta e di impulso esatto di una particella sono validi o no. La teoria classica accetta questi concetti; la teoria quantistica no. Questo, in se stesso, non significa che la fisica classica sia sbagliata. Quando venne scoperta la nuova meccanica quantistica, quelli che ragionavano secondo gli schemi classici, cioè tutti tranne Heisenberg, Schrödinger e Born, dissero: «Guardate, la vostra teoria non è buona a niente perché non sapete rispondere a certe domande come: qual è l’esatta posizione di una particella? Attraverso quale foro passa?», e altre. La risposta di Heisenberg fu: «Io non sono obbligato a rispondere a queste domande perché voi non potete formularle sperimentalmente». Proprio questo non siamo tenuti a fare. Consideriamo due teorie (a) e (b); (a) contiene un concetto che non può essere direttamente controllato ma che è usato nell’analisi, mentre (b) non lo contiene. Se le loro previsioni non vanno d’accordo, non si può affermare che (b) è falsa perché non riesce a spiegare quell’idea che è in (a), perché tale idea è tra quelle cose che non possono essere sottoposte a controllo sperimentale diretto. È sempre bene sapere quali idee non possono essere verificate direttamente, ma non è necessario abbandonarle tutte. Non è vero che possiamo costruire completamente la scienza usando solo quei concetti che sono suscettibili di esperienza diretta. Nella stessa meccanica quantistica ci sono delle ampiezze di probabilità, dei potenziali e tante entità complicate che non sappiamo misurare direttamente. Il fondamento di una scienza è la sua capacità di fare previsioni. Fare previsioni significa predire ciò che accadrà in un’esperienza che non è mai stata fatta. Come si può arrivare a questo? Ammettendo di conoscere la situazione in quel caso, a prescindere dall’esperimento. Dobbiamo fare una estrapolazione degli esperimenti a una regione dove essi non sono stati compiuti. Dobbiamo prendere i nostri concetti ed estenderli a sfere dove essi non sono ancora stati verificati. Se non procediamo così, non riusciamo a ricavare previsioni. Quindi, il fisico classico aveva perfettamente ragione di andare avanti allegramente supponendo che la posizione – che ha ovviamente senso per una palla da baseball – conservasse un significato anche per un elettrone. Non era una stupidaggine. Era un procedimento ragionevole. Oggi diciamo che le leggi della relatività sono valide a tutte le energie, ma un giorno può venir fuori qualcuno a dirci che siamo stati stupidi. Noi non sapremo mai in quali casi siamo «stupidi» fino a che non «rischiamo l’osso del collo», perciò la procedura giusta è quella di rischiarlo. E il solo modo di scoprirci in errore è di aver chiaro quali sono le nostre previsioni. È assolutamente necessario fare illazioni. Abbiamo già fatto qualche osservazione circa l’attenuazione del determinismo in meccanica quantistica. Si tratta del fatto che ora non siamo più in grado di anticipare ciò che avverrà in natura in un data circostanza fisica che è stata realizzata con la massima cura possibile. Se abbiamo un atomo in uno stato eccitato, che quindi sta per emettere un fotone, non sappiamo dire quando lo emetterà. L’atomo ha una certa ampiezza di probabilità di emettere il fotone per ogni istante, e noi possiamo solo prevedere la probabilità di emissione; non possiamo prevedere esattamente il futuro. Questo fatto ha dato origine a ogni sorta di sciocchezze, di questioni sul libero arbitrio e all’idea che il mondo non è deterministico. Naturalmente dobbiamo sottolineare che la fisica classica è essa stessa indeterminata in un certo senso. Si crede generalmente che questa indeterminazione, cioè il fatto che non sappiamo prevedere il futuro, sia un’importante peculiarità quantistica, e questo viene detto per spiegare il comportamento della mente, la sensazione del libero arbitrio ecc. Ma se il mondo fosse classico – se le leggi della meccanica fossero quelle classiche – non è per niente ovvio che la mente non si troverebbe più o meno nella stessa situazione. È vero, dal punto di vista classico, che se conoscessimo la posizione e la velocità di ogni particella nel mondo, o in una scatola piena di gas, potremmo esattamente prevedere ciò che accadrà. E perciò il mondo classico è deterministico. Supponiamo, tuttavia, di avere una possibilità finita di precisione e di non sapere esattamente dove si trovi un certo atomo, a meno, diciamo, di una parte su un miliardo. Allora, quando quello si muove e urta un altro atomo, per il fatto che già non conoscevamo la sua posizione che a meno di una parte su un miliardo, ci troviamo di fronte a un errore ancora maggiore sulla sua posizione dopo l’urto. Ovviamente il fenomeno si amplifica alla successiva collisione, cosicché se anche
© 978-8808-22107-0
2.6 • Conseguenze di natura filosofica
partiamo con solo un piccolissimo errore, questo s’ingigantisce rapidamente fino a divenire una grandissima incertezza. Tanto per dare un esempio: se l’acqua straripa da una diga e schizza dappertutto. Se ci troviamo nelle vicinanze, di tanto in tanto una goccia ci finisce sul naso. Questo sembra avvenire completamente a caso, eppure tale comportamento dovrebbe essere prevedibile in base a leggi puramente classiche. L’esatta posizione di tutte le gocce dipende da ogni piccola vibrazione dell’acqua prima di urtare la diga. In che modo? Le più piccole irregolarità sono ingrandite nella caduta, in modo che alla fine si ottiene un comportamento completamente a caso. È ovvio che non possiamo in realtà prevedere la posizione delle gocce, a meno di non conoscere il moto dell’acqua in modo assolutamente esatto. Parlando con maggior rigore, data una precisione arbitraria, non importa quanto, si può trovare un tempo abbastanza lungo da non poter più fare delle previsioni valide per un così lungo periodo. Ora il punto è che questo intervallo di tempo non è molto grande. Non è qualche milione di anni se la precisione è di una parte su un miliardo. Infatti, il tempo dipende solo logaritmicamente dall’errore, e se ne ricava che in un tempo molto, molto breve perdiamo ogni informazione. Se si assume una precisione di una parte su un miliardo di miliardi di miliardi – non importa quanti miliardi vogliamo, purché a un certo punto ci fermiamo – ci può capitare di trovare in conseguenza un tempo minore di quello impiegato a formulare la precisione, dopo di che non siamo più in grado di prevedere ciò che avverrà! Non è perciò chiara l’affermazione che dall’apparente libertà e imprevedibilità della mente umana, avremmo dovuto capire che la fisica classica «deterministica» non sarebbe mai riuscita a spiegarla, e in conseguenza accogliere la meccanica quantistica come una liberazione da un universo «completamente meccanicistico». Giacché anche nella meccanica classica si ha in pratica quest’incapacità di fare previsioni.
23
3
Ampiezze di probabilità
3.1
Leggi di combinazione delle ampiezze
Quando Schrödinger giunse per la prima volta alla corretta formulazione della meccanica quantistica, scrisse un’equazione che descriveva il comportamento dell’ampiezza di probabilità di trovare una particella nei vari punti. Quest’equazione era molto simile a quelle già note ai fisici classici, e da essi applicate allo studio del moto dell’aria nelle onde sonore, della propagazione della luce e così via. Perciò, agli inizi della meccanica quantistica, si dedicò molto tempo a risolvere questa equazione. Ma contemporaneamente si andava sviluppando, specialmente per merito di Born e Dirac, un’interpretazione delle idee fisiche radicalmente nuova che sta alla base della meccanica quantistica. Con lo sviluppo sempre maggiore della meccanica quantistica stessa, si rilevò che un gran numero di fenomeni non erano direttamente contenuti nell’equazione di Schrödinger, come, per esempio, lo spin dell’elettrone e vari effetti relativistici. Per tradizione, si usa cominciare tutti i corsi di meccanica quantistica allo stesso modo, ripercorrendo lo sviluppo storico della materia. Prima s’imparano un sacco di cose di meccanica classica per essere in grado di capire come si risolve l’equazione di Schrödinger. Poi si dedica un lungo periodo a elaborarne varie soluzioni. Solo dopo uno studio dettagliato di questa equazione si attacca il problema «superiore» dello spin dell’elettrone. In origine, eravamo anche noi dell’idea che il modo migliore di concludere queste lezioni fosse quello di insegnare a risolvere le equazioni più complicate della fisica classica, come quelle che descrivono le onde sonore in regioni chiuse, i modi di vibrazione della radiazione elettromagnetica in cavità cilindriche, e così via. Questo era il progetto originale per questo corso. Successivamente, però, abbiamo deciso di abbandonare questo schema per dare invece un’introduzione alla meccanica quantistica. Siamo infatti giunti alla conclusione che, quelle che usualmente sono considerate come le parti meno elementari della meccanica quantistica, sono, in realtà, molto semplici. La matematica necessaria è particolarmente agevole, poiché tutto quel che serve è qualche semplice operazione algebrica, senza equazioni differenziali, tranne, al più, alcune tra le più facili. L’unica difficoltà è che dobbiamo saltare l’ostacolo costituito dal non essere più in grado di descrivere in dettaglio il comportamento delle particelle nello spazio. Quindi quello che ci accingiamo a fare è esporvi ciò che in genere si pensa debba far parte della meccanica quantistica «superiore». Ma si tratta, ve lo assicuriamo, di argomenti tra i più semplici – nel senso profondo della parola – e tuttavia dei più fondamentali. Con tutta sincerità, vi diciamo che questo è un esperimento pedagogico; per quanto ne sappiamo, non è mai stato tentato prima d’ora. Naturalmente, la difficoltà che s’incontra in questo campo è che il comportamento dei sistemi quantistici è molto inconsueto. Nessuno dispone di esperienze quotidiane sulle quali fondarsi per avere un’idea approssimata e intuitiva di ciò che può accadere. Tenuto conto di questo, ci sono due modi di presentare le cose: si potrebbero descrivere i vari fenomeni in modo fisico ma alquanto impreciso, raccontando più o meno quello che succede senza dare le leggi esatte per ognuno dei casi; oppure, alternativamente, esporre in maniera rigorosa ma astratta queste leggi. In tal caso, però, non cogliereste appieno il loro significato fisico. Il secondo metodo non è soddisfacente perché completamente astratto, mentre il primo è destinato a lasciare una sensazione di disagio, perché poi non si sa esattamente ciò che è vero e ciò che è falso. Non sappiamo molto bene come superare questa difficoltà: il che avrete forse potuto notare nel corso della lettura
25
3.1 • Leggi di combinazione delle ampiezze
© 978-8808-22107-0
3.1 Esperimento di interferenza con elettroni.
FIGURA
x
x
Rilevatore s
Cannone elettronico
P1
P12
1 2 P2
Parete
Tabellone (b)
(a)
(c)
dei capitoli 1 e 2. Il primo capitolo era relativamente preciso; ma il secondo presentava una descrizione approssimativa delle caratteristiche di vari fenomeni. Qui cercheremo di trovare un efficace compromesso tra i due estremi. In questo capitolo, inizieremo a discutere alcuni concetti quantistici generali. Alcune delle nostre affermazioni saranno molto precise, altre solo parzialmente. Non sarà facile specificare, volta per volta, quali lo siano e quali no, ma alla fine del libro, ripensandoci, capirete quali parti vadano bene e quali invece siano state esposte solo alla buona. I capitoli seguenti non saranno tanto imprecisi. Infatti, una delle ragioni per cui abbiamo cercato di essere rigorosi nei prossimi capitoli è che, in tal modo, possiamo mostrarvi una delle cose più mirabili della meccanica quantistica: quante cose si possano dedurre a partire da così poco. Cominciamo con il discutere nuovamente la sovrapposizione delle ampiezze di probabilità. In concreto, ci riferiremo all’esperienza descritta nel capitolo 1, e riprodotta nuovamente qui nella FIGURA 3.1. Abbiamo una sorgente s di particelle, per esempio elettroni; poi una parete con due fenditure e, oltre la parete, un rilevatore, collocato in una certa posizione x. Ci chiediamo quale sia la probabilità di trovare una particella in x. Il nostro primo principio generale della meccanica quantistica è che la probabilità che una particella arrivi in x, partendo dalla sorgente s, può essere rappresentata quantitativamente dal modulo quadrato di un numero complesso detto ampiezza di probabilità: in questo caso «l’ampiezza che una particella da s arrivi in x». Useremo queste ampiezze tanto spesso che introduciamo una notazione abbreviata – inventata da Dirac e applicata usualmente in meccanica quantistica – per indicarle simbolicamente. Scriviamo l’ampiezza di probabilità nel modo seguente: hla particella arriva in x | la particella parte da si
(3.1)
In altre parole, le due parentesi h e i sono un simbolo equivalente a «l’ampiezza che»; l’espressione a destra della lineetta verticale dà sempre lo stato di partenza, e quella a sinistra, lo stato finale. Spesso sarà anche conveniente abbreviare ancor più la notazione e rappresentare gli stati iniziale e finale con una sola lettera. Per esempio, potremo a volte scrivere l’ampiezza (3.1) nella forma (3.2)
hx | si
Vogliamo sottolineare che questa ampiezza è, naturalmente, nient’altro che un numero – un numero complesso. Abbiamo già visto nel capitolo 1 che quando la particella può raggiungere il rilevatore in due possibili modi, la probabilità risultante non è la somma delle due, ma deve essere scritta come il modulo quadrato della somma delle due ampiezze. Abbiamo visto che la probabilità che un elettrone arrivi al rilevatore quando entrambe le strade sono aperte è P12 = |
1
+
2|
2
(3.3)
Vogliamo ora riformulare questo risultato nella nostra nuova notazione. Prima però, vogliamo stabilire il nostro secondo principio generale della meccanica quantistica: quando una particella
26
Capitolo 3 • Ampiezze di probabilità
© 978-8808-22107-0
3.2 Un esperimento di interferenza più complessa. FIGURA
a
s
1
x b
Cannone elettronico
2 c
può raggiungere un certo stato per due cammini, l’ampiezza totale del processo è la somma delle ampiezze relative alle due possibilità prese separatamente. Nel nostro nuovo simbolismo scriviamo che hx | sientrambi i fori aperti = hx | siattraverso 1 + hx | siattraverso 2 (3.4) Per inciso, supporremo che i fori 1 e 2 siano abbastanza piccoli da non doverci preoccupare, quando diciamo che l’elettrone ha attraversato un foro, di precisare meglio da dove sia passato. Si potrebbe, ovviamente, pensare di suddividere ciascuno dei fori in tante parti con un’ampiezza diversa a seconda che l’elettrone passi per l’estremità superiore o inferiore del foro, ecc. Comunque, supporremo che esso sia abbastanza piccolo da poter trascurare questo dettaglio. Questo è un caso particolare di quell’inaccuratezza di cui parlavamo; la questione può essere trattata con più precisione, ma in questo momento preferiamo non farlo. Vogliamo ora esporre con maggior dettaglio quanto si può dire sull’ampiezza relativa al processo in cui l’elettrone giunge al rilevatore in x passando attraverso il foro 1. Possiamo farlo ricorrendo al nostro terzo principio generale: quando una particella percorre un particolare cammino, l’ampiezza associata si può scrivere come il prodotto dell’ampiezza relativa a una parte di esso per l’ampiezza riguardante il resto del cammino. Per l’apparato di FIGURA 3.1, l’ampiezza relativa al cammino da s a x attraverso il foro 1 è uguale all’ampiezza per andare da s a 1, moltiplicata per l’ampiezza per andare da 1 a x: hx | sivia 1 = hx | 1i h1 | si
(3.5)
Ancora una volta questo risultato non è del tutto preciso. Dovremmo anche includere un fattore per l’ampiezza che l’elettrone attraversi la fenditura in 1; ma nel caso in questione si tratta di una semplice fenditura, e ammetteremo che questo fattore sia uguale a uno. Noterete che l’equazione (3.5) appare scritta in ordine inverso. Deve essere letta da destra a sinistra. L’elettrone passa da s a 1 e quindi da 1 a x. In conclusione, se vari eventi si succedono l’uno all’altro – cioè se potete analizzare un possibile cammino della particella dicendo che prima fa questo, poi quello e infine quest’altro – l’ampiezza risultante va calcolata moltiplicando successivamente le ampiezze per ogni evento della successione. Secondo questa regola possiamo riscrivere l’equazione (3.4) nel modo seguente: hx | sientrambi = hx | 1i h1 | si + hx | 2i h2 | si Vogliamo ora mostrare come sia sufficiente attenersi a questi principi per analizzare un processo molto più complesso, per esempio quello della FIGURA 3.2. Qui abbiamo due pareti, una con due fenditure, 1 e 2, l’altra con tre fori, a, b e c. Dietro la seconda parete, c’è un rilevatore posto in x, e vogliamo ricavare l’ampiezza che una particella giunga a esso. Orbene, un modo di ricavarla è quello di calcolare la sovrapposizione, o interferenza, delle onde che passano attraverso i fori; ma si può anche partire dal fatto che ci sono sei cammini possibili e sovrapporre le relative ampiezze. L’elettrone può passare per il foro 1, poi per a, e arrivare in x; oppure può passare per 1, poi per b e arrivare in x; e così via. Il nostro secondo principio ci dice che le ampiezze per le varie
3.1 • Leggi di combinazione delle ampiezze
© 978-8808-22107-0
alternative si sommano, cosicché potremo scrivere l’ampiezza per il passaggio da s a x, come una somma di sei ampiezze separate. D’altra parte, per il terzo principio, ognuna di queste ampiezze parziali può essere espressa come un prodotto di tre ampiezze. Per esempio, una di queste è il prodotto dell’ampiezza da s a 1, per l’ampiezza da 1 ad a, per l’ampiezza da a a x. Usando la nostra notazione abbreviata, possiamo scrivere l’ampiezza totale per andare da s a x come hx | si = hx | ai ha | 1i h1 | si + hx | bi hb | 1i h1 | si + · · · + hx | ci hc | 2i h2 | si Si può risparmiare inchiostro usando il simbolo di sommatoria: X hx | si = hx | ↵i h↵ | ii hi | si
(3.6)
i=1,2 ↵=a,b,c
Naturalmente, per fare i calcoli con questi metodi, occorre conoscere l’ampiezza relativa al passaggio da un punto a un altro. Daremo un’idea approssimativa della forma di un’ampiezza tipica. Questa rappresentazione non tiene conto di certi fatti come la polarizzazione della luce o lo spin dell’elettrone, ma, per il resto, è del tutto esatta. Ve la insegniamo affinché possiate risolvere i problemi concernenti varie combinazioni di fenditure. Supponiamo di avere una particella di energia fissata che si sposta nel vuoto da un punto r1 a un punto r2 . In altri termini, è una particella libera, non soggetta a forze. A parte un fattore numerico, l’ampiezza per il passaggio da r1 a r2 è hr2 | r1 i = dove r12 = r2
ei p · r12 /~ r 12
(3.7)
r1 e p è l’impulso legato all’energia E dall’equazione relativistica p2 c 2 = E 2
(m0 c2 )2
oppure dall’equazione non relativistica p2 = energia cinetica 2m L’equazione (3.7) non significa altro che la particella ha proprietà ondulatorie, e che l’ampiezza si propaga come un’onda con numero d’onda pari all’impulso diviso per ~. In generale, l’ampiezza e la corrispondente probabilità saranno funzioni anche del tempo. Per la maggior parte di questa discussione introduttiva, supporremo che la sorgente emetta particelle sempre con la stessa energia, in modo da non doverci preoccupare della dipendenza dal tempo. Ma potremmo, più in generale, prendere in considerazione qualche altro problema. Consideriamo una particella emessa in un punto P a un certo istante e supponiamo di voler trovare qual è l’ampiezza di probabilità che essa ha di raggiungere un punto, diciamo r, in un certo istante successivo. Simbolicamente, potremmo rappresentare questa ampiezza come hr, t = t 1 | P, t = 0i Ovviamente, essa dipende da r e da t. Troverete risultati differenti, ponendo il rilevatore in posizioni diverse ed eseguendo la misura a tempi diversi. In generale, questa funzione di r e di t soddisfa un’equazione differenziale di tipo ondulatorio. Per esempio, in un caso non relativistico, è l’equazione di Schrödinger. Si ha allora un’equazione d’onda del tipo di quella per le onde elettromagnetiche o per le onde sonore in un gas. Tuttavia, va sottolineato che la funzione d’onda soluzione dell’equazione non rappresenta un’onda vera e propria che si propaga nello spazio; non ci si può raffigurare quest’onda come un qualcosa di reale in modo simile a un’onda sonora. Per quanto, se si ha a che fare con una sola particella, si possa essere tentati di pensare in termini di «onde di particelle», questa non è una buona idea, perché se si hanno, per esempio, due particelle, l’ampiezza di trovarne una in r1 e l’altra in r2 , non è una semplice onda in uno spazio a tre dimensioni, ma dipende dalle sei variabili spaziali r1 e r2 . Per esempio, per trattare il caso di due (o più) particelle, avremo bisogno del seguente nuovo principio: purché le due particelle non
27
28
Capitolo 3 • Ampiezze di probabilità
© 978-8808-22107-0
interagiscano tra loro, l’ampiezza perché una di esse faccia una cosa e l’altra qualcosa di diverso è il prodotto delle due ampiezze per i processi relativi alle due particelle, presi separatamente. Per esempio, se ha | s1 i è l’ampiezza relativa alla particella 1 che va da s1 ad a, e hb | s2 i l’ampiezza relativa alla particella 2 che va da s2 a b, l’ampiezza che ambedue le cose accadano insieme è ha | s1 i hb | s2 i C’è ancora una cosa da far presente. Ammettiamo di non sapere da dove provengano le particelle di FIGURA 3.2 prima di arrivare ai fori 1 e 2 della prima parete. Possiamo ancora prevedere ciò che avverrà oltre la parete (per esempio, l’ampiezza d’arrivo in x) pur di conoscere due numeri: l’ampiezza di arrivo in 1 e quella di arrivo in 2. Ovvero, poiché l’ampiezza per più eventi successivi è una funzione moltiplicativa, come ci dice l’equazione (3.6), tutto ciò che ci serve per continuare l’analisi sono due numeri: in questo caso particolare h1 | si e h2 | si. Questi due numeri complessi bastano a prevedere tutto il futuro. Questa circostanza è proprio quella che rende semplice la meccanica quantistica. Nei prossimi capitoli ricorreremo proprio a questo fatto quando specificheremo una certa condizione iniziale con l’assegnare due (o più) numeri. Naturalmente questi numeri dipendono dalla posizione della sorgente e, magari, da altri dettagli della apparecchiatura, ma una volta noti, non occorre sapere nient’altro su queste particolarità.
3.2
Interferenza da due fenditure
Desideriamo ora esaminare un argomento che è stato trattato nei particolari nel capitolo 1. Questa volta lo faremo nel pieno splendore del concetto di ampiezza per mostrarvi come funziona. Riprendiamo lo stesso esperimento della FIGURA 3.1, ma ora con l’aggiunta di una sorgente luminosa dietro i due fori, come si vede nella FIGURA 3.3. Nel capitolo 1 abbiamo ricavato il seguente interessante risultato. Se dietro la fenditura 1 si osserva un fotone diffuso da un punto nelle sue vicinanze, allora la distribuzione degli elettroni rivelati in x, in coincidenza con i fotoni, risulta la stessa che con la fenditura 2 chiusa. La distribuzione complessiva per gli elettroni «visti» nelle vicinanze dei fori 1 o 2 è data dalla somma delle due, prese separatamente, ed è completamente differente dalla distribuzione ottenuta con la luce spenta. Questo risulta vero almeno per una luce con lunghezza d’onda abbastanza corta. Rendendo la lunghezza d’onda tanto lunga da non poter più dire da quale foro provenga il fotone, la distribuzione diventa sempre più simile a quella in assenza di luce. Esaminiamo ora questo fenomeno sfruttando la nostra nuova notazione e il principio di combinazione delle ampiezze. Per semplificare la scrittura, indicheremo nuovamente con 1 l’ampiezza per un elettrone che giunga in x attraverso il foro 1, ovvero 1
= hx | 1i h1 | si
D1 1 s
Cannone elettronico FIGURA 3.3 Un esperimento per determinare da quale fenditura è passato l’elettrone.
Sorgente di luce
2 D2
3.2 • Interferenza da due fenditure
© 978-8808-22107-0
Similmente, indichiamo con foro 2:
2
l’ampiezza per un elettrone che arrivi al rilevatore attraverso il 2
= hx | 2i h2 | si
Queste, dunque, sono le ampiezze per il passaggio attraverso i fori e l’arrivo in x in assenza di luce. Se ora accendiamo la luce, possiamo chiederci: qual è l’ampiezza per un processo in cui l’elettrone parte da s e un fotone è emesso dalla sorgente di luce L, e che termina con l’elettrone in x e il fotone osservato dietro la fenditura 1? Supponiamo di osservare il fotone dietro la fenditura 1 con un rilevatore D1 , come si vede nella FIGURA 3.3, e di usare un rilevatore simile D2 per contare i fotoni diffusi oltre il foro 2. Avremo un’ampiezza per un fotone che arriva in D1 in corrispondenza a un elettrone in x, e anche un’ampiezza per un fotone che arriva in D2 e in corrispondenza a un elettrone in x. Proviamo a calcolarle. Anche senza conoscere le espressioni matematiche esatte per tutti i fattori che entrano in questo calcolo, ne potrete comprendere ugualmente lo spirito nella discussione seguente. Anzitutto si ha un’ampiezza h1 | si per un elettrone che va dalla sorgente al foro 1. Inoltre, possiamo supporre che esista una certa ampiezza relativa alla possibilità che l’elettrone, mentre è nelle vicinanze del foro 1, devii un fotone verso il rilevatore D1 . Indichiamo questa ampiezza con a. Infine si ha l’ampiezza hx | 1i che l’elettrone giunga dalla fenditura 1 al rilevatore in x. Quindi l’ampiezza complessiva che un elettrone vada da s a x attraverso la fenditura 1 e inoltre devii un fotone in D1 è hx | 1i a h1 | si O anche, tenendo conto della nostra precedente notazione, semplicemente a 1 . Vi è pure un’ampiezza non nulla relativa alla possibilità che un elettrone che attraversa il foro 2 diffonda un fotone verso il contatore D1 . Voi direte: «Non è possibile; come fa a deviarlo verso il rilevatore D1 , dal momento che questo è rivolto verso il foro 1?». Se la lunghezza d’onda è abbastanza grande, si hanno effetti di diffrazione, ed esiste certamente anche questa possibilità. Ma se l’apparecchiatura è ben costruita, e usiamo fotoni di piccola lunghezza d’onda, allora l’ampiezza che un elettrone in vicinanza del foro 2 invii un fotone al rilevatore 1 è molto piccola. In ogni caso, per mantenerci sulle generali, terremo presente l’esistenza di una tale ampiezza, che indicheremo con b. Perciò, l’ampiezza per un elettrone che attraversi il foro 2 e contemporaneamente devii un fotone verso D1 è hx | 2i b h2 | si = b
2
L’ampiezza associata alla rivelazione dell’elettrone in x e del fotone in D1 è la somma di due termini, uno per ogni cammino possibile dell’elettrone. A sua volta, ogni termine si compone di due fattori: il primo, corrispondente al passaggio dell’elettrone per uno dei fori, il secondo, alla possibilità che il fotone sia diffuso da questo elettrone verso il rilevatore 1; abbiamo nel complesso ⌧ elettrone in x elettrone da s =a 1+b 2 (3.8) fotone in D1 fotone da L Si ottiene un’analoga espressione se il fotone è rivelato dall’altro contatore D2 . Se, per semplicità, supponiamo che il sistema sia simmetrico, allora a è anche l’ampiezza per un fotone in D2 quando un elettrone attraversa il foro 2, e b è l’ampiezza per un fotone in D2 quando un elettrone attraversa il foro 1. L’ampiezza totale risultante per un fotone in D2 e un elettrone in x è ⌧ elettrone in x elettrone da s =a 2+b 1 (3.9) fotone in D2 fotone da L
Con ciò abbiamo finito. Possiamo facilmente calcolare le probabilità in varie situazioni. Ammettiamo di voler sapere con quale probabilità si registri un conteggio in D1 e un elettrone in x. Questa sarà data dal modulo quadrato dell’ampiezza data dall’equazione (3.8), cioè esattamente |a
1
+b
2|
2
Osserviamo più attentamente questa espressione. Anzitutto, se b è zero – questo è il tipo di apparecchio che desidereremmo progettare – allora la risposta è semplicemente | 1 |2 diminuito
29
30
Capitolo 3 • Ampiezze di probabilità
© 978-8808-22107-0
del fattore |a|2 . Questa è proprio la distribuzione di probabilità che si x x x avrebbe se ci fosse un solo foro – come mostra il grafico della FIGURA 3.4a. D’altro canto, se la lunghezza d’onda è molto grande, l’entità della diffusione in D1 da parte della regione intorno al foro 2 può benissimo essere circa uguale a quella originata intorno al foro 1. Sebbene dei fattori di fase possano essere contenuti in a e in b, possiamo limitarci al caso semplice in cui le due fasi sono uguali. Se a è praticamente uguale a b, allora la P P P probabilità totale diventa | 1 + 2 |2 moltiplicata per |a|2 , in quanto il fattore comune a può essere portato fuori. Ma questa è proprio la distribuzione di probabilità che si sarebbe ottenuta se i fotoni non fossero affatto intervenuti. Perciò, per lunghezze d’onda molto grandi – cioè quando la rivelazione dei fotoni è inefficace – voi vi ritrovate con la curva di distribuzione originale (c) (b) (a) che presenta effetti di interferenza, e che è rappresentata nella FIGURA 3.4b. Nel caso che la rivelazione sia solo parzialmente efficace, si ha interfeFIGURA 3.4 Probabilità di rilevare un elettrone in x renza tra un sacco di 1 e un pizzico di 2 , e si ottiene una distribuzione in coincidenza con un fotone in D, nell’esperimento di FIGURA 3.3: (a) per b = 0; (b) per b = a; intermedia come quella schematizzata nella FIGURA 3.4c. (c) per 0 < b < a. È inutile aggiungere che, se osserviamo i conteggi in coincidenza di fotoni in D2 e di elettroni in x, otteniamo lo stesso tipo di risultati. Se ricordate la discussione del capitolo 1, noterete che questi risultati costituiscono una descrizione quantitativa di quanto è stato allora esposto. Vogliamo ora mettere in evidenza un punto importante per non farvi incappare in un errore molto comune. Supponete di voler sapere solamente l’ampiezza che un elettrone arrivi in x, indipendentemente dal fatto che il fotone sia rivelato in D1 o in D2 . Dovete sommare le ampiezze date dalle equazione (3.8) e (3.9)? No! Non bisogna mai sommare ampiezze per stati finali differenti e distinguibili. Ogni volta che un fotone è entrato in uno dei contatori, si può sempre, volendo, determinare quale delle alternative si è verificata, senza introdurre nuove perturbazioni nel sistema. Ogni alternativa ha una probabilità completamente indipendente dall’altra. Ripetiamo, non bisogna sommare le ampiezze per condizioni finali diverse, dove per istante «finale» intendiamo quello in cui si vuole determinare la probabilità: ovvero, a esperimento «finito». Vanno invece sommate le ampiezze per le varie alternative indistinguibili che possono aver luogo durante l’esperimento, prima che il processo sia finito completamente. Alla fine dell’esperimento potete anche dire che «non volete guardare il fotone». Questi sono affari vostri, ma non dovete lo stesso sommare le ampiezze. La natura non sa quello che volete osservare, e si comporta nello stesso modo sia che voi vi curiate di prendere in considerazione i dati o no. Perciò, in questo caso, non bisogna sommare le ampiezze. Prima si fa il quadrato delle ampiezze per ogni possibile evento finale e poi si somma. Il risultato corretto per un elettrone in x e un fotone indifferentemente in D1 o in D2 è ⌧ ⌧ 2 2 el. da s el. da s el. in x el. in x + = fot. in D1 fot. da L fot. in D2 fot. da L (3.10) = |a
3.3
1
+b
2|
2
+ |a
2
+b
1|
2
Diffusione da un cristallo
Il nostro prossimo esempio riguarda un fenomeno per studiare il quale dobbiamo analizzare piuttosto in dettaglio l’interferenza delle ampiezze di probabilità. Ci riferiamo al processo di diffusione dei neutroni da un cristallo. Supponiamo di avere un cristallo composto da tanti atomi con i nuclei al centro di questi, ordinati secondo uno schema periodico, e un fascio di neutroni che proviene da una sorgente lontana. Possiamo contrassegnare i vari nuclei del cristallo con un indice i, il quale assume i valori interi 1, 2, 3,..., N, con N uguale al numero totale di atomi. Il problema che ci poniamo è quello di calcolare la probabilità che un neutrone arrivi al contatore nella disposizione sperimentale di FIGURA 3.5. Per ogni singolo atomo i, l’ampiezza che un neutrone arrivi al rilevatore C si ottiene moltiplicando l’ampiezza che il neutrone dalla
31
3.3 • Diffusione da un cristallo
© 978-8808-22107-0
sorgente S arrivi al nucleo i, per l’ampiezza a che venga diffuso da i e infine per l’ampiezza che esso giunga da i al contatore C. In formule: hneutrone in C | neutrone da Sivia i = hC | ii a hi | Si
(3.11)
Scrivendo questa equazione abbiamo ammesso che l’ampiezza di diffusione a sia la stessa per tutti gli atomi. In questo caso, si hanno un gran numero di cammini possibili, apparentemente indistinguibili. Sono indistinguibili perché un neutrone di bassa energia è deviato da un nucleo senza che l’atomo si sposti dalla sua posizione nel cristallo, e quindi non rimane «memoria» della diffusione. In base alla discussione precedente, Sorgente di l’ampiezza totale per un neutrone che arriva a C contiene una somma neutroni dell’equazione (3.11) su tutti gli atomi: hneutrone in C | neutrone da Si =
N X
Cristallo
S
hC | ii a hi | Si
(3.12)
C
i=1
Poiché stiamo sommando ampiezze di diffusione da atomi in differenti posizioni nello spazio, le ampiezze avranno fasi diverse, dando così luogo alle caratteristiche figure di interferenza che abbiamo già analizzato nel caso della diffusione della luce da un reticolo. In un simile esperimento, l’intensità di neutroni in funzione dell’angolo, mostra effettivamente spesso delle fortissime variazioni, con netti picchi di interferenza, e quasi niente nel mezzo, come si vede nella FIGURA 3.6a. Tuttavia, le cose non stanno sempre così, e per certi tipi di cristalli, insieme ai picchi d’interferenza di cui sopra, si osserva un fondo continuo di diffusione in tutte le direzioni. Vogliamo cercare di capire la ragione apparentemente misteriosa di questo fatto. Orbene, noi non abbiamo considerato un’importante caratteristica del neutrone. Il suo spin è uguale a un mezzo, e quindi, si può trovare in due stati diversi: o con spin «su», per esempio perpendicolare alla pagina nella FIGURA 3.5, oppure con spin «giù». Se i nuclei del cristallo non hanno spin, lo spin del neutrone non dà alcun effetto nuovo. Ma nei casi in cui i nuclei del cristallo abbiano anch’essi uno spin, per esempio uguale a un mezzo, osserverete il fondo continuo di diffusione descritto in precedenza. La spiegazione è la seguente. Se lo spin del neutrone e quello del nucleo atomico hanno la stessa direzione, non è possibile alcuna variazione dello spin durante la diffusione. Se, invece, il neutrone e il nucleo atomico hanno spin opposto, allora la diffusione può avvenire secondo due processi, uno in cui gli spin rimangono inalterati, e uno in cui entrambi gli spin cambiano verso. Questa regola, che lo spin totale rimane invariato, è analoga alla nostra legge classica della conservazione del momento angolare. Per comprendere il fenomeno, possiamo cominciare a supporre che tutti i nuclei diffondenti abbiano gli spin allineati in un’unica direzione. Un neutrone con lo stesso spin subirà una diffusione che dà luogo alla normale distribuzione con forte interferenza. Che cosa accade quando lo spin è opposto? Se il neutrone viene diffuso senza inversione dello spin, non si ha alcuna differenza; ma, se si verifica nella diffusione la doppia inversione dello spin, allora, in linea di principio, potremmo identificare il nucleo responsabile della diffusione, perché sarebbe il solo con lo spin invertito. Bene, se possiamo dire qual è stato l’atomo che ha prodotto la diffusione, che c’entrano gli altri atomi? Niente, naturalmente. Si ottiene una diffusione esattamente uguale a quella prodotta da un solo atomo. Per includere questo effetto, la formulazione matematica dell’equazione (3.12) va modificata, poiché, nell’analisi precedente, non abbiamo descritto gli stati in maniera completa. Partiamo con tutti i neutroni provenienti dalla
Contatore di neutroni
3.5 Misura della diffusione di neutroni da parte di un cristallo. FIGURA
Frequenza di conteggio
(a)
Frequenza di conteggio
(b)
Frequenza di conteggio
(c)
3.6 Frequenza di conteggio dei neutroni in funzione dell’angolo: (a) per nuclei di spin zero; (b) probabilità di diffusione con inversione di spin; (c) frequenza di conteggio osservata con un nucleo di spin un mezzo. FIGURA
32
Capitolo 3 • Ampiezze di probabilità
© 978-8808-22107-0
sorgente con lo spin «su», e tutti i nuclei del cristallo con lo spin «giù». Per prima cosa, cerchiamo l’ampiezza per un neutrone che arriva al contatore con lo spin «su» e inoltre per tutti gli spin del cristallo ancora rivolti in basso. In questo caso, non si ha alcuna differenza rispetto alla precedente discussione. Indicheremo con a l’ampiezza di diffusione senza inversione di spin. L’ampiezza di diffusione dall’i-esimo atomo è, ovviamente, hC«su» , nel cristallo tutti gli spin «giù» | S«su» , nel cristallo tutti gli spin «giù»i = hC | ii a hi | Si Poiché tutti gli spin atomici sono ancora giù, le varie alternative (rappresentate da differenti valori di i) non possono essere distinte. È chiaro che non c’è maniera di dire quale atomo è responsabile della diffusione. In questo processo, tutte le ampiezze interferiscono. Però, c’è ancora l’altro caso, in cui lo spin del neutrone che viene rivelato è «giù», benché quest’ultimo fosse partito da S con lo spin «su». Nel cristallo, uno degli spin deve avere invertito la sua direzione – poniamo che sia quello del k-esimo atomo. Ammetteremo che per ogni atomo l’ampiezza associata all’inversione dello spin sia la stessa, e la indicheremo con b. (In un cristallo reale, vi è la sgradevole possibilità che lo spin che si è capovolto passi a un altro atomo, ma supporremo che il nostro sia il caso di un cristallo per cui questa probabilità è molto piccola.) Si ha allora per l’ampiezza di diffusione hC«giù» , nuclei k «su» | S«su» , nel cristallo tutti gli spin «giù»i = hC | ki b hk | Si
(3.13)
Se vogliamo la probabilità di trovare il neutrone con lo spin «giù» e il k-esimo nucleo con lo spin «su» basta fare il quadrato del modulo di questa ampiezza, che è semplicemente |b|2 per |hC|kihk|Si|2 . Il secondo fattore è quasi indipendente dalla posizione del cristallo, e tutti i fattori di fase sono scomparsi facendo il modulo quadrato. La probabilità di diffusione da un nucleo qualsiasi del cristallo con inversione di spin è allora |b|
2
N X k=1
|hC | ki hk | Si| 2
che risulterà in una distribuzione regolare, come quella nella FIGURA 3.6b. Potreste obiettare: «Non m’interessa quale atomo abbia lo spin “su”». Forse voi non ci badate, ma la natura lo sa; e la probabilità è effettivamente quella che abbiamo detto, e non si ha interferenza. D’altro canto, se si vuole la probabilità di rivelare un neutrone con lo spin «su» e che tutti gli atomi abbiano sempre lo spin «giù», allora bisogna prendere il modulo quadrato dell’espressione N X hC | ii a hi | Si i=1
Poiché gli addendi di questa somma hanno dei fattori di fase, essi interferiscono, e si ottiene la distribuzione tipica con i forti picchi. Se facciamo un esperimento in cui non si osserva lo spin del neutrone al rilevatore, allora si possono avere entrambi i tipi di evento; e dobbiamo sommare le due relative probabilità. La probabilità risultante (frequenza di conteggio) in funzione dell’angolo si presenta quindi come il grafico di FIGURA 3.6c. Riassumiamo la fisica di questo esperimento. Se potete, in linea di principio, distinguere i possibili stati finali (anche se non intendete disturbarvi a farlo), la probabilità complessiva finale, la si ottiene calcolando le probabilità per ogni possibile stato (e non l’ampiezza) e quindi sommandole insieme. Se non sapete distinguere gli stati finali, nemmeno in linea di principio, allora vanno sommate le ampiezze di probabilità prima di farne il modulo quadrato per trovare la probabilità effettiva. Quel che vorremmo che voi notaste, in particolar modo, è che se aveste voluto rappresentarvi il neutrone come una semplice onda, avreste ottenuto la stessa distribuzione sia per un neutrone con lo spin «giù» sia per uno con lo spin «su». Sareste stati costretti ad ammettere che «l’onda» proviene da tutti i vari atomi e interferisce nella stessa maniera di quella di spin «su» con lunghezza d’onda uguale. Ma noi sappiamo che questa non è la via giusta. Quindi, come abbiamo già detto, bisogna stare attenti a non attribuire troppa realtà alle onde nello spazio. Queste sono utili in certi problemi ma non in tutti.
3.4
33
3.4 • Particelle identiche
© 978-8808-22107-0
Particelle identiche
L’esperienza che ci accingiamo ora a descrivere mette in evidenza una notevolissima conseguenza della meccanica quantistica. Si tratta nuovamente di una situazione fisica in cui un evento può avvenire in due maniere diverse indistinguibili, e quindi si ha interferenza tra le ampiezze, come sempre succede in questi casi. Parleremo della diffusione di nuclei, di energia relativamente bassa, su altri nuclei. Cominceremo a considerare delle particelle ↵ (le quali, come sapete, sono nuclei di elio) che bombardano, per esempio, ossigeno. Per rendere più agevole l’analisi della reazione, la studieremo nel sistema del baricentro, in cui il nucleo di ossigeno e la particella ↵ hanno le rispettive velocità in direzioni esattamente opposte prima della collisione, come pure dopo la collisione stessa (FIGURA 3.7a). (Poiché le masse sono differenti, naturalmente le velocità non sono uguali in modulo.) Supporremo inoltre che valga la conservazione dell’energia, e che l’energia di collisione sia tanto bassa da non poter mandare in pezzi le particelle né lasciarle in uno stato eccitato. La ragione per la quale ciascuna particella provoca la deflessione dell’altra è, naturalmente, che ogni particella porta una carica positiva, e, per esprimerci classicamente, si ha una repulsione elettrica mentre esse si muovono. La diffusione avverrà con probabilità diverse a seconda dell’angolo, e ora vogliamo appunto discutere alcuni aspetti della dipendenza della diffusione dagli angoli. (S’intende che è possibile calcolarla anche classicamente, ed è una delle coincidenze più notevoli della meccanica quantistica il fatto che la risposta a questo problema risulti la stessa nei due casi. Questa curiosa circostanza si presenta soltanto per una forza che dipenda dall’inverso del quadrato della distanza, e per nessun’altra, e perciò è da considerarsi proprio un caso.) La probabilità di diffusione in direzioni diverse si può misurare con un’esperienza del tipo mostrata in FIGURA 3.7a. Il contatore in posizione 1 può essere progettato in modo da rivelare solo le particelle ↵ e quello in posizione 2 solo i nuclei di ossigeno, quindi serve da controllo. (Nel sistema del laboratorio, i due rivelatori non si troverebbero uno di fronte all’altro, ma in quello del centro di massa; essi lo sono.) Il nostro esperimento consiste nel misurare le probabilità di diffusione in varie direzioni. Sia f (✓) l’ampiezza di diffusione entro i contatori, quando essi sono posti in corrispondenza a un angolo ✓; allora | f (✓)|2 sarà la nostra probabilità, determinata sperimentalmente. Ora noi potremmo mettere su un altro esperimento nel quale i nostri contatori rispondano tanto alle particelle ↵ quanto ai nuclei di ossigeno. In questo caso, ci dovremmo ricavare quel che
D1
D1
O
Ossigeno
Particella
Ossigeno
Particella
O
D2
D2 (a)
FIGURA
3.7
Diffusione di particelle α da parte di un nucleo di ossigeno, vista nel sistema del centro di massa.
(b)
34
Capitolo 3 • Ampiezze di probabilità
Elettrone
D1
D1
Spin «su»
Spin «su»
Elettrone
Spin «su»
© 978-8808-22107-0
Spin «su»
Elettrone
Elettrone
Spin «su»
Spin «su»
Spin «su»
Spin «su» D2
D2 (a)
FIGURA
3.8
(b)
Diffusione di elettroni su elettroni. Se gli elettroni hanno gli spin paralleli i processi (a) e (b) sono indistinguibili.
accade quando non ci curiamo di distinguere le particelle che vengono contate. Naturalmente, se vogliamo un ossigeno in posizione ✓, ci dovrà essere una particella ↵ dall’altra parte, cioè in corrispondenza dell’angolo ⇡ ✓, come mostra la FIGURA 3.7b. Perciò se f (✓) è l’ampiezza di diffusione delle particelle ↵ a un angolo ✓, allora f (⇡ ✓) è l’ampiezza di diffusione dell’ossigeno sempre a un angolo ✓ (1) . Perciò, la probabilità di avere una particella qualsiasi nel rilevatore in posizione 1 è: probabilità di una particella qualsiasi in D1 = | f (✓)| 2 + | f (⇡
✓)| 2
(3.14)
Si noti che i due stati sono distinguibili, in linea di principio. Benché in questa esperienza noi non li distinguiamo, potremmo farlo. Secondo la nostra precedente discussione, allora, dobbiamo sommare le probabilità, e non le ampiezze. Il risultato esposto sopra è corretto per svariati nuclei bersaglio – per particelle ↵ su ossigeno, su carbonio, su berillio e su idrogeno. Ma è errato per particelle ↵ su particelle ↵. Per l’unico caso in cui le due particelle sono esattamente uguali, i dati sperimentali contrastano con la previsione della (3.14). Per esempio, la probabilità di diffusione a 90° è esattamente il doppio di quella prevista dalla suddetta teoria, e non ha nulla a che vedere con il fatto che le particelle sono nuclei di «elio». Se il bersaglio è He3 , ma i proiettili sono particelle ↵ (He4 ), allora c’è accordo. Solo quando il bersaglio è He4 – così che i suoi nuclei sono identici alle particelle ↵ che li raggiungono – la diffusione varia con l’angolo in maniera particolare. Forse voi già avete capito la spiegazione. Una particella ↵ può arrivare al contatore in due modi diversi: dopo essere stata diffusa di un angolo ✓, oppure di un angolo ⇡ ✓. Come si fa a dire se la particella che è entrata nel contatore è il proiettile o il bersaglio? La risposta è che non si può. Nel caso di particelle ↵ su particelle ↵ ci sono due alternative che non si possono distinguere. Qui, dunque, sono le ampiezze di probabilità che sommandosi interferiscono, e la probabilità di trovare una particella ↵ nel contatore è il quadrato della loro somma: probabilità di una particella ↵ in D1 = | f (✓) + f (⇡
✓)| 2
(3.15)
(1) In generale, una direzione di diffusione viene a essere individuata da due angoli, l’angolo polare e l’angolo azimutale ✓. Noi dovremmo allora dire che a un nucleo di ossigeno nella direzione (✓, ) corrisponde una particella ↵ nella direzione (⇡ ✓, + ⇡). Tuttavia, per la diffusione coulombiana (e per molti altri casi), l’ampiezza di diffusione è indipendente da . Quindi l’ampiezza di probabilità di avere un ossigeno in ✓ è uguale a quella di avere la particella ↵ in ⇡ ✓.
D1
D1
Spin «su»
Spin «giù»
Elettrone
Elettrone
Spin «su»
Spin «giù»
Elettrone
Elettrone
Spin «su»
Spin «giù»
Spin «giù»
Spin «su» D2
D2
(b)
(a)
FIGURA
3.9
35
3.4 • Particelle identiche
© 978-8808-22107-0
Diffusione di elettroni con spin antiparalleli.
Questo risultato è completamente differente da quello dell’equazione (3.14). Per esempio, consideriamo un angolo uguale a ⇡/2, perché è facile da immaginare. Per ✓ = ⇡/2 si ha ovviamente f (✓) = f (⇡
✓)
e quindi la probabilità nella (3.15) diviene | f (⇡/2) + f (⇡/2)| 2 = 4 | f (⇡/2)| 2 D’altra parte, in assenza di interferenza, il risultato della (3.14) dà semplicemente 2| f (⇡/2)|2 . Quindi, come c’era da aspettarsi, a 90° si ha una diffusione doppia. Naturalmente, i risultati saranno differenti anche ad altri angoli. Di conseguenza, abbiamo ottenuto il risultato inconsueto che per particelle identiche avviene un fenomeno che non si registra quando le particelle possono essere distinte. Nella descrizione matematica del fenomeno, bisogna sommare le ampiezze relative alle varie alternative in cui le particelle si scambiano il ruolo e si ottiene un’interferenza. Una cosa che ci lascia ancora più perplessi accade se facciamo lo stesso tipo di esperimento per la diffusione di elettroni su elettroni, oppure di protoni su protoni. In tal caso, nessuno dei due risultati precedenti è corretto! Per questo tipo di particelle, dobbiamo invocare un’altra regola ancora, una regola delle più singolari, che è la seguente: in una situazione in cui l’identità di un elettrone, incidente in un punto, viene scambiata con quella di un altro, la nuova ampiezza interferisce con la precedente con fase opposta. Si ha, è vero, interferenza, ma con un segno meno. Nel caso delle particelle ↵, quando si scambia quella che giunge al rilevatore, le due ampiezze interferiscono con il segno più. Nel caso degli elettroni, le ampiezze che si differenziano per lo scambio, interferiscono con il segno negativo. A parte un altro dettaglio che discuteremo più avanti, l’equazione giusta per gli elettroni in un esperimento come quello rappresentato nella FIGURA 3.8 è probabilità di el. in D1 = | f (✓) f (⇡ ✓)| 2 (3.16) La relazione precedente va meglio precisata, perché non abbiamo tenuto conto dello spin dell’elettrone (le particelle ↵ non hanno spin). Lo spin dell’elettrone può essere considerato o «su» o «giù» rispetto al piano di diffusione. Se l’energia dell’esperimento è abbastanza bassa, le forze di natura magnetica, dovute alle correnti, saranno piccole e lo spin non ne sarà influenzato. Supporremo che questo sia il caso nella nostra situazione, e che quindi non vi sia la possibilità di una variazione dello spin durante la collisione. L’elettrone si porta sempre dietro il suo spin, qualunque questo sia. Vedete allora che ci sono molte alternative possibili. La particella proiettile
36
Capitolo 3 • Ampiezze di probabilità
TABELLA
3.1
© 978-8808-22107-0
Diffusione di particelle di spin un mezzo non polarizzate.
Frazione dei casi
Spin della particella 1
Spin della particella 2
Spin in D1
Spin in D2
1/4
«su»
«su»
«su»
«su»
| f (✓)
f (⇡
✓)|2
1/4
«giù»
«giù»
«giù»
«giù»
| f (✓)
f (⇡
✓)|2
«su»
«giù»
«giù»
«su»
| f (⇡
✓)|2
«su»
«giù»
| f (⇡
✓)|2
«giù»
«su»
1/4 1/4
«su» «giù»
Probabilità totale =
«giù»
(
«su»
(
1 | f (✓) 2
f (⇡
✓)|2 +
Probabilità
1 1 | f (✓)|2 + | f (⇡ 2 2
| f (✓)|2
| f (✓)|2 ✓)|2
e quella bersaglio, possono avere entrambe gli spin «su», o entrambe «giù», o l’uno opposto all’altro. Se gli spin sono tutti e due «su», come in FIGURA 3.8 (o se entrambi sono «giù»), lo stesso avverrà per le particelle uscenti e l’ampiezza del processo è la differenza delle ampiezze relative alle due possibilità che sono illustrate nelle FIGURE 3.8a e 3.8b. La probabilità di rivelare un elettrone in D1 si ottiene allora dall’equazione (3.16). Supponiamo, però, che il «proiettile» abbia lo spin «su» e che il «bersaglio» lo abbia in «giù». L’elettrone che finisce dentro il contatore 1 può avere lo spin «su» o «giù» e misurando il suo spin possiamo dire se proveniva dal fascio incidente o dal bersaglio. Le due possibilità sono rappresentate nelle FIGURE 3.9a e 3.9b; esse sono distinguibili in linea di principio, e quindi non si ha interferenza, ma solo una somma delle due probabilità. Lo stesso ragionamento vale se entrambi gli spin di partenza sono invertiti, cioè, se lo spin a sinistra è «giù» e quello a destra «su». Se poi i nostri elettroni sono presi a caso – per esempio, da un filo di tungsteno, in cui essi sono completamente non polarizzati – allora ci sono cinquanta probabilità su cento che un particolare elettrone venga fuori con lo spin «su», e altrettante per lo spin «giù». Se non ci curiamo di misurare lo spin dell’elettrone a nessuno stadio dell’esperimento, siamo nel caso di un’esperienza senza polarizzazione, come si suol dire. I risultati si ottengono più agevolmente facendo una lista di tutte le varie possibilità, com’è riportato nella TABELLA 3.1. Si calcola la probabilità per ogni alternativa distinguibile. La probabilità totale è data allora dalla somma delle varie probabilità prese separatamente. Si noti che per un fascio non polarizzato, il risultato per ✓ = ⇡/2 è uguale alla metà di quello classico con le particelle indipendenti. Il comportamento delle particelle identiche ha molte conseguenze interessanti che saranno discusse con maggiori dettagli nel prossimo capitolo.
4
Particelle identiche
4.1
Particelle di Bose e particelle di Fermi
Nel capitolo precedente avevamo cominciato a considerare le particolari regole relative all’interferenza che ha luogo nei processi con due particelle identiche. Per particelle identiche intendiamo oggetti, come gli elettroni, che non possono essere in alcun modo distinti tra loro. Se a un dato processo prendono parte due particelle identiche, lo scambio di quella che arriva in un contatore con l’altra dà luogo a un’alternativa che non può essere distinta e – come in tutti i casi in cui ci sono delle possibilità indistinguibili – la corrispondente ampiezza interferisce con quella di partenza, cioè quella senza scambio. Quindi l’ampiezza per un dato evento è la somma di due ampiezze che interferiscono; ma, fatto molto interessante, l’interferenza avviene in certi casi con la stessa fase, in altri, con fasi opposte. Supponiamo di avere una collisione tra due particelle a e b, dopo la quale la particella a esce in direzione 1 e b in direzione 2, come si vede in FIGURA 4.1a. Sia f (✓) l’ampiezza per questo processo; la probabilità P1 di osservare un tale evento è allora proporzionale a | f (✓)|2 . Naturalmente, potrebbe anche accadere che la particella b arrivi al contatore 1 e che a finisca nel contatore 2, come mostra la FIGURA 4.1b. Ammettendo che non ci siano direzioni privilegiate, definite dallo spin o altro, la probabilità P2 per questo processo è semplicemente | f (⇡ ✓)|2 , perché esso è del tutto equivalente al primo processo con il contatore 1 spostato in corrispondenza dell’angolo ⇡ ✓. Potreste anche pensare che l’ampiezza per il secondo processo sia semplicemente f (⇡ ✓). Ma ciò non è necessariamente vero, perché ci potrebbe essere un fattore di fase arbitrario. Ovvero, l’ampiezza potrebbe risultare ei f (⇡
Ripasso: Radiazione del corpo nero, vol. 1, cap. 41, Il moto browniano cap. 42, Applicazioni della teoria cinetica
✓)
Un’ampiezza siffatta porta ancora a una probabilità P2 data da | f (⇡ ✓)|2 . Vediamo ora cosa succede se a e b sono particelle identiche. In questo caso, i due processi differenti mostrati schematicamente in FIGURA 4.1 sono indistinguibili. C’è solo un’ampiezza per
1
a
1
b
a
b
4.1 Nella diffusione di due particelle identiche i processi (a) e (b) sono indistinguibili. FIGURA
2
2
38
Capitolo 4 • Particelle identiche
© 978-8808-22107-0
Neutrone Protone
FIGURA
4.2
La diffusione di due particelle α. (a) le due particelle si mantengono inalterate; (b) nel corso della collisione viene scambiato un neutrone.
l’evento in cui indifferentemente a oppure b arrivano al contatore 1, mentre l’altra delle due particelle finisce al contatore 2. Questa ampiezza è la somma delle due relative ai processi in i FIGURA 4.1. Se indichiamo la prima con f (✓), allora la seconda risulta e f (⇡ ✓) ; e in questo caso il fattore di fase è molto importante perché dobbiamo sommare le due ampiezze. Supponiamo che occorra moltiplicare l’ampiezza per un certo fattore di fase quando le due particelle si scambiano i ruoli. Se le scambiamo poi di nuovo, dovremo moltiplicarle un’altra volta per lo stesso fattore. Ma con questa operazione siamo tornati al primo processo. Il fattore di fase applicato due volte deve riportarci al punto di partenza – cioè, il suo quadrato deve essere 1. Ci sono quindi solo due possibilità: o ei è uguale a +1, oppure è uguale a 1. O il processo con le particelle scambiate si somma con lo stesso segno, oppure con il segno opposto. Tutt’e due i casi si verificano in natura, ognuno di essi per una classe differente di particelle. Le particelle che interferiscono con il segno positivo si chiamano particelle di Bose, quelle che invece interferiscono con il segno negativo si dicono particelle di Fermi. Sono particelle di Bose il fotone, i mesoni e il gravitone. Sono, invece, particelle di Fermi l’elettrone, il muone, i neutrini, i nucleoni e i barioni. In conclusione, per l’ampiezza di diffusione di particelle identiche si ha: Particelle di Bose:
Particelle di Fermi:
(ampiezza diretta) + (ampiezza scambiata)
(4.1)
(ampiezza diretta)
(4.2)
(ampiezza scambiata)
Per particelle con spin, come gli elettroni, si ha un’ulteriore complicazione. Non solo va specificata la posizione delle particelle, ma anche la direzione dei loro spin. Solamente quando vengono scambiate particelle identiche in identici stati di spin si ha l’interferenza delle ampiezze. Se state considerando un processo di diffusione di fasci non polarizzati, che sono miscugli di differenti stati di spin, allora occorre un po’ più di aritmetica. Quando si ha a che fare con due o più particelle fortemente legate, sorge un problema interessante. Per esempio, una particella ↵ è composta di quattro particelle – due neutroni e due protoni. Nella diffusione di due particelle ↵, si hanno varie possibilità. Può accadere, durante la diffusione, che ci sia un’ampiezza non nulla per il salto di un neutrone da una particella ↵ all’altra, mentre un neutrone della seconda fa viceversa, di modo che le due ↵ che vengono fuori dalla diffusione non sono quelle di partenza, in quanto si è avuto lo scambio di una coppia di neutroni (FIGURA 4.2). L’ampiezza di diffusione con scambio di due neutroni interferirà con quella senza tale scambio, e l’interferenza si avrà con un segno meno, perché è avvenuta la sostituzione di una coppia di particelle di Fermi. D’altra parte, se l’energia relativa delle due particelle ↵ è tanto piccola che esse non si avvicinano mai troppo l’una all’altra – a causa della repulsione
© 978-8808-22107-0
39
4.2 • Stati di due particelle di Bose
coulombiana, per esempio – e non si ha quindi una probabilità apprezzabile per lo scambio di nessuno dei componenti interni, allora possiamo considerare la particella ↵ come un oggetto semplice e non è necessario prendere in considerazione la sua struttura interna. In tali condizioni, si hanno solo due contributi all’ampiezza di diffusione. O non si ha alcuno scambio, oppure si scambiano nella diffusione tutti e quattro i nucleoni insieme. Poiché i protoni e i neutroni nella particella ↵ sono tutti particelle di Fermi, lo scambio di una coppia qualsiasi di essi porta a un cambiamento di segno nell’ampiezza. Finché non si hanno variazioni nella struttura interna della particella ↵, scambiarne due equivale a scambiare quattro coppie di particelle di Fermi. Si ha un’inversione di segno per ogni coppia, e il risultato finale è che le ampiezze si combinano con il segno più. La particella ↵ si comporta come una particella di Bose. Ne consegue la regola che un oggetto composto, quando può essere considerato come semplice, si comporta come una particella di Bose o di Fermi, a seconda che contenga un numero pari o dispari di particelle di Fermi. Tutte le particelle elementari di Fermi che abbiamo menzionato – come l’elettrone, il protone, il neutrone e così via – hanno spin j = 1/2. Se diverse particelle di Fermi siffatte sono messe insieme a formare una struttura composta, lo spin risultante può essere intero o semi-intero. Per esempio, l’isotopo più comune dell’elio, l’He4 , che è composto da due neutroni e due protoni, ha spin 0, mentre il Li7 , fatto di tre protoni e quattro neutroni, ha spin 3/2. Impareremo in seguito le leggi di composizione del momento angolare(1) , ma anticipiamo fin da ora che ogni oggetto composto cha ha spin totale semi-intero si comporta come una particella di Fermi, mentre se ha spin totale intero si comporta come una particella di Bose. Questo fatto fa sorgere un’interessante questione: perché gli oggetti a spin semi-intero sono particelle di Fermi, le cui ampiezze si sommano con un segno meno, mentre quelli con spin intero sono particelle di Bose, le cui ampiezze si sommano con un segno positivo? Ci scusiamo per non sapervene dare una spiegazione elementare. La ragione fu trovata da Pauli in base a complicati ragionamenti di teoria quantistica dei campi e relatività. Egli ha mostrato che le due cose sono necessariamente connesse, ma non siamo stati capaci di trovare il modo di riproporre il suo ragionamento a livello elementare. Sembra che questo sia uno di quei pochi casi in fisica in cui un risultato può essere enunciato molto semplicemente, mentre nessuno è mai riuscito a trovarne la dimostrazione in termini semplici e immediati. La spiegazione ha le sue radici nel profondo della meccanica quantistica relativistica. Questo significa probabilmente che non abbiamo una comprensione completa del principio fondamentale che sta alla base del risultato. Per il momento, dovete prendere questo fatto come una delle leggi dell’universo.
4.2
Stati di due particelle di Bose
Vogliamo ora discutere una conseguenza interessante della legge di addizione per le particelle di Bose. Si tratta del loro comportamento quando ce ne sono molte insieme. Cominciamo col considerare un caso in cui due particelle di Bose interagiscano con due diffusori diversi. Non ci interessiamo dei particolari del meccanismo di diffusione. Ci importa solo ciò che accade delle particelle diffuse. Supponiamo di trovarci nelle condizioni mostrate in FIGURA 4.3. La particella a è diffusa nello stato 1. Per stato intendiamo una data direzione ed energia, o qualche altra fissata condizione. La particella b è diffusa nello stato 2. Vogliamo ammettere che gli stati 1 e 2 siano approssimativamente gli stessi. (Quel che realmente vogliamo determinare alla fine è l’ampiezza nel caso che le due particelle siano diffuse nella stessa direzione, ovvero nello stesso stato; ma la cosa migliore è considerare prima cosa succede se gli stati sono quasi gli stessi, e poi studiare il caso in cui divengono identici.) Supponendo che ci fosse solo la particella a, avremmo una certa ampiezza per la diffusione in direzione 1, che indichiamo con h1|ai. E la particella b da sola avrebbe un’ampiezza h2|bi di finire in direzione 2. Se le due particelle non sono identiche, l’ampiezza, perché le due diffusioni (1)
Si indica con questo nome, spesso, il momento della quantità di moto. (N.d.T.)
1 2
a b
4.3 Diffusione di due particelle verso stati finali vicini. FIGURA
40
Capitolo 4 • Particelle identiche
© 978-8808-22107-0
avvengano contemporaneamente, è semplicemente il prodotto h1 | ai h2 | bi Quindi la probabilità per questo evento è |h1 | ai h2 | bi| 2 che è anche uguale a
|h1 | ai| 2 |h2 | bi| 2
Per non stare tanto a scrivere nel corso di questi ragionamenti, porremo talvolta h1 | ai = a1
h2 | bi = b2
Quindi la probabilità della doppia diffusione è |a1 | 2 |b2 | 2 Ma potrebbe anche accadere che la particella b venga diffusa nella direzione 1, e che la particella a esca in direzione 2. L’ampiezza per questo processo è h2 | ai h1 | bi mentre la probabilità corrispondente è |h2 | ai h1 | bi| 2 = |a2 | 2 |b1 | 2 Immaginiamo ora di avere una coppia di minuscoli contatori che raccolgono le particelle diffuse. La probabilità P2 che essi rivelino insieme le due particelle è proprio la somma P2 = |a1 | 2 |b2 | 2 + |a2 | 2 |b1 | 2
(4.3)
Supponiamo ora che le direzioni 1 e 2 siano molto vicine tra loro. Ci aspettiamo che a vari in modo regolare con la direzione, di modo che a1 e a2 tendano l’una all’altra quando 1 e 2 si avvicinano. Se queste sono abbastanza prossime, le ampiezze a1 e a2 saranno uguali. Possiamo porre a1 = a2 e indicarle entrambe con a; analogamente, poniamo b1 = b2 = b. Si ottiene allora che P2 = 2 |a| 2 |b| 2 (4.4) Supponiamo ora che a e b siano particelle identiche di Bose. Allora il processo in cui a va in 1 e b in 2 non può essere distinto da quello scambiato in cui a va in 2 e b va in 1. In questo caso le ampiezze dei due processi possono interferire. L’ampiezza totale per una particella in ciascuno dei due contatori è h1 | ai h2 | bi + h2 | ai h1 | bi (4.5) E la probabilità di rivelare la coppia è il modulo quadrato di quest’ampiezza, P2 = |a1 b2 + a2 b1 | 2 = 4 |a| 2 |b| 2
(4.6)
Abbiamo così ottenuto il risultato che è due volte più probabile trovare due particelle identiche di Bose diffuse nello stesso stato, di quanto avreste ottenuto dal calcolo supponendo le particelle diverse. Abbiamo considerato che le particelle siano rivelate da due diversi contatori, ma questo non è essenziale, come si può mostrare nel modo seguente. Immaginiamo che tutte e due le direzioni 1 e 2 portino a un singolo piccolo contatore posto a una certa distanza. La direzione 1 è definita precisando che essa conduce in corrispondenza all’elemento di superficie dS1 del contatore. La direzione 2 punta invece verso l’elemento di superficie dS2 del contatore stesso. (Supponiamo che il contatore sia sistemato con una superficie ortogonale alle direzioni di diffusione.) Non si può dare la probabilità che una particella si muova in una direzione precisa o verso un particolare
4.2 • Stati di due particelle di Bose
© 978-8808-22107-0
punto dello spazio. Una tal cosa è impossibile – essendo la probabilità per una qualunque esatta direzione uguale a zero. Se vogliamo essere precisi, dobbiamo definire le nostre ampiezze in modo che esse diano la probabilità di arrivo per unità di superficie sul contatore. Se avessimo una sola particella a, questa avrebbe una certa ampiezza per la diffusione in direzione 1. Definiamo h1|ai = a1 come l’ampiezza che a subisca una diffusione verso l’elemento unitario di superficie nella direzione 1. In altri termini, la scala di a1 viene scelta – si dice anche che a1 è «normalizzata» – in modo che la probabilità che la particella sia diffusa verso un elemento di superficie dS1 sia |h1 | ai| 2 dS1 = |a1 | 2 dS1
(4.7)
Se il nostro contatore ha una superficie totale S, e facciamo variare dS1 su tutta quest’area, otteniamo, per la probabilità totale che la particella a sia diffusa nel contatore, l’espressione ⌅ |a1 | 2 dS1 (4.8) S
Come in precedenza, ammetteremo che il contatore sia sufficientemente piccolo da far sì che a1 non vari apprezzabilmente su tutta la sua superficie; a1 è allora un’ampiezza costante che indicheremo con a. Perciò la probabilità che la particella a sia diffusa verso qualche punto del contatore è pa = |a| 2 S (4.9) Allo stesso modo, avremo che la probabilità che la particella b – quando è presa da sola – venga diffusa verso un certo elemento di superficie, diciamo dS2 , è |b2 | 2 dS2
(Usiamo dS2 , invece che dS1 perché, in seguito, supporremo che a e b vadano in direzioni diverse.) Di nuovo, poniamo b2 uguale all’ampiezza costante b; allora la probabilità che la particella b venga contata al rilevatore è pb = |b| 2 S (4.10) Quando entrambe le particelle sono presenti, la probabilità che a sia diffusa verso dS1 e b verso dS2 è |a1 b2 | 2 dS1 dS2 = |a| 2 |b| 2 dS1 dS2 (4.11) Se vogliamo la probabilità che sia a sia b entrino nel contatore, integriamo sia dS1 sia dS2 su tutto S e otteniamo che P2 = |a| 2 |b| 2 ( S)2 (4.12)
Notiamo, per inciso, che questa è proprio uguale a pa pb , come si sarebbe potuto immaginare ammettendo che a e b si muovano indipendentemente l’una dall’altra. Quando, però, le due particelle sono identiche, si hanno due possibilità indistinguibili per ogni coppia di elementi di superficie dS1 e dS2 . La possibilità che a vada in dS2 e b in dS1 è indistinguibile dall’alternativa che a finisca su dS1 e b su dS2 , quindi le ampiezze per questi processi interferiranno. (Nel caso precedente, quando si avevano due particelle differenti – anche se non ci curavamo effettivamente di determinare quale particella finisse in un dato rilevatore – potevamo però farlo in linea di principio; e perciò non si aveva interferenza. Invece per particelle identiche non lo si può stabilire, nemmeno in teoria.) Dobbiamo, perciò, scrivere che la probabilità che le due particelle giungano in dS1 e dS2 è |a1 b2 + a2 b1 | 2 dS1 dS2
(4.13)
Ora, però, quando integriamo sulla superficie del contatore, dobbiamo fare attenzione. Se facciamo variare dS1 e dS2 sull’intera superficie S, finiamo per contare due volte ciascun elemento di superficie, in quanto la (4.13) include tutte le possibilità che si possono avere in corrispondenza alla coppia arbitraria di elementi di superficie dS1 e dS2 (2) . Possiamo ancora eseguire in tal modo (2) Se nella (4.11) si scambiano dS e dS si ottiene un diverso evento, cosicché ambedue gli elementi di superficie vanno 1 2 fatti variare su tutta l’estensione del contatore. Invece nella (4.13) consideriamo dS1 e dS2 in coppia e includiamo tutti i possibili eventi. Se, quindi, si estendono nuovamente gli integrali a comprendere ciò che accade se dS1 e dS2 vengono scambiati, tutto risulta contato due volte.
41
42
Capitolo 4 • Particelle identiche
© 978-8808-22107-0
l’integrale, pur di compensare questo doppio conteggio dividendo il risultato per 2. Otteniamo allora che P2 per particelle identiche di Bose è uguale a ) 1( P2 (Bose) = 4 |a| 2 |b| 2 ( S)2 = 2 |a| 2 |b| 2 ( S)2 (4.14) 2 Ancora una volta, questo è proprio il doppio di quanto si è ricavato con la (4.12) per particelle distinguibili. Se immaginiamo per un momento di sapere già che il canale b ha inviato la sua particella nella direzione scelta, possiamo dire che la probabilità che una seconda particella arrivi nella stessa direzione è il doppio di quanto ci saremmo aspettati se questo fosse stato calcolato come un evento indipendente. È una proprietà delle particelle di Bose che, se c’è già una particella in un certo stato qualsiasi, la probabilità che una seconda si porti nelle stesse condizioni è due volte quella che si avrebbe se la prima non vi fosse già. Questo fatto viene spesso enunciato nel modo seguente: se c’è già una particella di Bose p in un certo stato, l’ampiezza che un’altra si venga a mettere insieme alla prima, è uguale a 2 volte quella che si avrebbe in assenza di quest’ultima. (Questa non è un’enunciazione giusta dal punto di vista fisico in cui ci siamo messi, ma se viene usata coerentemente come regola, porta, naturalmente, al risultato giusto.)
4.3 12
3 ... n
a b c
4.4
Estendiamo questi risultati al caso in cui siano presenti n particelle. Immaginiamo di essere nella situazione di FIGURA 4.4. Si hanno n particelle a, b, c,..., che vengono diffuse e finiscono nelle direzioni 1, 2, 3,..., n. Tutte le n direzioni puntano verso un piccolo contatore posto a grande distanza. Come nel paragrafo precedente, scegliamo la normalizzazione di tutte le ampiezze in modo che ciascuna particella, da sola, abbia una probabilità di finire in corrispondenza a un elemento di superficie dS del contatore, uguale a
...
Diffusione di n particelle verso stati finali vicini. FIGURA
Stati con n particelle di Bose
|h
i| 2 dS
Ammettiamo, dapprima, che tutte le particelle siano tra loro distinguibili; ne segue che la probabilità che n particelle siano osservate insieme su n differenti elementi di superficie è |a1 b2 c3 . . .| 2 dS1 dS2 dS3 . . .
(4.15)
|a| 2 |b| 2 |c| 2 . . . dS1 dS2 dS3 . . .
(4.16)
Pn (diverse) = |a| 2 |b| 2 |c| 2 . . . ( S)n
(4.17)
Ammettiamo anche questa volta che le ampiezze non dipendano dalla posizione di dS sul contatore (supposto piccolo) e chiamiamole a, b, c,... semplicemente. La probabilità (4.15) diviene Integrando ciascun dS sulla superficie S del contatore, abbiamo che Pn (diverse), probabilità di contare n particelle diverse in una volta, è Questo è appunto il prodotto delle probabilità che ciascuna particella separatamente ha di entrare nel contatore. Le particelle si muovono tutte indipendentemente – la probabilità che una di esse entri nel contatore non dipende da quante altre entrano nello stesso tempo. Supponiamo ora che si tratti di particelle identiche di Bose. Per ogni insieme di direzioni 1, 2, 3,... ci sono tante possibilità indistinguibili. Se, per esempio, ci fossero solo tre particelle, avremmo le seguenti possibilità: a!1 b!2 c!3
a!1 b!3 c!2
a!2 b!1 c!3
a!2 b!3 c!1
a!3 b!1 c!2
a!3 b!2 c!1
4.4 • Emissione e assorbimento di fotoni
© 978-8808-22107-0
Si possono avere sei diverse combinazioni. Con n particelle, si hanno n! possibilità diverse, ma indistinguibili, le cui ampiezze vanno sommate. Ne segue che la probabilità che n particelle vengano contate su n elementi di superficie è |a1 b2 c3 · · · + a1 b3 c2 · · · + a2 b1 c3 . . .
+a2 b3 c1 · · · + ecc.| 2 dS1 dS2 dS3 . . . dSn
(4.18)
Ancora una volta, ammettiamo che tutte le direzioni siano così prossime una all’altra da poter porre a1 = a2 = · · · = an , e analogamente per b, c,...; la probabilità della (4.18) diviene |n!abc . . .| 2 dS1 dS2 . . . dSn
(4.19)
Integrando ciascun dS su tutta l’estensione del contatore, ogni possibile prodotto di elementi di superficie viene contato n! volte; a questo si rimedia dividendo per n! e si ottiene Pn (Bose) = ossia
1 |n!abc . . .| 2 ( S)n n!
Pn (Bose) = n! |abc . . .| 2 ( S)n
(4.20)
Pn (Bose) = n! Pn (diverse)
(4.21)
Paragonando questo risultato con la (4.17), vediamo che la probabilità di contare contemporaneamente n particelle di Bose è n! volte maggiore di quella che si calcola supponendole distinguibili. Possiamo riassumere il risultato nel modo seguente:
Dunque, la probabilità nel caso di Bose è più grande di un fattore n! rispetto ai calcoli fatti assumendo le particelle distinguibili. Possiamo meglio renderci conto del significato di questo fatto, se ci poniamo il seguente problema: qual è la probabilità che una particella di Bose si porti in un certo stato quando ce ne sono già altre n presenti? Indichiamo con w la particella aggiunta per ultima. Nel caso di n + 1 particelle, compresa w, l’equazione (4.20) diviene Pn+1 (Bose) = (n + 1)! |abc . . . w| 2 ( S)n+1
(4.22)
Possiamo scriverla in questi termini:
oppure
( ) Pn+1 (Bose) = (n + 1) |w| 2 S n! |abc . . .| 2 ( S)n Pn+1 (Bose) = (n + 1) |w| 2 S Pn (Bose)
(4.23)
Questo risultato può essere messo nella forma seguente: il numero |w|2 S è la probabilità che la particella w arrivi al rilevatore quando non ci sono altre particelle presenti; Pn (Bose) è la probabilità che ce ne siano già altre n di Bose. Quindi, la (4.23) ci dice che quando ci sono altre n particelle identiche di Bose, la probabilità che un’altra ancora si porti nello stesso stato è aumentata di un fattore (n + 1). La probabilità di trovare un bosone, dove se ne hanno già n, è n + 1 volte maggiore di quanto sarebbe se prima non ce ne fosse stato nessuno. La presenza delle altre particelle aumenta la probabilità di trovarne una di più.
4.4
Emissione e assorbimento di fotoni
Quanto detto finora si riferiva a un processo come la diffusione di particelle ↵. Ma questo non è essenziale; avremmo potuto parlare della creazione di particelle o dell’emissione della luce, per esempio. Quando viene emessa della luce, si «crea» un fotone. In tal caso, le linee entranti in
43
44
Capitolo 4 • Particelle identiche
© 978-8808-22107-0
4.4 non sono necessarie; basta considerare che ci siano n atomi a, b, c,... che emettono luce, come in FIGURA 4.5. In tal caso, il nostro risultato può essere anche enunciato nel modo seguente: la probabilità che un atomo emetta un fotone in un particolare stato finale è aumentata del fattore (n + 1) se già n fotoni si trovano in quello stato. Si suole riassumere p questa legge dicendo che l’ampiezza per l’emissione di un fotone è aumentata di un fattore n + 1 quando già ci sono n fotoni presenti. Naturalmente, è solo un altro modo di dire la stessa cosa, se si sottintende che quest’ampiezza va quadrata per ottenere la probabilità. In meccanica quantistica risulta vero, in generale, che l’ampiezza per il passaggio da un dato stato a un altro è la complessa coniugata dell’ampiezza da a : FIGURA
1
2
3 ... n
4.5 Creazione di n fotoni in stati vicini. FIGURA
h | i = h | i⇤
(4.24)
Tratteremo questa legge un po’ più avanti, ma per il momento la supporremo vera. La sfrutteremo per trovare come i fotoni siano diffusi o assorbiti a partire da un certo stato. Si ha che l’ampiezza per un fotone che arriva in un certo stato, chiamiamolo i, in cui già n fotoni sono presenti è, simbolicamente, p hn + 1 | ni = n + 1 a (4.25) dove a = hi | ai è l’ampiezza quando non ce ne sono altri. Per la (4.24), l’ampiezza per il processo inverso – per passare da n + 1 fotoni a n – è p hn | n + 1i = n + 1 a⇤ (4.26) Questo non è il modo con il quale usualmente ci si esprime; la gente non ama pensare di passare da n+1 a n, ma preferisce sempre partire da n fotoni. Si dice allora che l’ampiezza per l’assorbimento di un fotone quando se ne hanno già n – in altre parole, l’ampiezza per il passaggio da n a n 1 –è p hn 1 | ni = n a⇤ (4.27) equazione che, ovviamente, è proprio la stessapdellap(4.26). Però in questo caso si hanno spesso delle difficoltà per ricordarsi quando ci vuole n o n + 1. Per ricordarselo, si fa così: il fattore davanti è sempre la radice quadrata del massimo numero di fotoni presenti, non importa se prima o dopo la reazione. Le equazioni (4.25) e (4.26) mostrano che la legge è in realtà simmetrica; essa appare non simmetrica soltanto se la scrivete nella forma dell’equazione (4.27). Da queste nuove regole si possono trarre molte conseguenze fisiche; vogliamo descriverne una che è in relazione con l’emissione della luce. Immaginiamo una situazione in cui i fotoni sono contenuti in una scatola; potete pensare a una scatola con degli specchi al posto delle pareti. Supponiamo ora di avere nella scatola n fotoni, tutti nello stesso stato – frequenza, direzione e polarizzazione – i quali perciò siano indistinguibili, e che nella scatola ci sia, inoltre, un atomo che può emettere un altro fotone nello stesso stato. Allora la probabilità che esso emetta un fotone è data da (n + 1) |a| 2 (4.28) mentre la probabilità che esso assorba un fotone è n |a| 2
(4.29)
dove |a|2 è la probabilità di emissione se non vi fossero fotoni presenti. Abbiamo già discusso queste regole, in maniera un po’ diversa, nel cap. 42 del vol. 1. L’equazione (4.29) mostra come la probabilità che un atomo assorba un fotone e compia una transizione a uno stato più alto d’energia sia proporzionale alla luce che lo illumina. Ma, come notò Einstein per la prima volta, la velocità con cui un atomo compie la transizione inversa dipende da due cose. La prima è la probabilità che compia una transizione spontanea |a|2 , la seconda è la probabilità che compia una transizione indotta n |a|2 , che è proporzionale all’intensità della luce – cioè al numero di fotoni presenti. Inoltre, come affermò Einstein, i coefficienti di assorbimento e di emissione indotta sono uguali e sono legati alla probabilità di emissione spontanea. Ciò che impariamo ora è che, se
45
4.5 • Lo spettro del corpo nero
© 978-8808-22107-0
l’intensità luminosa è misurata in termini del numero di fotoni presenti (invece che come energia per unità di superficie, e per secondo), i coefficienti di assorbimento, di emissione indotta e di emissione spontanea sono tutti uguali. Questo è il significato della relazione tra i coefficienti di Einstein A e B del cap. 42, vol. 1, equazione (42.18).
4.5
Lo spettro del corpo nero
Vogliamo usare le nostre leggi sulle particelle di Bose per discutere ancora una volta lo spettro della radiazione del corpo nero (vedi cap. 42, vol. 1). Ne faremo uso per calcolare quanti fotoni ci sono in una scatola se la radiazione è in equilibrio termico con alcuni atomi nella scatola stessa. Supponiamo che per ogni frequenza ! della luce, ci siano un certo numero N di atomi con due livelli d’energia separati da una distanza E = ~! (FIGURA 4.6). Chiameremo stato «fondamentale» lo stato d’energia più bassa e stato «eccitato» l’altro. Indicheremo, inoltre, con Nf e Ne i numeri medi di atomi nello stato fondamentale e in quello eccitato; all’equilibrio termico alla temperatura T, si ha allora, dalla meccanica statistica, che Ne =e Nf
E/kT
=e
~!/kT
e ∆E =
g Stato fondamentale
e
(4.30) ∆E =
Ogni atomo nello stato fondamentale può assorbire un fotone e passare allo stato eccitato, e viceversa, ogni atomo nello stato eccitato può emettere un fotone e ritornare nello stato fondamentale. All’equilibrio, le velocità di questi due processi devono essere uguali. Tali velocità sono proporzionali alla probabilità dell’evento moltiplicata per il numero di atomi presenti. Sia n il numero medio di fotoni presenti in un dato stato con frequenza !. Allora, la velocità di assorbimento a partire da questo stato è N f n |a|2 , mentre la velocità di emissione nello stesso stato è Ne (n + 1) |a|2 . Uguagliando le due velocità, si ottiene che Nf n = Ne (n + 1)
g Stato fondamentale
4.6 Irradiazione e assorbimento di un fotone di frequenza ω. FIGURA
(4.31)
Combinando questo risultato con la (4.30), si ha n =e n+1 Risolvendo rispetto a n, si trova
~!/kT
1
(4.32) 1 che è il numero medio di fotoni in un qualsiasi stato con frequenza !, per una cavità in equilibrio termico. Poiché ogni fotone ha un’energia pari a ~!, l’energia complessiva dei fotoni in un certo stato è n ~!, ovvero ~! (4.33) e~!/kT 1 Per inciso, abbiamo già incontrato un’equazione simile, in un altro campo (cap. 41, vol. 1, equazione (41.15)). Vi ricorderete che per un qualunque oscillatore armonico – come un peso su una molla – i livelli quantistici di energia sono equispaziati con una separazione ~!, come mostra la FIGURA 4.7. Se indichiamo con n~! l’energia dell’n-esimo livello, troviamo che l’energia media di un tale oscillatore è anch’essa data dalla (4.33). Invece ora abbiamo ritrovato questa equazione per i fotoni, cioè contando delle particelle, e anche in questo caso si ottengono gli stessi risultati. Questa è una delle meraviglie della meccanica quantistica. Se uno comincia con il considerare un qualche stato o condizione per particelle di Bose che non interagiscono l’una con l’altra (abbiamo supposto che i fotoni non interagissero), e quindi suppone che in questo stato possano trovare posto sia zero, che una, due,... e così via fino a un numero arbitrario n di particelle, trova alla fine che un tale sistema si comporta per tutti gli aspetti di interesse in meccanica quantistica esattamente come un oscillatore armonico. Per oscillatore intendiamo un sistema dinamico come un peso n=
e~!/kT
E
5 4 3 2
0 Stato fondamentale
4.7 Livelli energetici di un oscillatore armonico. FIGURA
46
Capitolo 4 • Particelle identiche
© 978-8808-22107-0
su una molla o anche un’onda stazionaria in una cavità risonante. E questa è la ragione per la quale è possibile rappresentare il campo elettromagnetico con particelle fotoniche. Da una parte, possiamo analizzare il campo elettromagnetico in una scatola o in una cavità come un insieme di tanti oscillatori armonici, trattando ciascun modo di vibrazione, secondo la meccanica quantistica, come un oscillatore armonico. Dall’altra, invece, possiamo analizzare lo stesso sistema fisico come insieme di particelle identiche di Bose. E i risultati ottenuti con entrambi i procedimenti sono sempre in esatto accordo. Non c’è alcuna maniera di decidere se il campo elettromagnetico debba in realtà essere descritto come un oscillatore armonico quantizzato oppure determinando quanti fotoni ci sono in ciascuna delle condizioni possibili. I due punti di vista appaiono come matematicamente identici. Quindi, in futuro, possiamo parlare sia del numero di fotoni in un particolare stato nella scatola, sia del numero d’ordine del livello di energia associato con un particolare modo di vibrazione del campo elettromagnetico. Questi sono due modi di dire la stessa cosa. E lo stesso vale per i fotoni in un spazio libero. Essi sono equivalenti alle oscillazioni di una cavità le cui pareti siano state portate all’infinito. Abbiamo calcolato l’energia media di ogni particolare modo di vibrazione in una scatola alla temperatura T; ci serve un’ultima cosa per ottenere la legge della radiazione del corpo nero. Ci occorre conoscere il numero di modi che ci sono per ogni data energia. (Si suppone che per ogni modo ci siano degli atomi nella scatola – o sulle pareti – con livelli di energia appropriati per irradiare in quel particolare modo, cosicché ognuno di essi possa raggiungere l’equilibrio termico.) La legge della radiazione del corpo nero viene usualmente formulata dando l’energia per unità di volume trasportata dalla luce, la cui frequenza si trova in un piccolo intervallo che va da ! a ! + !. Così dobbiamo sapere quanti modi con frequenze nell’intervallo ! ci sono nella scatola. Per quanto questa questione sorga continuamente in meccanica quantistica, è puramente un fatto classico concernente le onde stazionarie. Ricaveremo la risposta solo nel caso di una scatola rettangolare. La soluzione risulta la stessa per una scatola di forma qualsiasi, ma è alquanto complicato calcolarla nel caso generale. Inoltre, ci interessa il solo caso in cui le dimensioni della scatola siano molto grandi rispetto alla lunghezza d’onda della luce. Si hanno allora miliardi e miliardi di modi; ce ne saranno tanti in ogni piccolo intervallo di frequenza !, da poter parlare di «numero medio» in ogni ! alla frequenza !. Cominciamo col chiederci quanti modi si abbiano nel caso unidimensionale, come quello delle onde in una corda vibrante. Voi sapete che ogni modo consiste in un’onda sinusoidale che deve essere zero a entrambe le estremità; in altri termini, ci deve essere un numero intero di mezze lunghezze d’onda tra i due estremi della linea, come si vede in FIGURA 4.8. Preferiamo usare il numero d’onda k = 2⇡/ ; indicando con k j il numero d’onda del modo j-esimo, si ha kj =
j⇡ L
(4.34)
dove j è un intero qualsiasi. La separazione k tra due modi successivi è k = k j+1
kj =
⇡ L
Vogliamo supporre che k L sia così grande che nel piccolo intervallo k vi siano molti modi. Se chiamiamo N il numero di modi nell’intervallo k, otteniamo N=
k L = k ⇡
k.
(4.35)
In realtà, i fisici teorici che lavorano in meccanica quantistica preferiscono dire che ci sono solo metà di tali modi; essi scrivono perciò N=
L 2⇡
k
(4.36)
Vorremmo spiegarne il motivo. Essi sono abituati a ragionare in termini di onde viaggianti, alcune verso destra (con k positivo), altre verso sinistra (con k negativo). Ma un «modo» è un’onda stazionaria che è la sovrapposizione di due onde, una per ciascuna direzione. In altri
47
4.5 • Lo spettro del corpo nero
© 978-8808-22107-0
4.8 Modi stazionari di un’onda in una dimensione. FIGURA
Lx 1
4.9 Modi stazionari di un’onda in due dimensioni. FIGURA
2 Ly
ky k kx
j
L
termini, essi considerano ogni onda stazionaria come due distinti «stati» di fotone. Perciò, se per N si preferisce intendere il numero di stati fotonici con un dato k (dove ora k può assumere valori sia positivi sia negativi), bisogna allora prendere N uguale alla metà. (Tutti gli interi devono ora variare tra k = 1 e k = +1, e in questo modo verrà fuori giusto il numero totale di stati con k, in valore assoluto, minore di un certo numero.) Naturalmente, così facendo, non descriviamo molto appropriatamente le onde stazionarie, ma contiamo i modi in maniera coerente. Vogliamo ora estendere questi risultati al caso tridimensionale. Un’onda stazionaria in una scatola rettangolare deve avere un numero intero di semi-onde lungo ciascun asse. La situazione per due delle dimensioni è rappresentata nella FIGURA 4.9. La direzione e la frequenza di ciascuna onda sono individuate da un vettore numero d’onda k, le cui componenti x, y e z devono soddisfare equazioni simili alla (4.34). Perciò si ha che jx ⇡ Lx jy ⇡ ky = Ly
kx =
kz =
jz ⇡ Lz
Il numero di modi con k x in un intervallo k x è, come in precedenza, Lx 2⇡
kx
e, analogamente, per k y e k z . Se indichiamo con N(k) il numero di modi corrispondenti a un vettore numero d’onda k la cui componente x è compresa tra k x e k x + k x , la y tra k y e k y + k y , e la z tra k z e k z + k z , si ha allora N(k) =
L x Ly Lz (2⇡)3
k x ky kz
(4.37)
Il prodotto L x L y L z è uguale al volume V della scatola. Abbiamo così l’importante risultato che per alte frequenze (lunghezze d’onda piccole rispetto alle dimensioni) il numero di modi in una cavità è proporzionale al volume V della scatola e al «volume nello spazio k» k x k y k z . Questo risultato lo si incontra tante e tante volte in svariati problemi e va imparato a memoria: dN(k) = V
d3 k (2⇡)3
(4.38)
Questa relazione è indipendente dalla forma della scatola, per quanto noi non lo si sia dimostrato. La applicheremo ora per trovare il numero di modi fotonici per fotoni con frequenze comprese nell’intervallo !. C’interessa solamente l’energia dei vari modi, e non la direzione delle onde.
48
Capitolo 4 • Particelle identiche
© 978-8808-22107-0
Vogliamo conoscere il numero di modi in un dato intervallo di frequenze. Nel vuoto, il modulo di k è legato alla frequenza dalla relazione 1,6
|k| =
1,4 1,2
! c
(4.39)
Quindi nell’intervallo di frequenze ! saranno compresi tutti i modi corrispondenti a k con il modulo tra k e k + k, indipendentemente dalla direzione. Il «volume nello spazio k» tra k e k + k è una crosta sferica di volume 4⇡k 2 k
1,0 0,8 0,6 0,4
Il numero di modi è allora
0,2 0 0
1
2
3
4
5
6
7
4.10 Spettro di frequenze della radiazione in una cavità in equilibrio termico, cioè spettro del «corpo nero». FIGURA
N(!) =
8
V 4⇡k 2 k (2⇡)3
(4.40)
Tuttavia, poiché ora c’interessano le frequenze, faremo la sostituzione k = !/c, ottenendo così N(!) =
V 4⇡!2 ! (2⇡)3 c3
(4.41)
Ma c’è un’altra complicazione. Poiché stiamo parlando dei modi di un’onda elettromagnetica, per ogni dato vettore d’onda k ci possono essere due diverse polarizzazioni (ad angolo retto fra loro). Poiché questi modi sono indipendenti, dobbiamo, nel caso della luce, raddoppiarne il numero. Quindi abbiamo V !2 ! N(!) = (per la luce) (4.42) ⇡ 2 c3 Abbiamo mostrato, equazione (4.33), che ciascun modo (o ciascuno «stato») ha, in media, l’energia ~! n ~! = ~!/kT e 1 Moltiplicando per il numero dei modi, otteniamo l’energia E dei modi che stanno dentro l’intervallo !: ~! V !2 ! E = ~!/kT (4.43) e 1 ⇡ 2 c3 Questa è la legge per lo spettro di frequenza della radiazione del corpo nero, che abbiamo già ricavato nel cap. 41 del vol. 1. Il grafico dello spettro è riportato in FIGURA 4.10. Come vedete, il risultato dipende dal fatto che i fotoni sono particelle di Bose, che hanno la tendenza ad addensarsi tutte nello stesso stato (in quanto la corrispondente ampiezza è grande). Come ricorderete, furono gli studi di Planck sullo spettro del corpo nero (che costituiva un mistero per la fisica classica) e la sua scoperta della formula (4.43) che diedero origine alla meccanica quantistica.
4.6
L’elio liquido
L’elio liquido, alle basse temperature, ha molte strane proprietà che sfortunatamente per ora non abbiamo il tempo di descrivere in dettaglio; molte di esse derivano dal fatto che un atomo di elio è una particella di Bose. Una di queste proprietà è che l’elio liquido scorre senza alcuna resistenza viscosa. Infatti, esso costituisce quell’ideale acqua «asciutta» di cui abbiamo parlato in uno dei precedenti capitoli, purché le velocità siano abbastanza piccole. La ragione è la seguente. Perché un liquido abbia una viscosità, vi devono essere delle perdite di energia all’interno; deve esserci la possibilità per una parte del liquido di muoversi diversamente dal resto. Questo significa che deve essere possibile spingere alcuni degli atomi in stati differenti da quelli occupati dagli altri atomi. Ma, a temperature sufficientemente basse, quando l’agitazione termica diventa molto piccola,
4.7 • Il principio di esclusione
© 978-8808-22107-0
tutti gli atomi tendono a porsi nelle stesse condizioni. Quindi, se alcuni di essi si muovono, tutti gli altri atomi tendono ad acquistare lo stesso stato di moto. Si ha una specie di moto rigido, ed è difficile spezzarne l’uniformità introducendovi delle irregolarità a carattere vorticoso, come accadrebbe, per esempio, con tante particelle indipendenti. Quindi, in un liquido di particelle di Bose, gli atomi hanno una forte inclinazione a muoversi tutti nello stesso stato, la quale p inclinazione è rappresentata dal fattore n + 1 che abbiamo visto prima. (Per una bottiglia di elio liquido, n è, chiaramente, un numero molto grande!) Questo moto di insieme non si verifica alle alte temperature, in quanto l’energia termica è sufficiente a porre i vari atomi in tanti diversi stati più alti. Ma a temperature sufficientemente basse, si arriva improvvisamente a un punto in cui tutti gli atomi di elio cercano di portarsi nello stesso stato. L’elio diventa un superfluido. Per inciso, questo fenomeno capita solo con l’isotopo dell’elio di peso atomico 4. Per l’isotopo dell’elio di peso atomico 3, i singoli atomi sono particelle di Fermi, e il liquido si comporta come un fluido normale. Dato che la superfluidità si verifica solo per l’He4 , è evidente che si tratta di un effetto quantistico, dovuto alla natura di Bose delle particelle ↵.
4.7
Il principio di esclusione
Le particelle di Fermi si comportano in modo completamente diverso. Vediamo che cosa succede se tentiamo di porre nello stesso stato due particelle di Fermi. Ritorniamo al nostro esempio originale, e domandiamoci quale sia l’ampiezza per la diffusione di due particelle di Fermi in direzioni quasi esattamente uguali. L’ampiezza per la particella a che si muova in direzione 1 e la particella b in direzione 2 è h1 | ai h2 | bi mentre l’ampiezza corrispondente alle direzioni finali scambiate è uguale a h2 | ai h1 | bi Poiché stiamo parlando di particelle di Fermi, l’ampiezza per il processo è la differenza tra queste due ampiezze: h1 | ai h2 | bi h2 | ai h1 | bi (4.44) Precisiamo che per «direzione 1» intendiamo non solo che la particella ha una certa direzione, ma anche una certa orientazione di spin e che la «direzione 2» è quasi esattamente la stessa della 1 e corrisponde allo stesso stato di spin. Perciò h1 | ai e h2 | ai sono quasi uguali. (Questo non sarebbe necessariamente vero se gli stati uscenti 1 e 2 non avessero lo stesso spin, perché, per qualche ragione, l’ampiezza potrebbe dipendere dall’orientazione dello spin.) Se ora facciamo tendere le direzioni 1 e 2 l’una all’altra, l’ampiezza totale nella (4.44) diviene zero. Il risultato per le particelle di Fermi è molto più semplice che per quelle di Bose. È proprio assolutamente impossibile per due particelle di Fermi – come due elettroni – trovarsi esattamente nello stesso stato. Non osserverete mai due elettroni nello stesso posto con lo spin nella stessa direzione. Non è possibile che due elettroni abbiano lo stesso impulso e la stessa orientazione di spin. Se essi sono nella stessa posizione o nello stesso stato di moto, la sola possibilità è che abbiano spin opposto. Quali sono le conseguenze di questa legge? C’è una quantità di notevolissimi effetti che si deducono dal fatto che due particelle di Fermi non possano trovarsi nello stesso stato. Infatti, quasi tutte le caratteristiche del mondo materiale dipendono da questo fatto meraviglioso. La varietà che si riscontra nel sistema periodico è sostanzialmente una conseguenza di quest’unica legge. Naturalmente, non si può dire come sarebbe il mondo se questa sola regola venisse modificata, perché essa è soltanto una parte dell’intero edificio della meccanica quantistica, ed è impossibile dire che altro cambierebbe se la legge concernente le particelle di Fermi fosse differente. Comunque, proviamo un po’ a vedere cosa succederebbe se soltanto quest’unica regola fosse modificata. Primo, possiamo dimostrare che tutti i tipi di atomo avrebbero pressappoco le stesse
49
50
Capitolo 4 • Particelle identiche
Un elettrone
FIGURA
4.11
+
© 978-8808-22107-0
Due elettroni
Nucleo
++
Tre elettroni
+ ++
Come apparirebbero gli atomi se gli elettroni fossero particelle di Bose.
caratteristiche. Cominciamo con l’atomo d’idrogeno. Questo non ne risentirebbe sensibilmente. Il protone del nucleo sarebbe circondato da una nuvola elettronica a simmetria sferica, come mostra la FIGURA 4.11a. Come abbiamo mostrato nel capitolo 2, l’elettrone è attratto verso il centro, ma il principio d’indeterminazione esige che vi sia una compensazione tra la concentrazione nello spazio e nell’impulso. Tale compensazione comporta che ci deve essere una certa energia e una certa estensione nella distribuzione dell’elettrone che determina le dimensioni caratteristiche dell’atomo d’idrogeno. Supponiamo ora di considerare un nucleo con carica uguale a due, come il nucleo di elio. Questo nucleo attrae due elettroni, e se essi fossero particelle di Bose, si affollerebbero, a parte l’effetto della repulsione elettrostatica, il più vicino possibile al nucleo. Un atomo di elio apparirebbe allora come nella FIGURA 4.11b. Analogamente, un atomo di litio, che ha un nucleo di carica tre, avrebbe una distribuzione elettronica come quella mostrata nella FIGURA 4.11c. Ogni atomo si presenterebbe più o meno con lo stesso aspetto – una pallina minuscola con tutti gli elettroni sistemati vicino al nucleo, senza alcuna direzione privilegiata e niente di complicato. Invece, poiché gli elettroni sono particelle di Fermi, la situazione reale è del tutto differente. Per l’atomo di idrogeno non si hanno mutamenti sostanziali. La sola differenza è che l’elettrone ha uno spin che indichiamo con una piccola freccia in FIGURA 4.12a. Nel caso dell’atomo di elio, però, non possiamo più mettere due elettroni uno sopra all’altro. Ma, un momento, questo è vero solo se il loro spin è uguale. Due elettroni possono occupare lo stesso stato se i loro spin sono opposti. Quindi, neppure l’atomo di elio appare molto differente. Esso si presenta come si vede nella FIGURA 4.12b. Per il litio, invece, la situazione cambia completamente. Dove possiamo mettere il terzo elettrone? Il terzo elettrone non può stare insieme agli altri due, perché tutt’e due le direzioni possibili dello spin sono occupate. (Vi ricorderete che per ogni particella di spin 1/2 si possono avere solo due orientazioni di spin.) Il terzo elettrone non può trovare posto vicino agli altri due, e quindi, dovrà andare a finire in un diverso tipo di stato, un po’ speciale,
Spin
Un elettrone
FIGURA
4.12
+
Nucleo
Due elettroni
++
Configurazioni atomiche per elettroni reali, cioè fermioni di spin un mezzo.
+ ++
51
4.7 • Il principio di esclusione
© 978-8808-22107-0
piuttosto distante dal nucleo, come si vede nella FIGURA 4.12c. (Stiamo parlando in modo piuttosto approssimativo, perché, in realtà, tutti e tre gli elettroni sono identici; e dal momento che non sappiamo di quale stiamo parlando, il nostro discorso è alquanto impreciso.) Si comincia ora a capire come mai atomi differenti hanno proprietà chimiche diverse. Poiché il terzo elettrone del litio è più distante, esso è relativamente meno legato. È molto più facile estrarre un elettrone dal litio che dall’elio. (Sperimentalmente, si trova che occorrono 25 V per ionizzare l’elio mentre per il litio ne bastano 5.) Questo fatto spiega la valenza del litio. Le proprietà direzionali della valenza hanno a che fare con la forma dell’onda dell’elettrone esterno, ma al momento non ci occuperemo di queste cose. Ma possiamo già vedere l’importanza del cosiddetto principio di esclusione, che afferma appunto che due elettroni non possono trovarsi nello stesso identico stato (compreso lo spin). Il principio di esclusione è anche responsabile della stabilità della materia su larga scala. Abbiamo già spiegato che i singoli atomi nella materia stanno in piedi per il principio di indeterminazione; ma quest’ultimo non basta a spiegare come mai due atomi di idrogeno non possano essere schiacciati uno contro l’altro quanto si vuole, o perché succede che i protoni non si pongano al centro con una grande nuvola di elettroni intorno. La risposta è questa: ovviamente, dato che non più di due elettroni – con gli spin opposti – possono trovarsi approssimativamente nella stessa posizione, gli atomi di idrogeno debbono starsene distanti l’uno dall’altro. Quindi, la stabilità della materia su larga scala è una conseguenza proprio della natura di particelle di Fermi degli elettroni. Naturalmente, se gli elettroni esterni di due atomi hanno gli spin opposti, essi possono avvicinarsi. Questa, infatti, è proprio l’origine del legame chimico. Si trova che un sistema di due atomi ha l’energia più bassa nella situazione in cui vi è un elettrone in posizione intermedia tra i due. Si ha una specie di attrazione elettrostatica dei due nuclei positivi verso l’elettrone interposto. È anche possibile porre due elettroni più o meno in mezzo tra i due nuclei, purché i loro spin siano opposti, e proprio in questo modo si ottiene il legame chimico più forte. Non si può avere un legame maggiore, perché il principio di esclusione non permette che ci siano più di due elettroni nello spazio tra gli atomi. Ci aspettiamo che la molecola di idrogeno si presenti più o meno come si vede nella FIGURA 4.13. Vogliamo citare un’altra conseguenza del principio di esclusione. Voi ricorderete che se i due elettroni dell’atomo di elio possono stare vicino al nucleo, debbono avere gli spin necessariamente opposti. Supponiamo di voler cercare di rendere paralleli i due spin, come si potrebbe immaginare di fare con un campo magnetico fantasticamente intenso che tenderebbe ad allineare gli spin nella stessa direzione. Ma, in questo caso, gli elettroni non potranno più occupare la stessa posizione. Uno di essi sarà costretto ad assumere una nuova configurazione geometrica, com’è indicato in FIGURA 4.14. L’elettrone più lontano dal nucleo ha una minore energia di legame. Ne segue che l’energia complessiva dell’atomo è un bel po’ più grande. Quando gli spin sono opposti, vi è, in altre parole, un’attrazione molto più forte. Quindi vi è, in apparenza, una forza enorme che tende a portare gli spin in direzioni opposte, quando i due elettroni si avvicinano. Man mano che gli elettroni si avvicinano alla stessa posizione,
+
FIGURA
4.13
+
La molecola
d’idrogeno.
4.14 Elio con un elettrone in uno stato d’energia più alta. FIGURA
++
4.15 Cosa accade probabilmente in un cristallo ferromagnetico; l’elettrone di conduzione è antiparallelo rispetto agli elettroni interni non appaiati. FIGURA
52
Capitolo 4 • Particelle identiche
© 978-8808-22107-0
aumenta molto fortemente la tendenza degli spin ad allinearsi in verso opposto. La forza che apparentemente tende a orientare gli spin in verso contrario è molto più potente della piccola forza tra i due momenti magnetici degli elettroni. Vi ricorderete che, quando parlavamo del ferromagnetismo, era per noi un mistero come «mai gli elettroni in atomi diversi avessero una forte inclinazione a porsi paralleli. Per quanto non si abbia ancora una spiegazione quantitativa, si pensa che ciò accada perché gli elettroni intorno al nucleo di un atomo interagiscono, mediante il principio di esclusione, con gli elettroni esterni divenuti liberi di vagare per tutto il cristallo. Quest’interazione fa sì che gli spin degli elettroni liberi e di quelli interni si pongano in direzioni opposte. Ma gli elettroni liberi e quelli dentro gli atomi possono avere spin opposti solo se gli elettroni interni hanno tutti gli spin allineati, come si vede nella FIGURA 4.15. Sembra probabile che per effetto del principio di esclusione, che agisce indirettamente attraverso gli elettroni liberi, si originino le potenti forze che tendono ad allineare gli spin e che sono responsabili del ferromagnetismo. Vogliamo ricordare ancora un esempio dell’importanza del principio di esclusione. Abbiamo già detto che le forze nucleari sono le stesse tra neutrone e protone, tra protone e protone, e tra protone e neutrone. Perché allora un protone e un neutrone si possono legare insieme e dare un nucleo di deuterio, mentre non esiste alcun nucleo fatto di soli due protoni o di soli due neutroni? Si ha il fatto che il deuterio è legato con un’energia di circa 2,2 milioni di volt, mentre non si ha una corrispondente attrazione tra una coppia di protoni che dia luogo a un isotopo di elio con peso atomico 2. Tali nuclei non esistono. La combinazione di due protoni non produce uno stato legato. La spiegazione si ottiene come risultato di due effetti: primo, il principio di esclusione; e secondo, il fatto che le forze nucleari sono alquanto sensibili alla direzione dello spin. La forza tra un neutrone e un protone è attrattiva ed è un po’ più forte quando gli spin sono paralleli, invece che opposti. E risulta che queste due forze sono abbastanza differenti da far sì che un nucleo di deuterio possa essere ottenuto solo se il neutrone e il protone hanno gli spin paralleli; quando invece i loro spin sono opposti, l’attrazione non è abbastanza forte da legarli insieme. Poiché gli spin del neutrone e del protone sono entrambi uguali a un mezzo e sono paralleli, il deuterio ha spin uno. Sappiamo, d’altra parte, che due protoni non possono stare uno sull’altro se hanno gli spin paralleli. Se non fosse per il principio di esclusione, due protoni costituirebbero uno stato legato, ma, dal momento che non possono stare nello stesso posto e con la stessa orientazione di spin, il nucleo di He2 non esiste. I protoni potrebbero stare insieme con gli spin opposti, ma allora non c’è attrazione sufficiente a produrre un nucleo stabile, perché la forza nucleare, in caso di spin opposti, è troppo debole per legare insieme una coppia di nucleoni. Si può misurare la forza tra neutroni e protoni di spin opposto con esperimenti di diffusione. Tali esperimenti di diffusione con due protoni di spin parallelo mostrano l’esistenza della corrispondente attrazione. Quindi, è il principio di esclusione che ci aiuta a comprendere perché esista il deuterio e non l’He2 .
5
Spin uno
5.1
Filtraggio degli atomi con un apparecchio di Stern-Gerlach
In questo capitolo affronteremo la meccanica quantistica propriamente detta, nel senso che descriveremo un fenomeno quantistico con un formalismo interamente quantistico. Non ricorreremo più a giri di parole, né cercheremo connessioni con la meccanica classica. Vogliamo parlare di qualcosa di nuovo in un linguaggio nuovo. Il particolare aspetto che ci accingiamo a descrivere è la cosiddetta quantizzazione del momento angolare, nel caso di una particella di spin uno. Ma non vogliamo far uso di parole come «momento angolare» o di altri concetti presi a prestito dalla meccanica classica, almeno per un po’. Abbiamo scelto proprio questo esempio per la sua relativa semplicità, anche se poi non è il più semplice di tutti. Anzi, è abbastanza complicato da poter costituire un prototipo che può essere generalizzato per trattare tutti i fenomeni quantistici. Quindi, pur riferendoci a un esempio particolare, tutte le leggi che incontreremo sono immediatamente generalizzabili, e ve ne daremo la generalizzazione in modo che possiate imparare i procedimenti per la descrizione di un sistema arbitrario in meccanica quantistica. Cominceremo con lo studiare il fenomeno della suddivisione di un fascio di atomi in tre fasci separati mediante un esperimento di Stern-Gerlach. Ricorderete che se si ha un campo magnetico inomogeneo prodotto da un magnete, una delle espansioni del quale sia sagomata a forma di punta, e s’invia attraverso tale apparecchio un fascio di particelle, questo viene a essere suddiviso in un certo numero di fascetti, il cui numero dipende dal particolare tipo di atomo e dallo stato in cui si trova. Tratteremo il caso di un atomo che dà luogo a tre fasci separati, e diremo che esso è una particella di spin uno. Potete elaborare per conto vostro il caso di cinque, sette, due fasci, ecc.: dovrete semplicemente seguirci passo passo e quando noi troviamo tre termini, voi ne dovrete avere cinque, sette, o quelli che sono. Immaginate l’apparato schematizzato nella FIGURA 5.1. Un raggio atomico (o composto da particelle di ogni sorta) è collimato per mezzo di alcune fenditure e passa attraverso un campo non uniforme. Supponiamo che il fascio si muova in direzione dell’asse y e che il campo magnetico e il suo gradiente siano diretti secondo l’asse z. Un osservatore posto lateralmente vedrà allora
∆
Fascio atomico
Ripasso: vol. 2, cap. 35, Paramagnetismo e risonanza magnetica Per vostra comodità questo capitolo è riprodotto nell’Appendice di questo volume.
B
B
∆ B
∆ z y
5.1 In un esperimento di Stern-Gerlach gli atomi di spin uno si dividono in tre fasci. FIGURA
5.2 Gli atomi provenienti da uno dei fasci vengono inviati in un secondo apparecchio identico. FIGURA
54
Capitolo 5 • Spin uno
© 978-8808-22107-0
S
N
S
A
B N
S
N
z
y
(a)
+ 0 A
B
z
–
(b) y
FIGURA
5.3
(a) Modifica ideale di un apparecchio di Stern-Gerlach. (b) I cammini degli atomi di spin uno.
il fascio suddividersi verticalmente in tre raggi, come mostra la figura. All’uscita dal magnete possiamo collocare dei minuscoli rivelatori atti a contare la frequenza di arrivo delle particelle in ognuno dei tre fasci. Oppure possiamo arrestare due dei raggi e lasciar passare il terzo. Supponiamo di bloccare i due fasci più bassi e di lasciar passare quello più alto per inviarlo dentro un secondo dispositivo di Stern-Gerlach dello stesso tipo, come si vede in FIGURA 5.2. Che cosa succede? Non si hanno tre fasci nel secondo apparecchio; si ha solo quello deflesso verso l’alto(1) . Questo è proprio quanto ci si aspetta di trovare se si considera il secondo apparecchio come una semplice estensione del primo. Quegli atomi che venivano spinti verso l’alto continuano a esserlo nel secondo magnete. Vedete dunque che il primo apparecchio ha prodotto un fascio di oggetti «puri» – atomi che sono deflessi verso l’alto da quel particolare campo inomogeneo. Gli atomi, al momento in cui entrano nel primo apparecchio di Stern-Gerlach, sono di tre «specie», e i tre tipi prendono traiettorie diverse. Filtrando tutte le specie meno una, si ottiene un fascio il cui futuro comportamento in un apparecchio dello stesso tipo è determinato e prevedibile. Diremo che questo è un fascio filtrato oppure polarizzato, oppure ancora un fascio composto di atomi che si sanno essere in uno stato definito. Per il resto della nostra discussione, sarà più conveniente considerare una versione leggermente modificata dell’apparecchio di Stern-Gerlach. A prima vista l’apparecchio sembra più complicato, ma renderà più semplici i nostri ragionamenti. D’altra parte, trattandosi di «esperimenti concettuali», non ci costa niente complicare gli strumenti necessari. (Per inciso, nessuno ha mai fatto questi esperimenti nel modo in cui li descriviamo, ma noi ne conosciamo i risultati dalle leggi della meccanica quantistica, che, naturalmente, sono fondate su altre esperienze analoghe. (1)
Ammettiamo che gli angoli di deflessione siano piccolissimi.
55
5.1 • Filtraggio degli atomi con un apparecchio di Stern-Gerlach
© 978-8808-22107-0
5.4 L’apparecchio di Stern-Gerlach «migliorato» usato come filtro. FIGURA
+
+
0
0
–
–
z S
S
Queste ultime sono più difficili da comprendere agli inizi, e perciò vogliamo descrivere alcuni esperimenti idealizzati – per quanto possibile.) La FIGURA 5.3a mostra uno schema dell’«apparecchio modificato di Stern-Gerlach» che ci proponiamo di usare. Esso consiste in una successione di tre magneti a forte gradiente. Il primo (a sinistra) è il solito magnete di Stern-Gerlach che suddivide il fascio incidente di particelle di spin uno in tre fasci separati. Il secondo magnete ha la stessa sezione trasversale del primo, ma è lungo il doppio; inoltre la polarità del suo campo magnetico è opposta a quella del primo magnete. Il secondo magnete spinge in direzione opposta i magnetini atomici e incurva le loro traiettorie in senso contrario, riportandoli verso l’asse, come si vede nella parte inferiore della figura. Il terzo magnete è esattamente uguale al primo, e riunisce i tre fasci di nuovo insieme, di modo che questi riemergano dal foro d’uscita allineati lungo la direzione iniziale. Infine, possiamo anche immaginare che prima del foro in A ci sia un meccanismo che fa partire gli atomi da fermi, e che dopo il foro in B ci sia un altro meccanismo atto a frenare gli atomi e a riportarli a riposo in B. Ciò non è essenziale, ma fa sì che, nella nostra analisi, possiamo non preoccuparci di includere effetti del moto sugli atomi che escono e che possiamo concentrarci solo su quei fenomeni che dipendono dallo spin. Il solo scopo dell’apparecchio «migliorato» è di riportare tutte le particelle nella stessa posizione, e con velocità nulla. Se ora vogliamo fare un esperimento come quello di FIGURA 5.2, possiamo, per prima cosa, procurarci un fascio filtrato ponendo uno spessore nell’interno dell’apparecchio per arrestare due dei fasci, come si vede nella FIGURA 5.4. Se poi inviamo gli atomi polarizzati in un altro apparecchio identico, tutti gli atomi passeranno per il cammino superiore, come possiamo verificare frapponendo spessori simili sulle traiettorie dei possibili fasci nel secondo filtro S e osservando se passano delle particelle o no. Supponiamo di chiamare S il primo apparecchio. (Dovremo prendere + in considerazione ogni sorta di combinazione, e ci serviremo di simboli 0 = (a) letterali per procedere più speditamente.) Diremo che gli atomi che in S – passano sopra sono nello «stato più rispetto a S», quelli che prendono il cammino di mezzo sono nello «stato zero rispetto a S», infine, quelli che passano sotto sono nello «stato meno rispetto a S». (Nel linguaggio più comune, si dovrebbe dire che la componente z del momento angolare è (b) = +1~, 0 e 1~ ma, per ora, non ci esprimeremo in questo modo.) Nella FIGURA 5.4, il secondo apparecchio è sistemato proprio come il primo, e gli atomi filtrati passeranno tutti sopra. Oppure, se avessimo bloccato i fasci superiore e inferiore nel primo apparecchio, e avessimo fatto passare solo (c) = lo stato zero, tutti gli atomi filtrati prenderebbero il cammino intermedio nel secondo. Infine, se avessimo arrestato tutti i fasci meno il più basso nel primo apparecchio, ci sarebbe solo il più basso anche nel secondo. Possiamo quindi affermare che il nostro primo apparecchio ha prodotto un fascio filtrato in uno stato puro rispetto a S (+, 0 oppure ), e possiamo (d) = controllare di che stato si tratti facendo passare gli atomi attraverso un secondo apparecchio identico. Si può fare in modo che il secondo apparato lasci passare solo atomi in uno stato particolare – ponendo dei diaframmi all’interno, come nell’altro FIGURA 5.5 Simboli speciali abbreviati per i vari tipi – e quindi possiamo identificare lo stato del fascio incidente osservando di filtri di Stern-Gerlach.
56
Capitolo 5 • Spin uno
© 978-8808-22107-0
se vien fuori qualche cosa o no, all’altro estremo. Per esempio, se blocchiamo i due cammini inferiori, vediamo uscire il 100% degli atomi, mentre se blocchiamo quello superiore, non esce più niente. Per rendere più scorrevole l’esposizione di questo tipo di ragionamenti, utilizzeremo una notazione abbreviata per rappresentare uno dei nostri apparecchi di Stern-Gerlach modificati. Il simbolo 8 > > >+9 > >
= > (5.1) > > >> > :; S
starà per uno di tali apparecchi al completo. (Non è un simbolo che troverete mai altrove in meccanica quantistica; lo abbiamo inventato apposta per questo capitolo. Vuole solo essere una rappresentazione sintetica dell’apparecchio di FIGURA 5.3.) Poiché ci proponiamo di usare molti apparecchi insieme, e con diverse orientazioni, li distingueremo ognuno con una lettera in basso. Così il simbolo nella (5.1) sta per l’apparecchio S. Quando arrestiamo all’interno uno o più fasci, indicheremo questo fatto con alcune sbarrette verticali in corrispondenza dei raggi fermati, come ad esempio mostra la notazione seguente: 8 + > > >
> > : S
9 > > > = > > > ;
(5.2)
Nella FIGURA 5.5 sono mostrate le possibili combinazioni che useremo. Se abbiamo due filtri in successione (come in FIGURA 5.4), porremo i due simboli uno accanto all’altro, così: 8 8 + 9 +9 > > > > > > > > > >
= = > > > > (5.3) > > > > > >> > : ; :; S
S
In questa combinazione, tutto ciò che esce dal primo filtro attraversa liberamente anche il secondo. Infatti, anche se blocchiamo i canali «zero» e «meno» del secondo apparecchio, in modo da avere la situazione 8 8 > > > > >+ 9 > >+ 9 > > > >
> > (5.4) > > > > > > > > > : ; : ; S
S
si ottiene ancora una trasmissione del 100% attraverso quest’ultimo. D’altra parte, se abbiamo 8 + > > >
> > :
9 > > > = > > > ;
8 + > > >
> > :
9 > > > = > > > ;
(5.5)
8 + > > >
> > :
9 > > > = > > > ;
8 + > > >
> > :
9 > > > = > > > ;
(5.6)
8 + > > >
> > :
9 > > > = > > > ;
8 + > > >
> > :
9 > > > = > > > ;
(5.7)
S
S
non viene fuori niente all’uscita. Analogamente, anche
S
non lascerebbe uscire niente. D’altro canto,
S
S
S
5.2 • Esperimenti con atomi filtrati
© 978-8808-22107-0
sarebbe esattamente equivalente a
8 + > > >
> > : S
9 > > > = > > > ;
da solo. Ci proponiamo ora di descrivere questi esperimenti nel linguaggio della meccanica quantistica. Diremo che un atomo è nello stato (+S) se ha attraversato l’apparecchio di FIGURA 5.5b, che è nello stato (0 S) se è passato attraverso l’apparecchio di FIGURA 5.5c e che è nello stato ( S) se è passato attraverso l’apparecchio di FIGURA 5.5d(2) . Indichiamo poi con hb | ai l’ampiezza relativa a un atomo che, inizialmente nello stato a, dopo essere passato attraverso l’apparecchio, finisca nello stato b. Possiamo anche dire che hb | ai è l’ampiezza relativa a un atomo che dallo stato a si porta nello stato b. L’esperienza (5.4) ci dà che h+S | +Si = 1 mentre la (5.5) porta a h S | +Si = 0 Analogamente il risultato della (5.6) è h+S | Si = 0 e quello della (5.7) h S | Si = 1 Finché si tratta solo di stati «puri» – cioè, finché si ha un solo canale aperto – ci sono nove di queste ampiezze, e le possiamo riportare sotto forma di tabella:
a
+S
da 0S
+S
1
0
0
0S
0
1
0
S
0
0
1
S (5.8)
Questo quadro di nove numeri – detto matrice – riassume il fenomeno che abbiamo descritto.
5.2
Esperimenti con atomi filtrati
Adesso viene il bello: cosa succede se il secondo apparecchio è spostato di un certo angolo, in modo che la direzione del suo campo non sia più parallela a quella del primo? Oltre a essere ruotato, potrebbe anche puntare in un’altra direzione, per esempio, in modo da far uscire il fascio a 90° rispetto alla direzione originale. Per semplificare le cose, in principio immaginiamo una sistemazione in cui il secondo apparecchio di Stern-Gerlach è ruotato di un angolo ↵ intorno all’asse y, come mostra la FIGURA 5.6. Chiamiamo T questo secondo apparecchio. Supponiamo di metter su il seguente esperimento: 8 + > > >
> > : S
(2)
9 > > > = > > > ;
8 + > > >
> > :
Leggi: (+S) = «più S»; (0 S) = «zero S»; ( S) = «meno S».
T
9 > > > = > > > ;
57
58
Capitolo 5 • Spin uno
© 978-8808-22107-0
5.6 Due filtri del tipo Stern-Gerlach in serie; il secondo è ruotato di un angolo α rispetto al primo. FIGURA
z
S
T
y
oppure
8 + > > >
> > : S
9 > > > = > > > ;
8 + > > >
> > : T
9 > > > = > > > ;
Cosa si trova all’uscita in questi casi? La risposta è la seguente: se gli atomi sono in uno stato definito rispetto a S, non sono nello stesso stato rispetto a T – uno stato (+S) non è anche uno stato (+T). Si ha, però, una certa ampiezza di trovare l’atomo in uno stato (+T) – o anche, in uno stato (0 T) o ( T). In altri termini, pur avendocela messa tutta per accertarci di avere gli atomi in una ben definita condizione, sta di fatto che quando un atomo attraversa il secondo apparecchio, ruotato di un certo angolo ↵, esso deve, per così dire, «riorientarsi» – il che avviene, non dimenticatelo, casualmente. Possiamo far passare una sola particella alla volta, e domandarci semplicemente quale sia la probabilità di uscita all’altro estremo. Alcuni degli atomi che escono da S finiranno in uno stato (+T), alcuni in (0 T) e altri ancora in uno stato ( T), tutti con probabilità differenti. Queste probabilità possono essere calcolate come moduli quadrati di ampiezze, complesse; quello che cerchiamo è un formalismo matematico, o una rappresentazione quantistica per queste ampiezze. Quello che dobbiamo conoscere sono varie quantità come h T | +Si con cui indichiamo l’ampiezza che un atomo inizialmente nello stato (+S) si porti nella condizione ( T) (che non è zero, a meno che T e S non siano allineati, uno parallelo all’altro). Si hanno anche altre ampiezze, come h+T | 0 Si
o
h0 T | Si
ecc.
Ci sono, effettivamente, nove ampiezze siffatte – un’altra matrice – che una teoria delle particelle ci deve insegnare a calcolare. Proprio come F = ma ci permette di calcolare ciò che accade a una particella classica in ogni circostanza, le leggi della meccanica quantistica ci rendono possibile il calcolo dell’ampiezza che una particella riesca ad attraversare un particolare apparecchio. Il problema centrale è, dunque, quello di saper calcolare, per ogni dato angolo di rotazione, o, in realtà, per ogni arbitraria orientazione, le nove ampiezze: h+T | +Si h0 T | +Si h T | +Si
h+T | 0 Si h0 T | 0 Si h T | 0 Si
h+T | Si h0 T | Si h T | Si
(5.9)
Possiamo già prevedere alcune relazioni tra queste ampiezze. Primo, secondo le nostre definizioni, il modulo quadrato |h+T | +Si| 2 è la probabilità che un atomo nello stato (+S) finisca nello stato (+T). Troveremo spesso più conveniente scrivere tali quadrati nella forma equivalente h+T | +Sih+T | +Si⇤
5.3 • Filtri di Stern-Gerlach in serie
© 978-8808-22107-0
Nella stessa notazione il numero
h0 T | +Sih0 T | +Si⇤
è la probabilità che una particella nello stato (+S) si porti nello stato (0 T); infine h T | +Sih T | +Si⇤ è la probabilità che la particella si porti nello stato ( T). Ma per come sono fatti i nostri apparecchi, ogni atomo che entra in T deve poi essere trovato in uno dei tre possibili stati dell’apparecchio T, in quanto un dato tipo di atomo non può andare a finire altro che in uno di questi stati. Quindi la somma delle tre probabilità che abbiamo scritto poc’anzi deve essere uguale al 100%. Si ha la relazione h+T | +Si h+T | +Si⇤ + h0 T | +Si h0 T | +Si⇤ + h T | +Si h T | +Si⇤ = 1
(5.10)
Si possono avere, ovviamente, altre due equazioni simili che si ottengono a partire da uno stato (0 S) oppure ( S). Purtroppo, queste relazioni sono tutto ciò che possiamo ricavare senza difficoltà, perciò passiamo a qualche altra questione di ordine generale.
5.3
Filtri di Stern-Gerlach in serie
Si pone a questo punto una questione interessante: supponiamo di aver filtrato degli atomi portandoli nello stato (+S), quindi d’inviarli in un secondo filtro, che si trovi diciamo in uno stato (0 T), infine attraverso un altro filtro +S. (Indicheremo quest’ultimo filtro con S 0 per distinguerlo dal primo filtro S.) Si ricorderanno alla fine gli atomi che prima erano in uno stato (+S)? In altri termini, facciamo il seguente esperimento: 8 + > > >
> > :
9 > > > = > > > ;
8 + > > >
> > :
9 > > > = > > > ;
8 + > > >
> > :0
9 > > > = > > > ;
(5.11)
8 + > > >
> > :
9 > > > = > > > ;
8 + > > >
> > :
9 > > > = > > > ;
8 + > > >
> > :0
9 > > > = > > > ;
(5.12)
S
T
S
Vogliamo sapere se tutti gli atomi che attraversano T attraversano anche S 0. Non è così. Una volta filtrati attraverso T, non si ricordano più in alcun modo che erano in uno stato (+S) quando sono entrati in T. Notate che il secondo apparecchio S nella (5.11) è orientato esattamente come il primo, e quindi è ancora un filtro del tipo di S. Gli stati filtrati da S 0 sono, com’è chiaro, ancora (+S), (0 S) e ( S). Il punto importante è il seguente: se dal filtro T emerge un solo fascio, la frazione di esso che emerge anche dal secondo filtro S dipende solo dallo stato del filtro T, ed è completamente indipendente da ciò che lo precede. Il fatto che quegli atomi erano stati inizialmente selezionati da un filtro S non ha più alcuna influenza sul loro comportamento, una volta che sono stati nuovamente filtrati in uno stato puro da un apparecchio di tipo T. Da allora in poi, la probabilità di trovarli in differenti stati è la stessa indipendentemente dalla loro storia, prima di entrare in T. Per esempio, confrontiamo l’esperimento della (5.11) con il seguente:
S
T
S
in cui solo il primo S è stato modificato. Poniamo che l’angolo (tra S e T) sia tale che nell’esperimento (5.11) un terzo degli atomi che escono da T emergano anche da S 0. Nell’esperimento (5.12), anche se da T, in generale, uscirà un numero diverso di atomi, tuttavia la stessa frazione di questi – un terzo – passerà anche attraverso S 0.
59
60
Capitolo 5 • Spin uno
© 978-8808-22107-0
Possiamo, infatti, dimostrare, da quanto si è visto in precedenza, che la frazione di atomi che escono da T e attraversano poi un dato S 0 dipende solo da T e da S 0 e non da ciò che è avvenuto prima. Confrontiamo l’esperimento (5.12) con quest’altro: 8 + > > >
> > : S
9 > > > = > > > ;
8 + > > >
> > : T
9 > > > = > > > ;
8 + > > >
> > :0 S
9 > > > =. > > > ;
(5.13)
L’ampiezza che un atomo che riemerge fuori da S attraversi anche sia T sia S 0 è, nel caso dell’esperimento della (5.12), h+S | 0 Ti h0 T | 0 Si La corrispondente probabilità è |h+S | 0 Ti h0 T | 0 Si| 2 = |h+S | 0 Ti| 2 |h0 T | 0 Si| 2 La probabilità per l’esperimento (5.13) è invece |h0 S | 0 Ti h0 T | 0 Si| 2 = |h0 S | 0 Ti| 2 |h0 T | 0 Si| 2 Il loro rapporto è
|h0 S | 0 Ti| 2 |h+S | 0 Ti| 2
e dipende solo da T e S 0, e per nulla da quale fascio (+S), (0 S) oppure ( S) è selezionato da S. (I vari numeri in valore assoluto possono oscillare su e giù di pari passo a seconda di quanti atomi riescono a passare da T.) Naturalmente, avremmo trovato lo stesso risultato se avessimo paragonato le probabilità che gli atomi fossero finiti nello stato più oppure meno rispetto a S 0, o anche se avessimo calcolato il rapporto delle probabilità che fossero finiti negli stati zero o meno. In realtà, poiché questi rapporti dipendono solo da quale fascio riesce a passare attraverso T, e non dalla selezione operata dal primo filtro S, è chiaro che otterremmo lo stesso risultato anche se l’ultimo filtro non fosse del tipo di S. Se usassimo come terzo filtro – che indicheremo con R – un apparecchio ruotato di un angolo arbitrario rispetto a T, troveremmo che i rapporti del tipo di |h0 R | 0 Ti| 2 |h+R | 0 Ti| 2 sono indipendenti da quale fascio è passato attraverso il primo filtro S.
5.4
Stati di base
Questi risultati illustrano uno dei principi fondamentali della meccanica quantistica: ogni sistema atomico può essere analizzato per mezzo di un processo di filtraggio in un certo insieme di stati, che diremo stati di base, e il comportamento futuro degli atomi dipende solo dalla natura dello stato di base ed è indipendente dalla storia precedente(3) . Gli stati di base dipendono, com’è chiaro, dal filtro che si è usato; per esempio, i tre stati (+T), (0 T) e ( T) sono un insieme di stati di base; i tre stati (+S), (0 S) e ( S) un altro. Ci sono innumerevoli possibilità, ognuna altrettanto valida quanto le altre. Vogliamo sottolineare che ci riferiamo a filtri buoni, che realmente producono fasci «puri». Se, per esempio, il nostro apparecchio di Stern-Gerlach non produce una buona separazione (3)
Con le parole «stato di base» non intendiamo altro che quanto si è detto ora. Questi stati non devono in alcun modo essere considerati come «basilari». Usiamo la parola «base» con il significato di riferimento per una descrizione, un po’ come quando si dice «numeri scritti in base dieci».
5.4 • Stati di base
© 978-8808-22107-0
dei tre fasci, in modo cioè da non poterli distinguere nettamente con i nostri diaframmi, allora non possiamo fare un’analisi completa per mezzo di stati di base. Possiamo decidere se abbiamo ottenuto degli stati di base puri, osservando se i fasci possono essere o meno nuovamente separati, facendoli passare attraverso un altro filtro uguale. Se abbiamo un puro stato (+T), per esempio, tutti gli atomi attraverseranno 8 + 9 > > > > >
= > > > > > > : ; T
ma nessuno di essi passerà attraverso
8 + > > >
> > : T
oppure attraverso
8 + > > >
> > : T
9 > > > = > > > ; 9 > > > = > > > ;
Le nostre affermazioni circa gli stati di base implicano che è possibile, mediante il filtro, arrivare a uno stato puro, tale che non sia possibile un ulteriore filtraggio attraverso un identico apparecchio. Dobbiamo anche far presente che ciò che stiamo dicendo è rigorosamente vero solo in situazioni alquanto idealizzate. In un qualsiasi apparecchio reale di Stern-Gerlach, dovremo preoccuparci della diffrazione dalle fenditure, che può far sì che alcuni atomi siano inviati in stati corrispondenti ad angoli diversi, o della possibilità che i fasci contengano atomi con differenti eccitazioni dei loro stati interni, e così via. Abbiamo idealizzato la situazione in modo da parlare solo degli stati che possono essere distinti per mezzo del campo magnetico; ignorando effetti che dipendono dalla posizione, dall’impulso, da eccitazioni interne e altre cose simili. In generale, sarà necessario considerare stati di base selezionati anche rispetto a queste variabili. Ma per semplificare le cose, ci limitiamo al nostro insieme di tre stati, che è quanto basta per la trattazione esatta della situazione ideale in cui gli atomi non vengono squinternati o in qualche modo maltrattati, nel passare dentro l’apparecchio, e si portano in quiete all’uscita da questo. Avrete notato che cominciamo sempre i nostri esperimenti ideali considerando un filtro con un solo canale aperto, in modo da partire con un ben definito stato di base. Questo è necessario perché gli atomi provengono da una fornace in svariate condizioni, determinate a caso dagli eventi accidentali all’interno di essa. (Questo sistema produce ciò che si chiama un fascio «non polarizzato».) Questa casualità comporta delle probabilità in senso «classico» – come nel lancio di una moneta – che sono diverse dalle probabilità che s’incontrano in meccanica quantistica, delle quali ci vogliamo occupare in questo caso. Considerando un fascio non polarizzato, ci procureremmo delle complicazioni aggiuntive, che è meglio evitare fino a quando non avremo ben capito il comportamento dei fasci polarizzati. Perciò, evitiamo di considerare per il momento che cosa succede se il primo apparecchio lascia passare più di un fascio. (Alla fine del capitolo vi diremo come dovete comportarvi in tal caso.) Riprendiamo il discorso ed esaminiamo ciò che accade quando si passa da uno stato di base per un filtro a uno stato di base per un secondo filtro. Supponiamo di partire nuovamente dall’assetto 8 + > > >
> > : S
9 > > > = > > > ;
8 + > > >
> > : T
9 > > > = > > > ;
Gli atomi che escono da T sono nello stato di base (0 T) e non hanno memoria del fatto che prima erano nello stato (+S). Alcuni si esprimerebbero dicendo che durante il filtraggio attraverso T abbiamo «perso l’informazione» circa lo stato precedente (+S), perché abbiamo «disturbato»
61
62
Capitolo 5 • Spin uno
© 978-8808-22107-0
gli atomi quando li abbiamo separati in tre fasci nell’apparecchio T. Ma ciò non è esatto. L’informazione non si perde con la separazione in tre fasci, ma a causa dei diaframmi di arresto che abbiamo introdotto – come si può vedere con il seguente apparato sperimentale. Partiamo con un filtro +S, e indichiamo con N il numero di atomi uscenti da esso. Se appresso poniamo un filtro 0 T, il numero di atomi che escono è una certa frazione del numero iniziale, diciamo ↵N. Se poi poniamo ancora in serie un nuovo filtro +S, solo una certa frazione di questi atomi raggiungerà l’estremità opposta. Indichiamo questo processo con la notazione seguente: 8 + > > >
> > :
9 8 > > > > > > ↵N 8 >+ 9 >+ 9 > ↵N > > = N! >
= !>
= ! > > > > > > > > > > > > > > > ; : ; :0 ;
(5.14)
8 + > > >
> > :
8 9 > > > > > > >+ 9 >+ 9 > ↵N 8 > ↵N >
= N! > = !> = ! > > > > > > > > > > > > > > > : ; :0 ; ;
(5.15)
8 + > > >
> > :
9 8 8 +9 + 9 > > > > > > > > N > > > > N > N > = ! > > > > > > > > >> > > > > ; :; :0 ;
(5.16)
S
T
S
Se il terzo apparecchio S 0 selezionasse uno stato diverso, per esempio (0 S), ne uscirebbe una diversa frazione, diciamo (4) . Avremmo allora
S
T
S
Supponiamo ora di ripetere questi due esperimenti, ma rimuovendo tutti i diaframmi dall’interno di T. Otterremmo allora i seguenti notevoli risultati:
S
8 + > > >
> > : S
T
S
9 8 > > > > > > >+9 > N 8 >+ 9 > 0 >
= !> = N! > = !
> > > > > > > > > >> > > > > ; :; :0 ; T
(5.17)
S
Tutti gli atomi escono da S 0 nel primo caso, ma nessuno nel secondo! Questa è una delle leggi più importanti della meccanica quantistica. Che la natura si comporti in questo modo non è a priori evidente, ma i risultati che abbiamo riportato corrispondono, nel caso della nostra situazione ideale, al comportamento quantistico osservato in innumerevoli esperimenti.
5.5
Interferenza delle ampiezze
Come può succedere che passando dalla situazione (5.15) alla (5.17) – cioè lasciando aperti più canali – passano meno atomi? Questo è l’antico, profondo mistero della meccanica quantistica: l’interferenza delle ampiezze. È lo stesso tipo di fenomeno che abbiamo osservato per la prima volta a proposito dell’interferenza tra due fenditure nell’esperienza con gli elettroni. Abbiamo trovato che si possono avere in alcuni punti meno elettroni quando sono aperte tutte e due le fenditure che quando lo è una sola. Quantitativamente le cose vanno come segue. Possiamo scrivere l’ampiezza che un atomo passi attraverso T e S 0 nell’apparecchio della (5.17) come somma di tre ampiezze, una per ciascuno dei fasci in T; l’intera somma è uguale a zero: h0 S | +Ti h+T | +Si + h0 S | 0 Ti h0 T | +Si + h0 S | Ti h T | +Si = 0 (4)
Con la nostra precedente notazione, si avrebbe ↵ = |h0 T | +S|2 ,
= |h+S | 0 T i|2 e
= |h0 S | 0 T i|2 .
(5.18)
5.5 • Interferenza delle ampiezze
© 978-8808-22107-0
Nessuna delle singole ampiezze è zero; per esempio, il modulo quadrato della seconda è ↵, come si vede dalla (5.15), ma la loro somma è zero. Avremmo ottenuto ancora la stessa risposta se S 0 fosse stato aggiustato in modo da selezionare lo stato ( S). Invece, per l’apparato della (5.16), la risposta è differente. Se indichiamo con a l’ampiezza relativa al passaggio per T e S 0, abbiamo(5) a = h+S | +Ti h+T | +Si + h+S | 0 Ti h0 T | +Si + h+S | Ti h T | +Si = 1
(5.19)
Nel corso dell’esperimento (5.16) il fascio è stato suddiviso e poi ricomposto. Humpty Dumpty(6) è stato rimesso insieme. Nessuna informazione riguardante lo stato originale (+S) è andata perduta – proprio come se l’apparecchio T non esistesse affatto. Questo rimane vero qualunque cosa ci sia dopo l’apparecchio T «tutto aperto». Avremmo potuto metterci appresso un filtro R, cioè un filtro ruotato di qualche angolo scelto a caso, o qualunque altra cosa. La risposta sarebbe sempre stata la stessa come se gli atomi provenissero direttamente dal primo filtro S. Il principio importante è perciò il seguente: un filtro T – o un altro qualsiasi – non diaframmato, non produce il minimo cambiamento. Dovremmo aggiungere un’altra condizione. Non solo il filtro senza diaframmi deve lasciar passare tutti e tre i fasci; ma non deve nemmeno perturbare in modo disuguale i tre fasci. Per esempio, non ci deve essere un forte campo elettrico nelle vicinanze di uno dei fasci e non degli altri. La ragione per cui ciò si richiede è che, anche se queste perturbazioni ulteriori non sono tali da impedire che tutti gli atomi escano dal filtro, potrebbero però cambiare le fasi di alcune delle ampiezze. L’interferenza ne risulterebbe modificata, e le ampiezze nelle equazioni (5.18) e (5.19) sarebbero diverse. Noi ammettiamo sempre che non vi sia questo tipo di perturbazioni. Riscriviamo le equazioni (5.18) e (5.19) facendo uso di una notazione più comoda. Indicheremo con i uno stato qualsiasi tra (+T), (0 T) o ( T); in tal caso, le suddette equazioni possono essere riscritte nella forma: X h0 S | ii hi | +Si = 0 (5.20) tutti gli i
e
X
h+S | ii hi | +Si = 1
(5.21)
tutti gli i
Analogamente, in un esperimento in cui S 0 è sostituito da un filtro completamente arbitrario R, si ha 8 8 8 + 9 +9 + 9 > > > > > > > > > > > > > > >
=
=
= > > > (5.22) > > > > > > > > > >> > > > > :; : ; : ; S
T
R
I risultati sarebbero ancora gli stessi in assenza dell’apparecchio T, cioè se avessimo solo 8 + > > >
> > : S
Ovvero, in formule
X
9 > > > = > > > ;
8 + > > >
> > : R
9 > > > = > > > ;
h+R | ii hi | +Si = h+R | +Si
(5.23)
tutti gli i
Questa è la nostra legge fondamentale, che è sempre valida purché i indichi l’insieme dei tre stati di base di un filtro qualsiasi. Noterete che nell’esperimento (5.22), non c’è alcuna relazione che leghi S e R a T. Inoltre il discorso sarebbe lo stesso indipendentemente dagli stati selezionati. Per scrivere l’equazione (5) In realtà, non possiamo concludere, direttamente dall’esperienza, che a = 1, ma solo che |a| 2 = 1, cosicché a potrebbe essere e i , ma si può dimostrare che la scelta = 0 non rappresenta, in effetti, una perdita di generalità. (6) Un uovo personificato, protagonista di una filastrocca americana per bambini. (N.d.T.)
63
64
Capitolo 5 • Spin uno
© 978-8808-22107-0
in forma generale, senza riferimento agli stati particolari selezionati da S o da R, chiamiamo («fi») lo stato preparato dal primo filtro (nel nostro esempio, +S ) e («chi») lo stato isolato dal filtro finale (nel nostro caso, +R ). Possiamo allora formulare la nostra legge fondamentale (5.23) nel modo seguente: X h | i= h | ii hi | i (5.24) tutti gli i
dove i varia sui tre stati di base di un filtro generico. Vogliamo chiarire di nuovo cosa intendiamo per stati di base. Essi sono analoghi ai tre stati definiti per mezzo di uno dei nostri apparati di Stern-Gerlach. Una prima caratteristica è che una volta arrivati a uno stato di base, il futuro non dipende più dal cammino fatto per arrivarci. Un’altra caratteristica è che, se si ha un insieme completo di stati di base, l’equazione (5.24) è valida per ogni insieme di stati iniziali e finali e . Però, non esiste un unico insieme di stati di base. Abbiamo cominciato con il considerare stati di base relativi a un particolare apparecchio T. Avremmo potuto altrettanto bene considerare un insieme differente di stati di base, relativi a un apparecchio S o R, ecc.(7) Si parla comunemente di stati di base «in una certa rappresentazione». Un’altra condizione che deve essere soddisfatta da un insieme di stati di base in una certa rappresentazione è che essi siano tutti completamente differenti. Con ciò va inteso che se si ha uno stato (+T), l’ampiezza che esso passi in uno stato (0 T) oppure ( T) è zero. Se indichiamo con i e j due qualsiasi stati di base di un certo insieme particolare, le regole generali discusse in relazione alla (5.8) sono che h j | ii = 0 per tutti i valori diversi di i e j. Sappiamo poi che, come è ovvio, hi | ii = 1 Queste due equazioni sono comunemente scritte nella forma h j | ii =
ji
(5.25)
dove ji (il «delta di Kronecker») è un simbolo definito uguale a 0 per i , j, e a 1 per i = j. L’equazione (5.25) non è indipendente dalle altre leggi che abbiamo menzionato. Il fatto è che non ci interessa particolarmente il problema matematico di trovare l’insieme minimo di assiomi indipendenti dai quali tutte le leggi possano essere dedotte come conseguenze(8) . Ci basta avere un insieme che sia completo e non palesemente incoerente. Possiamo, tuttavia, mostrare che le equazioni (5.25) e (5.24) non sono indipendenti. Supponiamo che nella (5.24) rappresenti uno stato di base dello stesso insieme cui appartiene i, per esempio lo stato j-esimo; abbiamo in tal caso che X h | ji = h | ii hi | ji i
Ma la (5.25) ci dice che hi | ji è zero a meno che non sia i = j, quindi la somma si riduce a h | ji e si giunge a una identità, il che ci mostra che le due equazioni non sono indipendenti. Possiamo vedere che ci deve essere un’altra relazione tra le ampiezze, se valgono sia la (5.10) sia la (5.24). L’equazione (5.10) si scrive h+T | +Si h+T | +Si⇤ + h0 T | +Si h0 T | +Si⇤ + h T | +Si h T | +Si⇤ = 1 Se nella (5.24) poniamo sia sia uguali allo stato (+S), il primo membro diviene h+S | +Si, che è chiaramente uguale a 1; e si ottiene nuovamente l’equazione (5.19): h+S | +Ti h+T | +Si + h+S | 0 Ti h0 T | +Si + h+S | Ti h T | +Si = 1 (7) Effettivamente, per i sistemi atomici con tre o più stati di base, esistono altri tipi di filtri – completamente diversi da un apparato di Stern-Gerlach – che possono essere usati per ottenere scelte differenti dell’insieme degli stati di base (ciascun insieme con lo stesso numero di stati). (8) Troppa verità non ci dà fastidio!
5.6 • L’armamentario della meccanica quantistica
© 978-8808-22107-0
Queste due equazioni sono compatibili (per tutte le orientazioni relative degli apparecchi T e S) solo se h+S | +Ti = h+T | +Si⇤ h+S | 0 Ti = h0 T | +Si⇤ h+S | Ti = h T | +Si⇤
Ne consegue che qualunque siano
e , h | i = h | i⇤
(5.26)
Se ciò non fosse vero, la probabilità non si «conserverebbe», e alcune particelle si «perderebbero». Prima di procedere oltre, vogliamo riepilogare le tre leggi generali importanti che riguardano le ampiezze. Queste sono contenute nelle (5.24), (5.25) e (5.26): I
h j | ii =
II h | i =
ji
X
h | ii hi | i
tutti gli i
(5.27)
III h | i = h | i⇤ In queste equazioni i e j si riferiscono a tutti gli stati di base in una singola rappresentazione, mentre e rappresentano due stati arbitrari dell’atomo. È importante osservare che la II è valida solo se la somma è estesa a tutti gli stati di base del sistema (nel nostro caso, tre: +T, 0 T e T). Queste leggi non ci dicono nulla circa la rappresentazione nella quale possiamo scegliere i nostri stati di base. Abbiamo cominciato con l’usare un filtro T, che è un apparecchio di Stern-Gerlach con una certa orientazione; ma un’altra qualsiasi orientazione, diciamo W , sarebbe andata bene ugualmente. La sola differenza starebbe nel fatto che i e j rappresenterebbero un diverso insieme di stati, ma tutte le leggi sarebbero ancora giuste: non si ha dunque un insieme di base univocamente determinato. Uno degli artifici più usati in meccanica quantistica è quello di giocare sul fatto che le varie quantità possono essere calcolate in più modi.
5.6
L’armamentario della meccanica quantistica
Vogliamo mostrarvi come queste leggi siano utili. Supponiamo di avere un atomo in una data condizione (con ciò intendiamo che è stato preparato in un certo modo), e di voler sapere che cosa gli capiterà in un particolare esperimento. In altri termini, partiamo con il nostro atomo nello stato , e ci proponiamo di valutare le probabilità che attraversi un dato apparecchio che lascia passare i soli atomi che si trovano nella condizione . Le leggi di cui sopra affermano che l’apparecchio può essere completamente descritto per mezzo di tre numeri complessi h | ii, che sono le ampiezze di trovare ciascuno stato di base nella condizione ; e che, inoltre, possiamo prevedere la sorte di un atomo, una volta entrato nell’apparecchio stesso, descrivendone lo stato mediante i tre numeri hi | i, cioè le ampiezze per il passaggio dell’atomo dalla condizione originale in uno qualsiasi dei tre stati di base. Questo è un concetto importante. Illustriamolo con un altro esempio. Immaginate il seguente problema: partiamo con l’apparecchio S, seguito da un sacco di cianfrusaglie, che chiamiamo A, e infine, da un apparato R, nel modo seguente: 8 8 9 8 + 9 + 9 > > > > > > > > > > > > > > > > >
> > > (5.28) > > > > > > > >> > > > > : ; :; : ; S
R
Per A intendiamo un qualsiasi assetto complesso di apparecchi di Stern-Gerlach, con diaframmi interi o parziali, orientati secondo angoli strani, con campi elettrici e magnetici balordi... con
65
66
Capitolo 5 • Spin uno
© 978-8808-22107-0
tutto quello che volete metterci. (È piacevole organizzare esperimenti ideali: poi non ci si deve affaticare a mettere su realmente gli apparecchi!) Si pone allora il problema: con quale ampiezza una particella che si trovava nello stato (+S) prima di entrare in A ne esce nello stato (0 R), in modo da poter passare indenne attraverso il filtro R? Si usa comunemente per una tale ampiezza la notazione h0 R | A | +Si Come al solito, va letta da destra a sinistra (come l’ebraico): hfinale | intermedio | inizialei Se, per caso, A non ha nessun effetto, ma è semplicemente un canale aperto, allora scriveremo h0 R | 1 | +Si = h0 R | +Si
(5.29)
e i due simboli sono equivalenti. In un problema più generale, sostituiremo (+S) con un generico stato iniziale e (0 R) con un qualsiasi stato finale , e cercheremo di valutare l’ampiezza h | A| i Uno studio completo dell’apparecchio A deve fornire l’ampiezza h | A | i per tutte le possibili coppie di stati e , il che significa un numero infinito di combinazioni! In che modo allora potremo descrivere concisamente il comportamento dell’apparato A? Possiamo procedere come segue. Immaginiamo che l’assetto della (5.28) sia modificato in 8 + > > >
> > : S
9 > > > = > > > ;
8 +9 > > > > >
= > > > >> > :;
8 9 > > > > >
= > > > >> > :;
T
8 +9 > > > > >
= > > > >> > :; T
8 + > > >
> > : R
9 > > > = > > > ;
(5.30)
In pratica non cambia nulla perché gli apparecchi T sono completamente aperti e non hanno alcun effetto. Ma suggeriscono la maniera di analizzare il problema. Si ha un insieme di ampiezze hi | +Si relative alla possibilità che gli atomi provenienti da S si portino nello stato i di T. Poi c’è un altro insieme di ampiezze che uno stato i (rispetto a T), passando in A, venga trasformato in uno stato j (rispetto a T). Infine si ha un’ampiezza che ciascun stato j passi, per effetto dell’ultimo filtro, nello stato (0 R). Per ogni possibile alternativa, si ha un’ampiezza del tipo h0 R | ji h j | A | ii hi | +Si e l’ampiezza totale è la somma di tutti i termini che si ottengono al variare di i e j in ogni possibile combinazione. L’ampiezza richiesta risulta quindi X h0 R | ji h j | A | ii hi | +Si (5.31) ij
Se al posto di (0 R) e (+S) si sostituiscono gli stati generici e , si ottiene un’espressione dello stesso tipo; quindi si ha il risultato generale X h | A| i = h | ji h j | A | ii hi | i (5.32) ij
Notate ora che il secondo membro della (5.32) è in realtà «più semplice» del primo. L’apparecchio A è completamente descritto dai nove numeri h j | A | ii che danno la risposta di A relativa ai tre stati di base del filtro T. Una volta noti questi nove numeri, possiamo trattare due stati iniziale e finale e qualsiasi, se definiamo ciascuno di essi per mezzo delle tre ampiezze per la transizione a, o da, ognuno dei tre stati di base. Usando l’equazione (5.32), si può prevedere il risultato di un esperimento. Questo è dunque l’armamentario della meccanica quantistica per le particelle di spin uno. Ogni stato è descritto da tre numeri che sono le ampiezze di transizione in ciascuno degli stati di
5.7 • Passaggio a una base diversa
© 978-8808-22107-0
base di un insieme prestabilito. Ogni apparato è descritto da nove numeri che danno le ampiezze per il passaggio da uno stato di base a un altro nell’apparecchio. Da questi numeri si può calcolare tutto ciò che si vuole. Le nove ampiezze che descrivono l’apparecchio sono spesso scritte sotto forma di una matrice quadrata, rappresentata con la notazione h j | A | ii :
a + 0
+ h+ | A | +i h0 | A | +i h | A | +i
da 0 h+ | A | 0i h0 | A | 0i h | A | 0i
h+ | A | i h0 | A | i h | A| i
(5.33)
Il formalismo della meccanica quantistica è puramente un’estensione di questi concetti. Ve ne daremo una semplice illustrazione. Supponiamo di voler analizzare un apparecchio C, cioè di voler calcolare i vari h j | C | ii. Per esempio, potremmo proporci di calcolare ciò che accade in un esperimento come 8 8 9 8 + 9 + 9 > > > > > > > > > > > > > > >
=
=
= > > > (5.34) > > > > > > > > > > > > > > > : ; : ; : ; S
R
Ma poi ci accorgiamo che C è costituito semplicemente da due apparecchi A e B, posti in serie: le particelle passano prima per A e poi per B. Allora possiamo scrivere simbolicamente
8 9 8 > > > > > > > > >9 > 8 > 9 > >
= = >
= ·>
= (5.35) > > > > > > > > > > > >> > > > > > : ; :; : ; Si dice allora che l’apparecchio C è il «prodotto» di A e B. Poniamo anche di saper analizzare le due parti; allora possiamo ricavare le matrici (rispetto a T) che corrispondono ad A e B. A questo punto il nostro problema è risolto. Possiamo trovare facilmente l’ampiezza h |C | i per stati entranti e uscenti qualsiasi. Per prima cosa scriviamo che X h |C | i = h | B | ki hk | A | i k
Capite perché? (Piccolo aiuto: immaginate di porre un apparecchio T tra A e B.) Perciò, considerando il caso particolare in cui e sono essi pure stati di base (di T), per esempio i e j, si ha X h j | C | ii = h j | B | ki hk | A | ii (5.36) k
Questa equazione dà la matrice per l’apparecchio «prodotto» C in termini delle due matrici degli apparecchi A e B. I matematici chiamano matrice «prodotto» B A delle due matrici B e A la nuova matrice h j | C | ii, formata a partire dalle due matrici h j | B | ii e h j | A | ii mediante la somma specificata dalla (5.36). (Si noti che l’ordine è importante, AB , B A.) Possiamo quindi dire che la matrice relativa a due apparecchi in successione è la matrice prodotto delle matrici associate ai due apparecchi (ponendo il primo apparato a destra nel prodotto). Chi conosce l’algebra delle matrici capisce che si tratta proprio dell’equazione (5.36).
5.7
Passaggio a una base diversa
Vogliamo fare un’ultima osservazione sugli stati di base usati nei calcoli. Supponiamo di avere scelto di procedere a partire da una base particolare, per esempio la base S, e che invece un altro
67
68
Capitolo 5 • Spin uno
© 978-8808-22107-0
decida di fare gli stessi calcoli con una base diversa; poniamo che sia la T. Per brevità, indichiamo i nostri stati di base con (iS), dove i = +, 0, . Analogamente, indicheremo i suoi stati di base con ( jT). Come possiamo raffrontare i nostri calcoli con i suoi? La risposta finale circa il risultato di una misura qualsiasi sarà sempre la stessa, ma nel corso dei calcoli compariranno delle ampiezze e delle matrici differenti. Quali sono le relazioni tra di esse? Per esempio, se in tutti e due i casi si parte con lo stesso , noi lo descriveremo per mezzo delle tre ampiezze hiS | i relative alle transizioni da a uno dei tre stati di base della rappresentazione S, mentre lui lo rappresenterà mediante le ampiezze h jT | i tra e gli stati di base della sua rappresentazione T. Come possiamo controllare che ambedue stiamo realmente descrivendo lo stesso stato ? Possiamo vederlo con l’aiuto della regola generale II della (5.27). Sostituendo uno dei suoi stati jT al posto di , si ricava X h jT | i = h jT | iSi hiS | i (5.37) i
Per stabilire la relazione tra le due rappresentazioni, ci servono solo i nove numeri complessi della matrice h jT | iSi. Questa matrice ci permette di riportare tutte le sue equazioni nella nostra forma. Essa ci dice come operare la trasformazione da un insieme di stati di base all’altro. (Per questa ragione h jT | iSi viene spesso indicata come «matrice di trasformazione dalla rappresentazione S alla rappresentazione T». Bella frase!) Nel caso di particelle con spin uno, in cui abbiamo solo tre stati di base (per spin più alti, ce ne sono di più), il formalismo è analogo a quello che abbiamo incontrato nell’algebra vettoriale. Ogni vettore può essere rappresentato da tre numeri, le componenti lungo gli assi x, y e z. Cioè ogni vettore può essere decomposto in tre vettori di «base» che sono orientati come gli assi. Ma supponiamo che un altro scelga un diverso sistema di assi: x 0, y 0 e z 0. Egli userà dei numeri diversi per rappresentare i vari vettori. I suoi calcoli sembreranno diversi ma i risultati saranno gli stessi. Abbiamo già considerato questo problema e conosciamo le regole per trasformare i vettori da un sistema d’assi a un altro. Forse vi piacerebbe vedere come funzionano le trasformazioni quantistiche e come si applicano in qualche caso; perciò, daremo qui, senza dimostrazione, le matrici di trasformazione per passare, nel caso di spin uno, dalle ampiezze in una rappresentazione S a quelle in un’altra rappresentazione T, per varie particolari orientazioni relative dei filtri S e T. (Vi mostreremo in un capitolo successivo come ricavare questi risultati.) Primo caso. L’apparecchio T abbia lo stesso asse y (lungo il quale si muovono le particelle) dell’apparecchio S, ma sia ruotato intorno all’asse y comune di un angolo ↵ (come in FIGURA 5.6). Per essere precisi, fissiamo un sistema di coordinate x 0, y 0, z 0 solidale con l’apparecchio T, e diamo le relazioni che legano queste alle coordinate x, y, z associate a S:
z 0 = z cos ↵ + x sen ↵ x 0 = x cos ↵ z sen ↵ y0 = y Le ampiezze di trasformazione risultano allora: 1 (1 + cos ↵) 2 1 h0 T | +Si = p sen ↵ 2 1 h T | +Si = (1 cos ↵) 2 1 h+T | 0 Si = + p sen ↵ 2 h+T | +Si =
h0 T | 0 Si = cos ↵ h T | 0 Si =
1 p sen ↵ 2
(5.38a) (5.38b) (5.38c) (5.38d) (5.38e) (5.38f)
5.7 • Passaggio a una base diversa
© 978-8808-22107-0
1 (1 cos ↵) 2 1 h0 T | Si = + p sen ↵ 2 h+T | Si =
h T | Si =
1 (1 + cos ↵) 2
(5.38g) (5.38h) (5.38i)
Secondo caso. L’apparecchio T abbia l’asse z in comune con S, ma sia ruotato intorno all’asse
z di un angolo . La trasformazione di coordinate è z0 = z x 0 = x cos y 0 = y cos
+ y sen x sen
Le ampiezze di trasformazione sono le seguenti: h+T | +Si = e+i h0 T | 0 Si = 1 h T | Si = e
i
(5.39)
tutte le altre = 0 Si noti che una rotazione arbitraria di T può essere ottenuta a partire dalle due rotazioni considerate. Se uno stato è definito dai tre numeri C+ = h+S | i C0 = h0 S | i C =h S| i
(5.40)
e lo stesso stato è rappresentabile, rispetto a T, dai tre numeri C+0 = h+T | i C00 = h0 T | i C0 = h T | i
(5.41)
allora i coefficienti h jT | iSi delle (5.38) o della (5.39) forniscono la trasformazione che collega Ci0 con Ci . In altre parole, i Ci sono molto simili alle componenti di un vettore che appare differente visto da S o da T. Soltanto per particelle di spin uno, che richiedono tre ampiezze, l’affinità con i vettori è molto spiccata. In tutti e due i casi, ci sono tre numeri che si trasformano, cambiando sistema di coordinate, secondo una legge ben definita. Più precisamente, si ha un insieme di stati di base che si trasformano esattamente come le tre componenti di un vettore. Infatti le tre combinazioni lineari 1 Cx = p (C+ C ) 2 i (5.42) Cy = p (C+ + C ) 2 Cz = C0 si trasformano in Cx0 , Cy0 e Cz0 proprio come x, y e z si trasformano in x 0, y 0 e z 0. (Potete verificare questo risultato usando le leggi di trasformazione (5.38) e (5.39).) Questa è la ragione per cui le particelle di spin uno vengono spesso denominate «particelle vettoriali».
69
70
Capitolo 5 • Spin uno
5.8
© 978-8808-22107-0
Altri casi
Avevamo cominciato con l’affermare che la nostra discussione delle particelle di spin uno può costituire il prototipo su cui basarsi per ogni problema di meccanica quantistica. L’unica generalizzazione riguarda il numero degli stati. Invece che solo tre stati di base, una data situazione può richiedere n stati di base(9) . Le nostre leggi fondamentali rappresentate dall’equazione (5.27) mantengono esattamente la stessa forma, con l’unica differenza che i e j variano su tutti gli n stati di base. Un qualsiasi fenomeno può essere analizzato scrivendo le ampiezze per tutte le transizioni da ciascuno degli stati di base a un altro qualsiasi, e sommando sull’intero insieme di stati di base. Un qualsiasi insieme di stati di base può essere usato, purché abbia le proprietà giuste, e se qualcuno vuole partire da uno diverso, può farlo benissimo; i due possono essere correlati applicando una matrice n per n di trasformazione. Ritorneremo in seguito su queste trasformazioni. Infine, avevamo promesso di trattare il caso di atomi che provengano direttamente come da un crogiuolo, attraversano un certo apparecchio, indicato con A, e sono poi analizzati da un filtro che seleziona lo stato . Non è possibile sapere quale fosse lo stato in cui gli atomi si trovavano all’inizio. Sarebbe forse meglio che a questo punto non vi interessaste di questa questione, e vi concentraste su problemi in cui si parte da stati puri. Ma se insistete, ecco il procedimento da seguire per risolvere il problema. Per prima cosa, bisogna essere in grado di fare una stima ragionevole sulla distribuzione dei vari stati tra gli atomi che arrivano dal crogiuolo. Per esempio, se questo non presenta niente di «speciale», si può ragionevolmente ammettere che gli atomi ne escano con «orientazioni» a caso. Dal punto di vista della meccanica quantistica, questo equivale a dire che non si sa niente circa gli stati, tranne che un terzo degli atomi saranno nello stato (+S), un terzo nello stato (0 S) e un terzo nello stato ( S). Per quegli atomi che si trovano nello stato (+S) l’ampiezza del processo è h | A | +Si e la probabilità |h | A | +Si|2 , e analogamente negli altri casi. La probabilità complessiva è di conseguenza 1 1 1 |h | A | +Si| 2 + |h | A | 0 Si| 2 + |h | A | Si| 2 3 3 3 Perché abbiamo usato S invece che, per esempio, T? Per quanto possa sembrare strano, il risultato è lo stesso qualunque sia stata la scelta iniziale, almeno finché si tratta di orientazioni completamente a caso. Si ottiene allo stesso modo che X X |h | iSi| 2 = |h | jTi| 2 i
j
per qualsiasi . (Ve lo lasciamo da dimostrare.) p p Si noti che non è giusto p dire che lo stato iniziale ha le ampiezze 1/3 di trovarsi in (+S), 1/3 di trovarsi in (0, S) e 1/3 di trovarsi in ( S); questo implicherebbe la possibilità di alcune interferenze. Invece, si ha semplicemente che non conoscete lo stato iniziale, e dovete parlare di probabilità che il sistema si trovi in partenza nei vari possibili stati iniziali, e infine dovete fare una media pesata di tutte le possibilità.
(9)
Il numero di stati di base può anche essere infinito, e, in generale, lo è.
6
Spin un mezzo
Questo capitolo consiste in una digressione alquanto estesa e un po’ astratta, che non conduce ad alcun risultato che non sarà poi riottenuto per altra via nei prossimi capitoli. Potete perciò saltarlo, per ritornarvi in seguito, se v’interessa.
6.1
Trasformazione delle ampiezze
Nel capitolo precedente, riferendoci all’esempio di un sistema con spin uno, abbiamo delineato i principi generali della meccanica quantistica. • Uno stato arbitrario può essere descritto in termini di un insieme di stati di base dando le ampiezze di probabilità relative a ciascuno di questi stati di base. • L’ampiezza per la transizione da uno stato a un altro può, in generale, essere scritta come una somma di prodotti, essendo ciascun prodotto formato dall’ampiezza relativa al passaggio in uno degli stati di base per l’ampiezza relativa al passaggio da quello stato di base alla condizione finale, ed essendo la somma estesa a tutti gli stati di base: X h | i= h | ii hi | i (6.1) i
• Gli stati di base sono ortogonali; l’ampiezza relativa al passaggio da uno di essi a un altro è zero: hi | ji = i j (6.2) • L’ampiezza per la transizione da uno stato a un altro in un verso è la complessa coniugata di quella associata alla transizione opposta: h | i⇤ = h | i
(6.3)
Ci siamo anche soffermati sul fatto che si possono assumere più basi diverse per gli stati e che si può ricorrere alla (6.1) per passare da una base a un’altra. Supponiamo, per esempio, di conoscere le ampiezze hiS | i, di trovare lo stato in ognuno degli stati i di una base S, ma di decidere in seguito che è meglio descrivere lo stato riferendosi a un altro insieme di stati di base, diciamo gli stati j, relativi alla base T. Nella formula generale dell’equazione (6.1), possiamo sostituire jT al posto di ottenendo così la relazione: X h jT | i = h jT | iSi hiS | i (6.4) i
Le ampiezze di transizione dallo stato ( ) a uno degli stati di base ( jT) sono legate alle ampiezze di transizione agli stati di base (iS) dai coefficienti h jT | iSi. Se ci sono N stati di base, ci sono N 2 di questi coefficienti. L’insieme di questi ultimi è spesso indicato come la «matrice di trasformazione dalla rappresentazione S alla rappresentazione T». Detto in termini matematici, sembra una cosa
72
Capitolo 6 • Spin un mezzo
© 978-8808-22107-0
terribile, ma, con qualche cambiamento dei nomi, ci si accorge che non è poi così eccezionale. Se indichiamo con Ci l’ampiezza che lo stato si trovi nello stato di base iS, cioè Ci = hiS | i e con C j0 la corrispondente ampiezza nella base T, cioè C j0 = h jT | i allora l’equazione (6.4) può essere scritta come X C j0 = R ji Ci
(6.5)
i
dove R ji sta per h jT | iSi. Ogni ampiezza C j0 è la somma su tutti gli i di uno dei coefficienti R ji moltiplicato per ciascuna ampiezza Ci . Questa equazione si presenta formalmente come la trasformazione di un vettore da un sistema di coordinate a un altro. Per evitare di discutere troppo a lungo in astratto, vi abbiamo dato alcuni esempi di questi coefficienti nel caso di spin uno, per mostrarvi come si applicano in pratica. D’altro canto, in meccanica quantistica si verifica il fatto notevolissimo che, dalla semplice esistenza dei tre stati e dalle proprietà di simmetria dello spazio per rotazioni, si possono ricavare questi coefficienti con ragionamenti puramente teorici. L’esporvi tali considerazioni in questa fase iniziale comporta lo svantaggio d’immergervi in un altro mucchio di astrazioni prima di «tornare sulla terra». Tuttavia, l’argomento è così bello che vogliamo esporvelo ugualmente. Vi mostreremo in questo capitolo come si ricavino i coefficienti di trasformazione per particelle di spin un mezzo. Scegliamo questo caso, invece che lo spin uno, perché è un po’ più facile. Il nostro problema è quello di determinare i coefficienti R ji per particelle, o sistemi atomici, un fascio dei quali si suddivide in due in un apparecchio di Stern-Gerlach. Ricaveremo tutti i coefficienti della trasformazione da una rappresentazione a un’altra, per pura deduzione, a partire da poche ipotesi. Qualche assunto è sempre necessario per poter fare un «puro» ragionamento! Per quanto i passaggi possano essere astratti e un po’ involuti, il risultato che otterremo sarà relativamente semplice da enunciare e facile da comprendere, e il risultato è la cosa più importante. Se volete, potete considerare questa discussione come una specie di digressione culturale. Abbiamo infatti organizzato le cose in modo che tutti i risultati essenziali che otterremo qui saranno anche ricavati in altro modo quando vorremo servirci di essi nei capitoli successivi. Quindi, non dovete aver paura di perdere il filo dell’esposizione della meccanica quantistica se saltate l’intero capitolo, o se lo studierete poi in seguito. La digressione è «culturale» nel senso che è intesa a mostrare che i principi della meccanica quantistica, non solo sono interessanti, ma sono anche così profondi che, aggiungendo loro semplicemente alcune ulteriori ipotesi sulla struttura dello spazio, se ne può dedurre una gran quantità di proprietà dei sistemi fisici. Inoltre, è importante sapere su quali basi si fondano le varie conseguenze della meccanica quantistica, in quanto, essendo le leggi della fisica, come sappiamo, incomplete, è interessante mettere in chiaro se i punti in cui le nostre teorie non si accordano con l’esperienza sono quelli che corrispondono ai ragionamenti più sicuri o a quelli meno solidi. Finora sembra che si ottengano risultati corretti, in accordo con l’esperienza, dove la nostra logica è più astratta. Solo quando proviamo a fare modelli specifici del meccanismo interno delle particelle elementari e delle loro interazioni, non riusciamo più a trovare una teoria in accordo con gli esperimenti. La teoria che stiamo per discutere si accorda con l’esperienza in tutti i campi in cui è stata controllata, per le particelle strane come per gli elettroni, i protoni e tutte le altre. Prima di procedere oltre, facciamo un’osservazione su una questione noiosa ma importante: non è possibile determinare univocamente i coefficienti R ji , perché rimane sempre un’ambiguità nelle ampiezze di probabilità. Se si ha un insieme qualsiasi di ampiezze, per esempio le ampiezze relative all’arrivo di una particella in un punto secondo cammini diversi, e si moltiplica ognuna di esse per lo stesso fattore di fase, che indichiamo con ei , se ne ottiene un altro altrettanto buono. Volendo, quindi, è sempre possibile effettuare un arbitrario cambiamento di fase su tutte le ampiezze che compaiono in un dato problema.
73
6.2 • Trasformazione a un sistema di coordinate ruotato
© 978-8808-22107-0
6.1 Viste laterale e dall’alto di un apparecchio «modificato» di Stern-Gerlach funzionante con fasci di particelle di spin un mezzo. FIGURA
Vista laterale
+
T
–
z
6.2 Due esperienze equivalenti. FIGURA
y S
(a)
Gradiente del campo Vista dall’alto
S y
T
x (b)
Supponete di calcolare una certa probabilità scrivendo la somma di molte ampiezze, ad esempio (A + B + C + ...), e prendendone il modulo quadrato. Un altro calcola poi la stessa quantità sommando le ampiezze (A0 + B 0 + C 0 + ...) e facendo il modulo quadrato. Se tutte le A0, B 0, C 0, ecc. sono uguali alle A, B, C, ecc. a meno di uno stesso fattore ei , tutte le probabilità ottenute facendo i moduli quadrati saranno esattamente le stesse, poiché la somma (A0 + B 0 + C 0 + ...) sarà uguale a ei (A + B + C + ...). Oppure, immaginate, per esempio, di voler calcolare qualcosa a partire dall’equazione (6.1), e di cambiare poi improvvisamente tutte le fasi di un certo sistema di base. Ognuna delle ampiezze hi | i risulterà moltiplicata per lo stesso fattore ei . Analogamente, le ampiezze hi | i saranno anch’esse moltiplicate per ei , mentre le ampiezze h | ii, che sono le complesse coniugate delle hi | i, risulteranno conseguentemente moltiplicate per il fattore e i . Gli i a esponente compaiono con segni opposti e si eliminano, quindi si ricava la stessa espressione di prima. Si ha perciò la regola generale che, alterando per uno stesso fattore di fase tutte le ampiezze rispetto a un dato sistema di base, o anche moltiplicando tutte le ampiezze in un problema qualsiasi per la stessa fase, non si ottiene alcun effetto. Si ha, dunque, una certa libertà nella scelta delle fasi della nostra matrice di trasformazione. Ogni tanto sfrutteremo questa arbitrarietà, seguendo per lo più le convenzioni che sono di uso generale.
6.2
Trasformazione a un sistema di coordinate ruotato
Consideriamo nuovamente l’apparecchio «modificato» di Stern-Gerlach descritto nel capitolo precedente. Nella FIGURA 6.1 è mostrato schematicamente un fascio di particelle di spin un mezzo che, giungendo da sinistra, viene in generale diviso in due. (Nel caso di spin uno si osservano tre fasci.) I fasci poi si ricongiungono, come in precedenza, a meno che l’uno o l’altro di essi non venga fermato da un «arresto» che intercetta il fascio nel punto medio della sua traiettoria. Una freccia indica in figura la direzione in cui il modulo del campo aumenta; poniamo che ciò accada nel verso corrispondente a quello dei due poli del magnete che è sagomato a lama di coltello. Prendiamo come verso «su» dell’asse relativo a un dato apparecchio quello indicato dalla freccia. Questo asse è solidale all’apparecchio e ci servirà a precisare le orientazioni relative nel caso che ci siano diversi apperecchi. Supponiamo, inoltre, che la direzione del campo magnetico in ciascun magnete sia sempre la stessa rispetto a quella della freccia. Diremo che gli atomi del fascio «superiore» sono nello stato (+) relativamente a quel particolare apparecchio, mentre quelli nel fascio «inferiore» sono nello stato ( ). (Non c’è uno stato «zero» per le particelle di spin un mezzo.)
74
Capitolo 6 • Spin un mezzo
© 978-8808-22107-0
6.3 Se T è «completamente aperto», (b) è equivalente ad (a). FIGURA
U
T
U S
S (a)
(b)
Consideriamo ora due dei nostri apparecchi di Stern-Gerlach modificati posti in successione, come si vede in FIGURA 6.2a. Il primo, che indichiamo con S, può servire a preparare uno stato puro (+S) o ( S) a seconda di quale fascio viene arrestato. (Nel caso di figura seleziona un puro stato (+S).) Per ogni situazione, si ha un’ampiezza relativa al passaggio delle particelle che escono da S nello stato (+T) o ( T) rispetto al secondo apparecchio. Precisamente, ci sono quattro ampiezze: l’ampiezza per la transizione da (+S) a (+T), da (+S) a ( T), da ( S) a (+T) e da ( S) a ( T). Queste ampiezze sono proprio i coefficienti della matrice di trasformazione R ji dalla rappresentazione S alla rappresentazione T. Possiamo dire che il primo apparecchio «prepara» uno stato definito in una rappresentazione e che il secondo «analizza» tale stato rispetto alla seconda rappresentazione. Il tipo di problema che ci proponiamo di risolvere è allora il seguente: se un atomo è stato preparato in un certo stato, per esempio (+S), bloccando uno dei fasci all’interno di S, quali modifiche subirà passando nel secondo apparecchio T, sistemato nello stato, poniamo, ( T) ? Il risultato dipenderà, com’è naturale, dall’orientazione relativa dei due sistemi S e T. Cercheremo di spiegare in che modo ci sia speranza di ricavare i coefficienti R ji per semplice deduzione. Voi sapete che è quasi del tutto impossibile pensare che se una particella ha spin allineato in direzione dell’asse positivo delle z, ci sia qualche probabilità di trovare la stessa particella con spin nella direzione +x, o in un’altra qualsiasi. In realtà è quasi impossibile, ma non del tutto. È tanto poco probabile che c’è solo un modo di ottenere questo risultato, e proprio per questo possiamo trovare quale sia questa unica maniera. Il primo tipo di ragionamento che si può impostare è questo. Supponiamo di montare un’apparecchiatura come quella di FIGURA 6.2a, composta da due filtri S e T, con T girato di un angolo ↵ rispetto a S, e lasciamo passare solo il fascio (+) attraverso S e quello ( ) attraverso T. Possiamo così misurare il numero che rappresenta la probabilità che le particelle uscenti da S passino attraverso T. Immaginiamo poi di eseguire un’altra misura con l’apparecchio di FIGURA 6.2b. L’orientazione relativa di S e T è la stessa, ma l’intero sistema è ruotato di un certo angolo nello spazio. Ammetteremo che in entrambi questi esperimenti si ottenga lo stesso valore per la probabilità che una particella in uno stato puro rispetto a S si porti in un particolare stato di T. In altre parole, stiamo supponendo che il risultato di un qualsiasi esperimento di questo tipo sia lo stesso, che la fisica rimanga la stessa, qualunque sia l’orientazione nello spazio dell’intero apparecchio. (Voi direte: «Questo è ovvio». Invece è una supposizione «giusta» solo se corrisponde a quello che in realtà accade.) Questo implica che i coefficienti R ji dipendano solamente dalla situazione relativa di S e T, e non dalla loro posizione in assoluto. Per esprimerci diversamente, possiamo dire che R ji dipende solo dalla rotazione che porta S a coincidere con T, in quanto, evidentemente, quello che hanno in comune gli assetti in FIGURA 6.2a e in FIGURA 6.2b è la rotazione tridimensionale che porta l’apparecchio S nella direzione di T. Quando una matrice di trasformazione R ji dipende solo da una rotazione, come in questo caso, allora viene detta una matrice di rotazione. Per procedere oltre, ci serve un’ulteriore informazione. Immaginiamo di aggiungere un terzo apparecchio, che indicheremo con U, posto dopo T con una orientazione arbitraria, come in
6.2 • Trasformazione a un sistema di coordinate ruotato
© 978-8808-22107-0
6.3a. (La cosa comincia a diventare preoccupante, ma il bello del pensiero astratto è proprio che si possono fare esperimenti dell’altro mondo semplicemente tracciando delle linee!) Quale sarà la trasformazione S ! T ! U? Ciò che realmente vogliamo conoscere è l’ampiezza per il passaggio da un certo stato relativo a S a un altro relativo a U, una volta note le trasformazioni da S a T e da T a U. Stiamo ragionando perciò su un esperimento in cui sono aperti tutti e due i canali di T. Si ottiene la risposta applicando due volte di seguito l’equazione (6.5). Per il passaggio dalla rappresentazione S alla rappresentazione T, si ha X C j0 = RTjiS Ci (6.6) FIGURA
i
dove abbiamo posto gli indici T S sui coefficienti R, per distinguerli dai coefficienti RUT relativi alla trasformazione da T a U. Se indichiamo con Ck00 le ampiezze relative agli stati di base della rappresentazione U, le connetteremo alle ampiezze T ricorrendo nuovamente all’equazione (6.5); si ottiene così X 0 Ck00 = RUT (6.7) k j Cj j
Infine, combiniamo le equazioni (6.6) e (6.7) per ricavare la trasformazione diretta da S a U. Sostituendo C j0 dall’equazione (6.6) nella (6.7), si ha Ck00 =
X
RUT kj
j
X
RTjiS Ci
(6.8)
i
Oppure, dal momento che i non appare in RUT , possiamo portare la sommatoria in i fuori, e kj scrivere XX TS Ck00 = RUT (6.9) k j R ji Ci i
j
Questa è la formula per la doppia trasformazione. Notate però che, essendo aperti tutti i canali di T, lo stato che esce da questo filtro è lo stesso che vi è entrato. Avremmo perciò potuto benissimo passare direttamente dalla rappresentazione S alla U. Sarebbe stato equivalente porre l’apparecchio U subito dopo S, come in FIGURA 6.3b. In tal caso avremmo scritto X Ck00 = RUS (6.10) ki Ci i
con coefficienti relativi a questa trasformazione. Ovviamente, le equazioni (6.9) e (6.10) danno le stesse ampiezze Ck00, e questo deve valere indipendentemente dallo stato iniziale da cui si sono ottenute le ampiezze Ci . Da ciò segue che X TS RUS = RUT (6.11) ki k j R ji RUS ki
j
In altre parole, per ogni rotazione S ! U di un sistema di riferimento, pensata come successione di due rotazioni S ! T e T ! U, la matrice di rotazione RUS può essere ricavata dalle matrici ki delle due rotazioni parziali mediante l’equazione (6.11). Se preferite, potete ottenere l’equazione (6.11) direttamente dalla (6.1), in quanto essa non è altro che una diversa scrittura per X hkU | iSi = hkU | jTi h jT | iSi j
Per completezza, aggiungiamo tra parentesi le seguenti considerazioni. Tuttavia, queste non sono tremendamente importanti, e quindi, se credete, potete passare direttamente al paragrafo successivo. Le affermazioni che abbiamo fatto non sono del tutto corrette. In realtà, non possiamo dire che le equazioni (6.9) e (6.10) diano necessariamente le stesse identiche ampiezze. Solo la
75
76
Capitolo 6 • Spin un mezzo
© 978-8808-22107-0
fisica deve rimanere inalterata; tutte le ampiezze potrebbero differire di un qualche fattore di fase comune come ei senza che il risultato di un calcolo qualunque concernente il mondo reale ne venga modificato. Quindi, in realtà, invece della (6.11), tutto ciò che possiamo affermare è che X TS ei RUS = RUT (6.12) ki k j R ji j
dove è una certa costante reale. Il significato di questo fattore supplementare ei è, naturalmente, che le ampiezze che si ottengono dalla matrice RUS possono tutte differire per lo stesso fattore di fase (e i ) da quelle ricavate invece a partire dalle due rotazioni RUT e RT S . Poiché sappiamo che non porta alcuna conseguenza la simultanea moltiplicazione di tutte le ampiezze per uno stesso fattore di fase possiamo, volendo, ignorare semplicemente questo fattore. Ma si può dimostrare che definendo con un particolare criterio tutte le nostre matrici di rotazione, questi fattori di fase non compaiono mai, ovvero le nell’equazione (6.12) sono sempre uguali a zero. Per quanto questo fatto non sia essenziale per lo sviluppo della discussione, ne daremo una rapida dimostrazione basandoci su un teorema matematico relativo ai determinanti. (Se ancora non ne sapete molto sui determinanti, lasciate stare la dimostrazione e passate subito alla definizione della (6.15).) Diciamo subito che l’equazione (6.11) è nient’altro che la definizione matematica del «prodotto» di due matrici. (È utile poter dire: «RUS è il prodotto di RUT e RT S ».) In secondo luogo, c’è un teorema di matematica che per le matrici due per due, con cui abbiamo a che fare, si dimostra facilmente, e afferma che il determinante del «prodotto» di due matrici è il prodotto dei loro determinanti. Applicando questo teorema all’equazione (6.12), si ottiene ei2 (Det RUS ) = (Det RUT ) · (Det RT S )
(6.13)
(Omettiamo gli indici in basso, perché non ci dicono nulla di utile.) Sissignori, il 2 è giusto. Ricordate che avete a che fare con matrici due per due; ogni elemento di matrice RUS è moltiki plicato per ei , e quindi, ogni prodotto nel determinante, essendo composto di due fattori, viene moltiplicato per ei2 . Prendiamo ora la radice quadrata dell’equazione (6.13) e portiamola a dividere la (6.12); si ha X RUT RTjiS RUS kj ki = p p p Det RUT Det RT S Det RUS j
(6.14)
Il fattore di fase è scomparso. Inoltre si verifica il fatto che, se vogliamo che tutte le nostre ampiezze in una qualsiasi data P rappresentazione siano normalizzate (il che, come ricorderete, significa che i h | ii hi| i = 1), le matrici di rotazione dovranno tutte avere determinanti uguali all’esponenziale di un numero immaginario puro, cioè del tipo ei↵ . (Non ne daremo la dimostrazione; ma vi accorgerete che viene sempre fuori così.) Perciò, se si vuole, si può rendere univoca la scelta dei fattori di fase di tutte le nostre matrici di rotazione R, ponendo Det R = 1. Si procede così. Immaginiamo di giungere in un modo qualsiasi a una matrice di rotazione R. Facciamo la convenzione di «convertirla» alla «forma standard» mediante la definizione R Rstandard = p (6.15) Det R Il procedimento è giustificato dal fatto che così facendo moltiplichiamo ciascun elemento di R per lo stesso fattore di fase, per arrivare alle fasi che vogliamo. Nel seguito, supporremo sempre che le nostre matrici siano state poste nella loro «forma standard»; potremo allora usare l’equazione (6.11) senza fattori di fase aggiuntivi.
6.3
Rotazioni intorno all’asse z
Siamo ora in grado di determinare la matrice di trasformazione R ji tra due differenti rappresentazioni. La legge di composizione delle rotazioni che abbiamo ricavato, unita all’ipotesi fatta
T
y
y
y'
Gradiente del campo
x
x
x'
P1 P1 S
FIGURA
6.4
77
6.3 • Rotazioni intorno all’asse z
© 978-8808-22107-0
(a)
T
S
(b)
Rotazione di 90° intorno all’asse z.
che lo spazio non ha alcuna direzione privilegiata, ci fornisce i mezzi necessari per trovare le matrici relative a rotazioni arbitrarie. La soluzione è unica. Cominciamo con la trasformazione corrispondente a una rotazione intorno all’asse z. Supponiamo di avere due apparecchi S e T posti in serie lungo una retta con gli assi paralleli e diretti normalmente alla pagina, come nella FIGURA 6.4a. Immaginiamo l’asse z in questa direzione. Se il fascio si dirige verso l’alto (in direzione +z) nell’apparecchio S, certamente si comporta nello stesso modo in T. Analogamente, se si muove verso il basso in S, si muove verso il basso in T. Ma poniamo che il filtro T sia ruotato di un certo angolo, pur mantenendo il suo asse parallelo a quello di S, come in FIGURA 6.4b. Voi direte, seguendo l’intuizione, che un fascio (+) in S continuerà a essere (+) anche in T, perché il campo e il suo gradiente sono ancora nella stessa direzione fisica. E questo è giustissimo. Così pure, un fascio ( ) in S sarà ancora ( ) in T. Lo stesso vale per ogni orientazione di T nel piano xy di S. Per quanto riguarda la relazione tra C+0 = h+T | i
C0 = h T | i
C+ = h+S | i
C =h S| i
e cosa ci dice tutto ciò? Si potrebbe concludere che ogni rotazione intorno all’asse z del «sistema di riferimento» degli stati di base lasci le ampiezze inalterate, o «su» o «giù», come prima. Potremmo scrivere C+0 = C+ e C 0 = C , ma sarebbe sbagliato. Tutto ciò che si può concludere è che per tali rotazioni le probabilità relative al fascio superiore sono le stesse per gli apparecchi S e T. Ovvero |C+0 | = |C+ | e |C 0 | = |C |
Non possiamo affermare che le fasi delle ampiezze relative a T siano uguali per le due orientazioni in FIGURA 6.4a e 6.4b. I due apparecchi in FIGURA 6.4a e 6.4b sono, in effetti, differenti come si può appurare con il seguente ragionamento. Immaginiamo di porre un apparecchio che produca uno stato puro (+x) proprio all’entrata di S. (Nella figura l’asse x è diretto verso il basso.) Queste particelle si divideranno in S nei due fasci (+z) e ( z), i quali poi si ricombineranno in uno stato (+x) in P1 , all’uscita da S. La stessa cosa avviene poi in T. Se a T facciamo seguire un terzo apparecchio U, con l’asse nella direzione (+x), allora tutte le particelle, come si vede nella FIGURA 6.5a, passeranno per il canale (+) di U. Passiamo ora a esaminare cosa accade se T e U sono ruotati simultaneamente di 90°, fino a portarli nella posizione di FIGURA 6.5b. Anche in questo caso l’apparecchio T restituisce all’uscita ciò che vi è entrato, e quindi le particelle che arrivano a U sono in uno stato (+x) rispetto a S. Ma, in questo caso, U seleziona lo stato (+y) rispetto a S. (Per simmetria, ci aspettiamo che solo metà delle particelle lo attraversino.) Cosa ci può essere di diverso? Gli apparecchi T e U sono ancora nella stessa relazione fisica di prima. Può cambiare la fisica solo perché T e U sono orientati diversamente? Secondo la nostra ipotesi originale non dovrebbe esserne modificata. Evidentemente, le ampiezze relative a
78
Capitolo 6 • Spin un mezzo
© 978-8808-22107-0
(+?)
U
y
y
x
x
T
y' x'
(+x)
(+x)
P1
(+x) P1
S
T
U
S
(a)
FIGURA
6.5
(b)
Una particella in uno stato (+x) si comporta differentemente in (a) e in (b).
T saranno differenti nei due casi della FIGURA 6.5, e, conseguentemente, anche della FIGURA 6.4. In qualche modo, la particella si dovrà rendere conto d’avere girato l’angolo in P1 . Come ce ne accorgiamo? Orbene, tutto quello che abbiamo potuto stabilire è che i moduli di C+0 e C+ devono essere uguali nei due casi, ma possono, anzi in realtà devono, avere fasi diverse. Ne concludiamo che C+0 e C+ sono legati dalla relazione C+0 = ei C+ e, analogamente, C 0 e C sono legati dalla relazione C 0 = eiµ C dove e µ sono numeri reali che in qualche modo dipendono dall’angolo tra S e T. La sola cosa che possiamo dire subito di e µ è che non possono essere uguali (tranne nel caso particolare della FIGURA 6.5a, in cui T è orientato come S). Abbiamo infatti visto che modificare tutte le ampiezze per una stessa fase non porta ad alcuna conseguenza fisica. Per la stessa ragione, possiamo aggiungere sia a sia a µ la stessa quantità senza cambiare nulla. Perciò, siamo liberi di scegliere e µ uguali a più e meno lo stesso numero. Cioè, possiamo sempre prendere 0
+µ 2 +µ 2
=
µ0 = µ In tal caso 0
=
2
µ = µ0 2
(1) . Siamo con ciò giunti al risultato generale che Adottiamo, dunque, la convenzione che µ = la trasformazione, corrispondente a una rotazione intorno all’asse z del sistema di riferimento, è
C+0 = e+i C+ C0 = e
i
(6.16)
C
I moduli sono uguali e la differenza sta solo nelle fasi. A questi fattori di fase va ascritta la diversità dei risultati nei due esperimenti di FIGURA 6.5. (1) In altri termini, non facciamo altro che porre la trasformazione nella sua «forma standard», descritta nel paragrafo 6.2, secondo l’equazione (6.15).
6.3 • Rotazioni intorno all’asse z
© 978-8808-22107-0
Vogliamo ora ricavare la relazione che collega all’angolo tra S e T. Già conosciamo la risposta in un caso particolare. Se l’angolo è zero, anche lo è. Ammettiamo allora, come sembra ragionevole, che lo sfasamento sia una funzione continua dell’angolo tra S e T (FIGURA 6.4) per che tende a zero. In altre parole, se ruotiamo T di un piccolo angolo ✏ a partire dalla direttrice di S, anche sarà una quantità piccola, diciamo m✏, dove m è un certo numero. Scriviamo in questa forma perché possiamo dimostrare che deve essere proporzionale a ✏. Supponiamo infatti di collocare dopo T un altro apparecchio T 0 che forma un angolo ✏ con T, e, di conseguenza, un angolo 2✏ con S. Quindi, rispetto a T si ha C+0 = ei C+ e rispetto a T 0 si ha
C+00 = ei C+0 = ei2 C+
Ma sappiamo che si deve ottenere lo stesso risultato collocando T 0 subito dopo S. Ne segue che quando raddoppia l’angolo, raddoppia anche lo sfasamento. Possiamo estendere il ragionamento e costruire tutte le rotazioni possibili come una successione di rotazioni infinitesime. Se ne deduce che, per ogni angolo , è proporzionale all’angolo. Dunque, si può scrivere che = m . Abbiamo così ottenuto la regola generale che per una rotazione intorno all’asse z, di un angolo , di T rispetto a S, si ha C+0 = eim C+ (6.17) C 0 = e im C Per quanto riguarda l’angolo , e tutte le rotazioni di cui parleremo in futuro, adottiamo la normale convenzione che una rotazione va considerata positiva se è destrogira rispetto alla direzione positiva dell’asse di riferimento. Un angolo è positivo se la rotazione avviene nel senso di una vite destrogira che avanza nel verso dell’asse z positivo. Dobbiamo ora determinare il valore di m. Il primo ragionamento che si può tentare è questo: supponiamo di ruotare T di 360°; con ciò, com’è chiaro, si torna semplicemente a zero gradi, e dovremmo avere C+0 = C+ e C 0 = C , ovvero, ciò che è la stessa cosa, eim2⇡ = 1. E si ricava m = 1. Ma questo ragionamento è sbagliato! Per accorgersene, consideriamo una rotazione di T di 180°. Se m = 1, si ottiene: C+0 = ei⇡ C+ = C+ C0 = e
i⇡
C = C
Ma questo è ancora lo stato originale. Moltiplicare ambedue le ampiezze per 1 riporta semplicemente al sistema fisico iniziale. (È ancora il caso di un fattore comune di fase.) Ne conseguirebbe che se in FIGURA 6.5b si aumentasse l’angolo tra T e S fino a 180°, il sistema (per quanto riguarda T) sarebbe indistinguibile dalla situazione a zero gradi, e le particelle dovrebbero ancora passare per lo stato (+) dell’apparecchio U. Invece a 180° lo stato (+) di U coincide con lo stato ( x) dell’apparecchio S di partenza. Quindi uno stato (+x) diventerebbe uno stato ( x). Ma, poiché non abbiamo fatto nulla per modificare lo stato originale, la risposta è sbagliata. Non è vero che m = 1. Bisogna fare in modo che solo una rotazione di 360° e non di un angolo minore riproduca lo stesso stato fisico. Questo accade se m = 1/2. In questo caso, e solo in questo, il primo angolo che riproduce la stessa situazione fisica è = 360° (2) . E si ottiene > C+0 = C+ 9 > > > = 360° intorno all’asse z > > 0 > C = C > ;
(6.18)
È piuttosto curioso che ruotando l’apparecchio di 360° si trovino ampiezze diverse. In realtà, non sono del tutto diverse, perché un cambiamento simultaneo di segno non modifica la fisica. Se (2) Come si vede anche m = 1/2 andrebbe bene. Ma la (6.17) mostra che un cambiamento di segno non produce altro effetto che una ridefinizione della notazione per la particella di spin «su».
79
80
Capitolo 6 • Spin un mezzo
© 978-8808-22107-0
qualcuno avesse deciso di cambiare di segno tutte le ampiezze per tener conto di aver girato di 360°, tutto ciò filerebbe liscio lo stesso, perché si otterrebbe la stessa fisica(3) . Per concludere, il nostro risultato finale è che, se conosciamo le ampiezze C+ e C per particelle di spin un mezzo rispetto a un sistema di riferimento S, e passiamo poi a un sistema di base riferito a T, che si ottiene da S con una rotazione intorno all’asse z di un angolo , le nuove ampiezze risultano, in termini delle vecchie, legate dalla relazione C+0 = ei 0
C =e
6.4
i
> C+ 9 > > > = > > > /2 C > ; /2
intorno all’asse z
(6.19)
Rotazioni di 180° e di 90° intorno all’asse y
Ci proponiamo ora di ricavare la trasformazione corrispondente a una rotazione di T rispetto a S di 180° intorno a un asse perpendicolare all’asse z, per esempio l’asse y. (Abbiamo definito in FIGURA 6.1 gli assi coordinati.) In altre parole, partiamo con due apparecchi identici di Stern-Gerlach, di S T cui il secondo, T, è completamente «ribaltato» rispetto al primo, S, come in FIGURA 6.6. Se pensiamo alle nostre particelle come dei piccoli dipoli z magnetici, una particella nello stato (+S), tale quindi che passa «di sopra» y nel primo apparecchio, passerà ancora «di sopra» nel secondo, e andrà allora a finire nello stato meno rispetto a T. (Nell’apparato T rovesciato, FIGURA 6.6 Una rotazione di 180° intorno all’asse y. sia il gradiente sia il campo cambiano verso, cosicché la forza che agisce su una particella con il momento magnetico in una data direzione rimane invariata.) Ciò che è «più» rispetto a S è sempre «meno» rispetto a T. Perciò sappiamo che per queste posizioni relative di S e T la trasformazione deve dare |C+0 | = |C | |C 0 | = |C+ | Come nel caso precedente, non possiamo escludere la presenza di fattori di fase addizionali; quindi (per una rotazione di 180° intorno all’asse y) avremo C+0 = ei C C 0 = ei C+
(6.20)
dove e sono ancora da determinare. Cosa possiamo dire per una rotazione di 360° intorno all’asse y? Ebbene, noi già conosciamo la risposta per una rotazione di 360° intorno all’asse z: le ampiezze relative al passaggio in uno stato qualsiasi cambiano tutte di segno. Una rotazione di 360° intorno a un qualsiasi asse riporta sempre alla posizione di partenza. Il risultato di una qualsiasi rotazione di 360° deve essere il medesimo che per la rotazione di 360° intorno all’asse z, cioè che tutte le ampiezze cambiano di segno. Immaginiamo allora di eseguire due successive rotazioni di 180° intorno all’asse y; applicando l’equazione (6.20), dovremmo arrivare al risultato dell’equazione (6.18). In altre parole, si ha: C+00 = ei C 0 = ei ei C+ = C+ (6.21) C 00 = ei C+0 = ei ei C = C (3)
Così pure, se un sistema viene successivamente ruotato di tanti piccoli angoli, ritornando alla fine alla posizione originale, è possibile definire il concetto di rotazione di 360°, in contrapposizione alla rotazione di angolo nullo, se si tiene conto dell’intera storia del sistema. (Tuttavia, è interessante notare che ciò non è più vero per una rotazione di 720°.)
81
6.4 • Rotazioni di 180° e di 90° intorno all’asse y
© 978-8808-22107-0
Questo comporta che ei ei = 1
z
ossia ei = e
i x''
Quindi la trasformazione relativa a una rotazione di 180° intorno all’esse y può essere scritta come segue: C+0
180°
(a)
y
i
=e C
C0 = e
i
(6.22)
A y''
C+
x
I discorsi fatti fin qui si potrebbero applicare altrettanto bene a una rotazione di 180° intorno a un qualunque asse nel piano xy, per quanto, naturalmente, ad assi differenti corrispondono diversi valori di . Questa è l’unica possibile differenza. Anche se esiste una certa arbitrarietà sul valore di , una volta fissato quest’ultimo per un asse di rotazione nel piano xy, esso risulta determinato per tutti gli altri assi. Per convenzione si sceglie = 0 per una rotazione di 180° intorno all’asse y. Per giustificare questa scelta, supponiamo che non sia zero per la rotazione intorno all’asse y; si può allora mostrare che esiste un altro asse nel piano xy, per cui il corrispondente fattore di fase è zero. Ricaviamo il fattore di fase A per un asse A che formi un angolo ↵ con l’asse y, come si vede in FIGURA 6.7a. (Per chiarezza, la figura è disegnata con ↵ uguale a un numero negativo, ma questo non è essenziale.) Consideriamo poi un apparecchio T, inizialmente allineato con S, e successivamente ruotato di 180° intorno all’asse A; i suoi assi, che indicheremo con x 00, y 00 e z 00, si disporranno come nella FIGURA 6.7a. Le ampiezze relative a T saranno allora C+00 = ei A C (6.23) C 00 = e i A C+ Possiamo pensare di ottenere la stessa orientazione finale attraverso due successive rotazioni, come si vede nelle FIGURE 6.7b e 6.7c. Dapprima, immaginiamo un apparecchio U ruotato rispetto a S di 180° intorno all’asse y. Gli assi x 0, y 0 e z 0 di U saranno orientati come in FIGURA 6.7b, e le ampiezze relative a U si otterranno dalla (6.22). Notiamo ora che possiamo passare da U a T mediante una rotazione intorno all’«asse z» di U, cioè intorno a z 0, come si vede in FIGURA 6.7c. Dalla figura si deduce che l’angolo richiesto è uguale al doppio di ↵ ma in senso opposto (rispetto a z 0 ). Usando la trasformazione della (6.19) con = 2↵, si ricava C+00 = e i↵ C+0 (6.24) C 00 = e+i↵ C 0 Mettendo insieme la (6.24) e la (6.22) si ottiene C+00 = ei( C 00 = e
↵) i(
z''
z
x'
y
x
z'
z
x''
(c) 2
y
y''
x
z''
6.7 Una rotazione di 180° intorno all’asse A è equivalente a una rotazione di 180° intorno a y seguita da una rotazione intorno a z0 . FIGURA
C ↵)
y'
180°
(b)
(6.25) C+
Queste ampiezze devono, ovviamente, essere uguali a quelle della (6.23). Quindi legato ad ↵ e dalla relazione ↵ A =
A
deve essere (6.26)
Questo implica che se l’angolo ↵ tra gli assi A e y (di S) è uguale a , la trasformazione relativa a una rotazione di 180° intorno ad A corrisponderà a A = 0.
82
Capitolo 6 • Spin un mezzo
© 978-8808-22107-0
Dato che, comunque, esiste un qualche asse perpendicolare a z per il quale = 0, possiamo benissimo prendere questo come asse y. È semplicemente una questione di convenzione, e adottiamo quella di uso generale. Risultato: per una rotazione di 180° intorno all’asse y, si ha > C+0 = C 9 > > > = 180° intorno all’asse y (6.27) > > 0 > C = C+ > ;
Dal momento che ci troviamo a parlare dell’asse y, chiediamoci quale sia la matrice di trasformazione che corrisponde a una rotazione di 90° intorno a questo asse. La possiamo determinare perché una doppia rotazione di 90° intorno allo stesso asse è equivalente a una di 180°. Cominciamo con lo scrivere la trasformazione relativa a 90° nella sua forma più generale: C+0 = aC+ + bC
(6.28)
C 0 = cC+ + dC
Una seconda rotazione di 90° intorno allo stesso asse dovrà corrispondere agli stessi coefficienti: C+00 = aC+0 + bC 0
(6.29)
C 00 = cC+0 + dC 0 Combinando la (6.28) con la (6.29), otteniamo C+00 = a (aC+ + bC ) + b (cC+ + dC )
(6.30)
C 00 = c (aC+ + bC ) + d (cC+ + dC ) Ma dalla (6.27) sappiamo che C+00 = C C 00 = C+ da cui si ricava ab + bd = 1 a2 + bc = 0 ac + cd = 1
(6.31)
bc + d 2 = 0 Queste quattro equazioni sono sufficienti a determinare tutte le incognite a, b, c e d. Il che non è difficile. Prendete la seconda e la quarta equazione. Se ne deduce che a2 = d 2 , il che significa o che a = d, oppure che a = d. Ma quest’ultima alternativa è esclusa, altrimenti la prima equazione non sarebbe verificata. Quindi d = a. Sfruttando questa uguaglianza, si ha immediatamente che b = 1/2a e che c = 1/2a. A questo punto abbiamo tutto in funzione di a. Esprimendo, per esempio, la seconda equazione tramite a, si ottiene a2
1 =0 4a2
ossia
a4 =
1 4
Questa equazione ha quattro possibili soluzioni, mapsolo due di esse danno il valore standard del determinante. Possiamo benissimo prendere a = 1/ 2; allora(4) 1 a= p 2 (4)
1 b= p 2
c=
1 p 2
1 d=p 2
L’altra soluzione si ottiene cambiando tutti i segni di a, b, c e d, e corrisponde a una rotazione di 270°.
83
6.5 • Rotazioni intorno all’asse x
© 978-8808-22107-0
In altri termini, per due apparecchi S e T, con T ruotato rispetto a S di 90° intorno all’asse y, la trasformazione è 1 9 > C+0 = p (C+ + C ) > > > > > 2 > > = 90° intorno all’asse y (6.32) > > > > 1 > C 0 = p ( C+ + C ) > > > 2 ;
Volendo, possiamo risolvere queste equazioni e determinare C+ e C , ottenendo così la trasformazione relativa a una rotazione di meno 90° intorno a y. Scambiando le ampiezze con l’apice, concludiamo che 9 > C )> > > > > > > = 90° intorno all’asse y > > > > 1 0 > C = p (C+ + C ) > > > 2 ; 1 C+0 = p (C+ 2
z
(6.33) 90°
y
(a)
y' x
6.5
z'
Rotazioni intorno all’asse x
x'
Voi forse a questo punto penserete: «Qui si rischia di cadere nel ridicolo. Tra poco studieranno il caso di 47° intorno a y, poi 33° intorno a x, e via discorrendo, all’infinito!». Invece no, abbiamo quasi finito. Infatti, a partire dalle sole trasformazioni che già conosciamo, cioè quelle corrispondenti a rotazioni di 90° intorno a y e di un angolo arbitrario intorno a z (caso questo che, come ricorderete, abbiamo trattato per primo), possiamo generare tutte le rotazioni possibili. Per esempio, prendete una rotazione di un angolo ↵ intorno all’asse x. Sappiamo trattare il caso di un angolo ↵ intorno a z, mentre ora vogliamo ruotare intorno a x. Come si fa? Per prima cosa si porta l’asse z a coincidere con x, il che comporta una rotazione di +90° intorno a y, come mostra la 0 FIGURA 6.8. Poi ruotiamo di un angolo ↵ intorno a z . Infine facciamo 00 una rotazione di 90° intorno a y . Il risultato complessivo di queste tre operazioni è lo stesso che una rotazione di un angolo ↵ intorno a x. È una semplice proprietà spaziale. (È difficile vedere intuitivamente queste combinazioni di rotazioni e il loro effetto. Sembra strano, dal momento che viviamo in uno spazio a tre dimensioni, che ci risulti difficile immaginare che cosa succede se giriamo prima così e poi ancora in un altro modo. Forse, capiremmo queste cose molto meglio se fossimo pesci o uccelli e avessimo un’esperienza reale di ciò che si prova quando si fanno capriole per aria.) In ogni modo, ricaviamo la trasformazione per una rotazione di ↵ intorno all’asse x, sfruttando quelle già note. Nella prima rotazione di +90° intorno a y, le ampiezze si trasformano secondo l’equazione (6.32). Se indichiamo con x 0, y 0 e z 0 gli assi ruotati, la successiva rotazione di un angolo ↵ intorno a z 0 ci porta in un riferimento x 00, y 00 e z 00, per il quale si ha C+00 = ei↵/2 C+0 C 00 = e
i↵/2
C0
z
y'' (b) y x z''
x''
z'''
z
y''' –90° (c) y x x'''
6.8 Una rotazione di α intorno all’asse x è equivalente a: (a) una rotazione di +90° intorno a y, seguita da (b) una rotazione di α intorno a z0 , seguita da (c) una rotazione di 90° intorno a y 00 . FIGURA
84
Capitolo 6 • Spin un mezzo
© 978-8808-22107-0
Infine l’ultima rotazione di 90° intorno a y 00 ci conduce a x 000, y 000 e z 000 ; dalla (6.33) si ha 1 C+000 = p C+00 C 00 2 1 C 000 = p C+00 + C 00 2 Combinando queste ultime due trasformazioni, ricaviamo ⌘ 1 ⇣ C+000 = p e+i↵/2 C+0 e i↵/2 C 0 2 ⌘ 1 ⇣ C 000 = p e+i↵/2 C+0 + e i↵/2 C 0 2
Da ultimo, sfruttando le equazioni (6.32) per C+0 e C 0 , otteniamo la trasformazione complessiva: ) 1 ( +i↵/2 e (C+ + C ) e i↵/2 ( C+ + C ) C+000 = 2 ) 1 ( +i↵/2 C 000 = e (C+ + C ) + e i↵/2 ( C+ + C ) 2 Possiamo riscrivere queste relazioni in una forma più semplice, ricordando che
Si ottiene
ei✓ + e
i✓
= 2 cos ✓
ei✓
i✓
= 2i sen ✓
e
✓ ↵◆ ↵◆ 9 > C+ + i sen C > = cos > > > 2 2 > > = ↵ intorno a x (6.34) ✓ ◆ ✓ ◆ > > > ↵ ↵ > > C 000 = i sen C+ + cos C > > 2 2 ; Questa è la trasformazione che cercavamo, relativa a una rotazione di un qualsiasi angolo ↵ intorno all’asse x. È solo un po’ più complicata delle altre. C+000
6.6
✓
Rotazioni arbitrarie
Trattiamo ora il caso di una rotazione qualsiasi. Notiamo, anzitutto, che una qualsiasi orientazione relativa di sistemi coordinati può essere individuata mediante tre angoli, come si vede in 0 0 0 FIGURA 6.9. Se abbiamo un sistema di assi x , y e z orientato comunque rispetto a x, y e z, possiamo descrivere la relazione tra i due riferimenti per mezzo dei tre angoli di Eulero ↵, e , i quali definiscono tre successive rotazioni che portano il riferimento x, y e z a coincidere con il riferimento x 0, y 0 e z 0. Partendo da x, y e z, ruotiamo il nostro sistema di un angolo intorno all’asse z, portando l’asse x lungo la direzione x 1 . Poi, ruotiamo di ↵ intorno a questo asse x provvisorio, fino a far coincidere z con z 0. Infine, una rotazione intorno al nuovo asse z (cioè z 0) di un angolo porterà l’asse x in x 0 e l’asse y in y 0(5) . Conosciamo le trasformazioni che corrispondono a ciascuna di queste rotazioni; sono quelle delle (6.19) e (6.34). Combinandole nell’ordine giusto, si ottiene ↵ ↵ C+0 = cos ei( + )/2 C+ + i sen e i( )/2 C 2 2 (6.35) ↵ i( )/2 ↵ i( + )/2 0 C = i sen e C+ + cos e C 2 2 (5)
Con un po’ di lavoro, si può mostrare che il riferimento x, y e z viene a sovrapporsi al sistema x 0 , y0 e z 0 con le seguenti tre rotazioni intorno agli assi di partenza: (1) ruotare di un angolo intorno all’asse z originale; (2) ruotare intorno all’asse x originale di un angolo ↵; (3) ruotare di un angolo intorno all’asse z di partenza.
85
6.6 • Rotazioni arbitrarie
© 978-8808-22107-0
6.9 L’orientazione di un qualsiasi sistema di coordinate x 0 , y 0 e z0 rispetto a un altro sistema x, y e z, può essere definita per mezzo degli angoli di Eulero, α, β e γ. FIGURA
z y'
z
A
z'
6.10 Un asse A definito dagli angoli polari ✓e . FIGURA
y x' x x1
O y
B
x
Quindi, partendo solo da alcune ipotesi concernenti le proprietà dello spazio, siamo arrivati alle ampiezze di trasformazione per un’arbitraria rotazione. Questo significa che se conosciamo le ampiezze relative al passagio di una particella di spin un mezzo da uno stato iniziale qualsiasi a uno qualunque dei due fasci di un apparecchio S di Stern-Gerlach, i cui assi sono x, y e z, possiamo poi calcolare quale frazione di tali particelle va a finire nei due fasci di un apparecchio T con assi x 0, y 0 e z 0. In altre parole, se abbiamo una particella di spin un mezzo in uno stato , le cui ampiezze relative agli stati «più» e «meno» rispetto all’asse z di un riferimento x, y e z, sono C+ = h+ | i e C = h | i, possiamo anche ricavare le ampiezze C+0 e C 0 relative agli stati «più» e «meno» rispetto all’asse z 0 di un qualsiasi altro riferimento x 0, y 0 e z 0. I quattro coefficienti dell’equazione (6.35) sono gli elementi della «matrice di trasformazione» con i quali siamo in grado di proiettare le ampiezze di una particella di spin un mezzo in un qualsiasi altro sistema di coordinate. Discuteremo ora qualche esempio per farvi vedere come si applica tutto ciò. Consideriamo questo semplice problema. Inviamo un atomo di spin un mezzo attraverso un apparecchio di Stern-Gerlach che lascia passare solo lo stato (+z). Quale sarà l’ampiezza di trovare l’atomo nello stato (+x)? L’asse +x coincide con l’asse +z 0 di un sistema ruotato di 90° intorno all’asse y. Quindi, la cosa più semplice, in questo caso, è partire dalle equazioni (6.32), per quanto si potrebbero ovviamente usare le equazioni generali (6.35). Poiché C+ = 1 e C = 0, si ricava p che C+0 = 1/ 2. Le probabilità si ottengono come moduli quadrati di queste ampiezze; si ha quindi una probabilità del 50% che la particella attraversi un filtro che seleziona lo stato p (+x). Se ci fossimo posti lo stesso problema per lo stato ( x), l’ampiezza sarebbe stata 1/ 2, che corrisponde anch’essa a una probabilità 1/2, come ci si aspetta dalla simmetria dello spazio. Quindi, se una particella si trova nello stato (+z), è ugualmente probabile che passi in uno stato (+x) o ( x), ma con fasi opposte. D’altra parte non ci sono preferenze neppure per quanto riguarda l’asse y. Una particella inizialmente nello stato (+z) ha 50 probabilità su 100 di finire nello stato (+y) o ( y). Però, in questo p casop(applicando la formula per la rotazione di 90° intorno a x), le ampiezze risultano 1/ 2 e i/ 2. Le ampiezze sono sfasate di 90° anziché di 180°, come succedeva per (+x) e ( x). È in questo modo che appare la differenza tra x e y. Come ultimo esempio, consideriamo una particella di spin un mezzo di cui supponiamo di sapere che si trova in uno stato polarizzato nel verso «su» in direzione di un certo asse A, definito dagli angoli ✓ e in FIGURA 6.10. Vogliamo calcolare l’ampiezza C+ che la particella sia «su» lungo z e l’ampiezza C che sia «giù» lungo z. Possiamo determinare queste ampiezze immaginando che A sia l’asse z di un riferimento con l’asse x in una direzione non specificata, per esempio nel piano formato da A e z. Possiamo portare il riferimento di A a coincidere con x, y e z con tre successive rotazioni. Dapprima, ruotiamo di ⇡/2 intorno all’asse A, con ciò portando l’asse x lungo la retta B in figura. Quindi, ruotiamo di ✓ intorno alla direzione di B (il nuovo asse
86
Capitolo 6 • Spin un mezzo
© 978-8808-22107-0
x del riferimento cui appartiene A) fino a far coincidere A con l’asse z. Infine, ruotiamo di un angolo ⇡/2 intorno a z. Ricordando che lo stato di partenza è (+) rispetto ad A, si ottiene ✓ i e 2 ✓ C = sen e+i 2 C+ = cos
/2
(6.36) /2
Da ultimo, vogliamo riassumere i risultati di questo capitolo in una forma che ci sarà utile in seguito. In primo luogo, vi facciamo notare che il nostro risultato principale nelle equazioni (6.35) può essere riformulato con un’altra notazione. Osservate che le equazioni (6.35) e le equazioni (6.4) dicono esattamente la stessa cosa. Infatti, i coefficienti di C+ = h+S | i e C = h S | i nelle equazioni (6.35) non sono altro che le ampiezze h jT | iSi dell’equazione (6.4), cioè le ampiezze che una particella nello stato i rispetto a S si porti nello stato j rispetto a T (quando l’orientazione relativa di T e S è definita in termini degli angoli ↵, e ). In un’altra occasione, le abbiamo indicate con RTjiS , nell’equazione (6.6). (Abbiamo introdotto una caterva di notazioni!) Per esempio, RT+S = h T | +Si è il coefficiente di C+ nella formula per C 0 , ovvero i sen
↵ i( e 2
)/2
Possiamo, allora, riassumere i risultati in una tabella, che è appunto la TABELLA 6.1. In seguito sarà comodo, in qualche caso, avere queste ampiezze specializzate a qualche particolare situazione semplice. Indichiamo con Rz ( ) una rotazione di angolo intorno all’asse z. Con lo stesso simbolo ci riferiremo anche alla corrispondente matrice di rotazione (omettendo gli indici i e j, che sono sottintesi). Analogamente, Rx ( ) e Ry ( ) indicheranno una rotazione di angolo intorno, rispettivamente, all’asse x e all’asse y. Nella TABELLA 6.2 sono riportate le matrici – cioè il quadro delle ampiezze h jT | iSi – che proiettano le ampiezze dal riferimento S al riferimento T, ottenuto da S mediante la rotazione specificata.
6.1 Ampiezze h jT | iS i per una rotazione definitiva dagli angoli di Eulero α, β e γ di FIGURA 6.9. TABELLA
TABELLA
6.2
dell’angolo
Ampiezze h jT | iS i per una rotazione R( ) intorno all’asse x o y o z.
R ji (↵, , ) h jT | iSi +T T
Rz ( ) S
+S cos
↵ i( + )/2 e 2
↵ i sen ei( 2
)/2
i sen
↵ i( e 2
)/2
h jT | iSi
+S
+T
ei /2
0
0
e i /2
T
↵ cos e i( + )/2 2
S
Rx ( ) h jT | iSi
+S
+T
cos /2
i sen /2
T
i sen /2
cos /2
S
Ry ( ) h jT | iSi
+S
+T
cos /2
T
sen /2
S sen /2 cos /2
La dipendenza delle ampiezze dal tempo
7.1
7
Atomi in quiete. Stati stazionari
Vogliamo ora dire qualche cosa sull’andamento nel tempo delle ampiezze di probabilità. Il «qualche cosa» è motivato dal fatto che in realtà la dipendenza dal tempo è necessariamente legata alla dipendenza spaziale. Quindi, se si vogliono fare le cose correttamente e in dettaglio, si finisce immediatamente nella più complessa delle situazioni. Ci troviamo a ogni momento di fronte alla difficoltà di dover scegliere tra discutere un dato argomento in modo del tutto astratto, ma logicamente rigoroso, oppure far qualcosa che non è per niente rigorosa, ma che ci dà una certa idea della reale situazione, rimandando a tempi successivi una trattazione più precisa. Per quanto riguarda la dipendenza dall’energia, prenderemo la seconda strada. Enunceremo un certo numero di fatti. Non cercheremo di essere rigorosi, ma solo di raccontarvi quello che si è scoperto, in modo da darvi una certa idea intuitiva della dipendenza delle ampiezze in funzione del tempo. Man mano che si andrà avanti, la descrizione si farà più precisa; perciò non vi innervosite se vi sembrerà che tiriamo fuori le cose dal nulla. Naturalmente, questo nulla da cui vengono fuori è il nulla dell’esperienza e dell’immaginazione degli uomini. Ma ci vorrebbe troppo tempo per ripercorrere lo sviluppo storico, e quindi, dobbiamo partire da un certo punto. Potremmo partire da concetti astratti e dedurre tutto quanto, ma voi finireste per non afferrare niente, oppure potremmo partire da un gran numero di esperimenti con cui giustificare ogni affermazione. Noi sceglieremo una via di mezzo tra le due. Un elettrone da solo nello spazio vuoto può, in certe condizioni, avere una data energia definita. Se, per esempio, sta fermo (e quindi, non ha velocità di traslazione, impulso, energia cinetica) ha la sua energia a riposo. Un oggetto più complicato, come un atomo, può anch’esso avere un’energia definita quando sta fermo, ma può anche essere eccitato internamente in un altro livello d’energia. (Più avanti, descriveremo il meccanismo di questo fenomeno.) Spesso si può considerare un atomo in uno stato eccitato come dotato di un’energia definita, ma in realtà ciò è vero solo approssimativamente. Un atomo non rimane per sempre eccitato perché riesce a scaricare la sua energia interagendo con il campo elettromagnetico. Quindi si ha una certa ampiezza di probabilità che si generi un nuovo stato, con l’atomo in uno stato d’eccitazione più basso, e il campo elettromagnetico in uno più alto. L’energia totale del sistema è la stessa prima e dopo, ma l’energia dell’atomo è diminuita. Pertanto non è esatto dire che un atomo eccitato ha un’energia definita; ma sarà spesso conveniente e non troppo sbagliato dire che ce l’ha. (Tra l’altro, perché il fenomeno va in un verso e non nell’altro? Perché un atomo irradia luce? La risposta ha a che fare con l’entropia. Quando l’energia è localizzata nel campo elettromagnetico, essa ha tanti modi differenti di essere e tanti posti diversi dove andare a finire, cosicché se si cercano le condizioni di equilibrio, si trova che il caso più probabile è che il campo sia eccitato con un fotone mentre l’atomo si diseccita. Ci vuole un tempo lunghissimo prima che il fotone torni indietro e si trovi nuovamente in condizione di sbattere sull’atomo. È del tutto analogo al problema classico: perché una carica accelerata irradia? Non è che «vuole» perdere energia, perché, in realtà, quando irradia, l’energia dell’universo rimane la stessa di prima. La radiazione e l’assorbimento procedono nella direzione dell’entropia crescente.) Anche i nuclei possono esistere in differenti livelli energetici e, nell’approssimazione in cui si trascurino gli effetti elettromagnetici, si può affermare che un nucleo inizialmente in
Ripasso: vol. 1, cap. 17, Spazio-tempo cap. 48, Battimenti
88
Capitolo 7 • La dipendenza delle ampiezze dal tempo
© 978-8808-22107-0
uno stato eccitato vi rimane. Anche se sappiamo che non ci resta indefinitamente, è spesso conveniente partire da un’approssimazione che è piuttosto un’idealizzazione, ma sulla quale è più facile ragionare. Inoltre, sotto certe condizioni, è spesso un’approssimazione legittima. (Quando abbiamo introdotto per la prima volta le leggi classiche della caduta dei corpi, non abbiamo considerato l’attrito, anche se non si ha quasi mai una situazione in cui non sia presente un certo attrito.) Poi, nel mondo subnucleare, ci sono le «particelle strane», che hanno masse diverse. Ma le più pesanti si disintegrano in altre particelle leggere, e quindi di nuovo non è esatto dire che hanno un’energia definita con precisione. Ciò sarebbe vero solo se fossero stabili. Perciò, quando facciamo l’approssimazione che la loro energia sia ben definita, ci dimentichiamo del fatto che esse stanno per esplodere. Per il momento, allora, intenzionalmente ci dimenticheremo di tali processi e solo più tardi impareremo a tenerne conto. Supponiamo di avere un atomo, un elettrone, o una particella qualunque, che a riposo ha un’energia definita E0 . Per l’energia E0 intendiamo la massa dell’intero oggetto per c2 . Questa massa include ogni tipo di energia interna; così un atomo eccitato ha una massa che differisce da quella dello stesso atomo nello stato fondamentale. (Per stato fondamentale si intende lo stato di più bassa energia.) Chiameremo E0 «energia a riposo». Per un atomo in quiete, l’ampiezza quantistica relativa alla rivelazione dell’atomo in un punto è la stessa ovunque; non dipende dalla posizione. Questo significa, naturalmente, che la probabilità di trovare l’atomo è la stessa in tutti i punti. Ma significa anche di più. La probabilità potrebbe benissimo essere indipendente dalla posizione, ma la fase dell’ampiezza potrebbe variare da punto a punto. Invece, per una particella a riposo, l’intera ampiezza è uguale in ogni punto. Essa dipende, però, dal tempo. Per una particella in uno stato d’energia definita E0 , l’ampiezza di trovare la particella stessa in (x, y, z) al tempo t è ae
i(E0 /~)t
(7.1)
dove a indica una certa costante. L’ampiezza per la particella in un punto qualsiasi dello spazio è la stessa per tutti i punti, ma dipende dal tempo secondo la (7.1). Ammetteremo semplicemente che questa regola sia vera. Naturalmente, potremo anche scrivere la (7.1) nella forma ae con
i!t
(7.2)
~! = E0 = Mc2
dove M è la massa a riposo dello stato atomico o della particella. Ci sono tre modi differenti di specificare l’energia: per mezzo della frequenza di un’ampiezza, oppure dando l’energia in senso classico, oppure ancora dando la massa inerziale. Tutti questi modi sono equivalenti; non sono altro che maniere diverse di dire la stessa cosa. Voi forse starete pensando che è un po’ difficile immaginare una «particella» che ha un’uguale ampiezza di probabilità di essere trovata in un qualsiasi punto dello spazio. Dopotutto, ci si è abituati a raffigurare una «particella» come un piccolo oggetto ben localizzato «da qualche parte». Ma non bisogna dimenticare il principio d’indeterminazione. Se una particella ha una certa energia definita, anche il suo impulso è ben definito. Se è nulla l’incertezza sull’impulso, la relazione d’indeterminazione, p x = ~, ci dice che l’incertezza sulla posizione deve essere infinita, il che è quanto dire che si ha un’uguale ampiezza di probabilità di trovare la particella in un punto qualsiasi dello spazio. Se le parti che compongono l’atomo internamente sono in stati differenti con diverse energie totali, allora la variazione dell’ampiezza con il tempo avviene diversamente. Se non potete specificare in che stato esso si trova, vuol dire che ci sarà un’ampiezza che si trovi in un certo stato, e un’ampiezza che si trovi invece in un altro stato, e ciascuna di queste ampiezze avrà una differente frequenza. Ci sarà un’interferenza tra queste diverse componenti, come nel caso dei battimenti in acustica, la quale si manifesterà in una probabilità variabile. Qualche cosa starà «succedendo» all’interno dell’atomo, anche se esso è «a riposo», nel senso che il suo centro di
7.2 • Moto uniforme
© 978-8808-22107-0
massa non si muove. Tuttavia, se l’atomo possiede un’energia definita, la sua ampiezza è data dalla (7.1), e il modulo quadrato della sua ampiezza non dipende dal tempo. Voi capite allora che se un oggetto ha un’energia definita, si troverà una risposta indipendente dal tempo, per ogni questione di probabilità che lo riguardi. Per quanto le ampiezze varino col tempo, se l’energia è definita esse variano come un esponenziale immaginario, e quindi il loro modulo quadrato resta immutato. Questa è la ragione per la quale spesso si dice che un atomo in un livello d’energia definita si trova in uno stato stazionario. Se si compie una qualsiasi misura delle grandezze all’interno, si trova che niente (in probabilità) cambia col tempo. Perché le probabilità varino nel tempo, deve avvenire che ci sia un’interferenza tra due ampiezze a due diverse frequenze, e ciò significa che non si può sapere quale sia il valore dell’energia. L’oggetto avrà una certa ampiezza di trovarsi in uno stato a un’energia, e un’altra ampiezza di essere in uno stato a un’altra energia. Questa è la descrizione quantistica di un qualcosa il cui comportamento dipende dal tempo. Se si ha una «situazione» che è una sovrapposizione di due stati differenti con energie diverse, allora l’ampiezza per ciascuno dei due stati varia nel tempo secondo l’equazione (7.2), per esempio, come e i(E1 /~)t e e i(E2 /~)t (7.3) E se si ha una data sovrapposizione delle due, si otterrà un’interferenza. Ma notate che se aggiungiamo una costante a entrambe le energie, non cambia nulla. Se un altro usa una diversa scala di energia, nella quale tutte le energie sono aumentate (o diminuite) di una quantità costante, diciamo, della quantità A, allora le ampiezze nei due stati sarebbero dal suo punto di vista e
i(E1 +A)t/~
e
e
i(E2 +A)t/~
(7.4)
Tutte le ampiezze per lui sarebbero moltiplicate per lo stesso fattore e i(A/~)t e così pure, ogni combinazione lineare, o interferenza, verrebbe ad avere lo stesso fattore. E, quando si prendono i moduli quadrati per trovare le probabilità, tutte le risposte rimangono inalterate. La scelta dell’origine nella nostra scala di energie non fa alcuna differenza; possiamo misurare le energie a partire da uno zero arbitrario. Per motivi relativistici, è preferibile misurare le energie in modo da includere la massa a riposo, ma, per altre ragioni non connesse alla relatività, è spesso preferibile sottrarre una qualche quantità fissa da tutte le energie che compaiono. Per esempio, nel caso di un atomo, è di solito conveniente sottrarre l’energia Ms c2 , dove Ms è la massa complessiva di tutte le sue parti, il nucleo e gli elettroni, prese separatamente, la quale massa è naturalmente diversa dalla massa complessiva dell’atomo. In altri problemi, può essere utile sottrarre da tutte le energie la quantità Mf c2 , dove Mf è la massa dell’intero atomo nello stato fondamentale; in tal caso appare solo l’energia di eccitazione dell’atomo. Perciò, qualche volta sposteremo lo zero delle nostre energie di qualche costante molto grande, ma ciò non porterà nessuna differenza, purché si spostino della stessa costante tutte le energie che entrano in un particolare calcolo. E ciò basti per le particelle in quiete.
7.2
Moto uniforme
Se supponiamo che la teoria della relatività sia giusta, una particella in quiete in un sistema di riferimento inerziale può essere in moto uniforme rispetto a un altro sistema inerziale. Nel sistema a riposo della particella, l’ampiezza di probabilità è la stessa per ogni x, y e z, ma varia con t. La grandezza dell’ampiezza è la stessa per ogni t, ma la fase dipende da t. Possiamo un po’ raffigurarci l’andamento dell’ampiezza riportando in un grafico le linee di ugual fase, per esempio, le linee di fase zero, in funzione di x e di t. Per una particella ferma, queste linee di ugual fase sono parallele all’asse x e sono regolarmente distanziate nella direzione dell’asse t, come mostrano le linee tratteggiate in FIGURA 7.1. In un diverso sistema di riferimento, x 0, y 0, z 0 e t 0, in moto in direzione x, per esempio, rispetto alla particella, le coordinate x 0 e t 0 di un qualsiasi punto particolare dello spazio sono collegate a x e t dalla trasformazione di Lorentz. Questa trasformazione può essere rappresentata graficamente
89
90
Capitolo 7 • La dipendenza delle ampiezze dal tempo
t
© 978-8808-22107-0
disegnando gli assi x 0 e t 0, come si è fatto in FIGURA 7.1 (vedi cap. 17, vol. 1, FIGURA 17.2.) Come vedete, nel sistema x 0-t 0, i punti corrispondenti alle varie linee a fase(1) uguale hanno distanze differenti da prima lungo l’asse t 0, di modo che la frequenza delle variazioni nel tempo è diversa. C’è anche una dipendenza della fase da x 0; quindi l’ampiezza di probabilità deve essere una funzione di x 0. Per una trasformazione di Lorentz con velocità v lungo, per esempio, la direzione negativa dell’asse x, il tempo t è legato al tempo t 0 dalla relazione
t'
t0 t=r
x'
7.1 Trasformazione relativistica dell’ampiezza di una particella in quiete nel sistema x-t. FIGURA
x 0v c2 v2 1 c2
quindi la nostra ampiezza ora varia secondo la legge p p 0 0 2 2 2 e (i/~)E0 t = e (i/~)(E0 t / 1 v /c E0 vx /c 1
v 2 /c 2 )
Nel riferimento con gli apici, essa varia sia nello spazio sia nel tempo. Se scriviamo l’ampiezza nella forma 0 0 0 0 e (i/~)(Ep t p x ) vediamo che Ep0 = r
E0
v2 c2 è l’energia calcolata classicamente per una particella di energia a riposo E0 che viaggia con velocità v, mentre Ep0 v p0 = 2 c è il corrispondente impulso della particella. Voi sapete che x µ = (t, x, y, z) 1
e pµ = (E, px, py, pz ) sono quadrivettori, e che pµ x µ = Et
p·x
è un invariante scalare. Nel sistema a riposo della particella, pµ x µ si riduce a Et: ne segue che, passando in un altro riferimento, a Et bisogna sostituire E 0t 0
p0 · x0
Quindi, l’ampiezza di probabilità di una particella di impulso p risulterà proporzionale a e
(i/~)(Ep t p · x)
(7.5)
dove Ep è l’energia della particella il cui impulso è p, ossia Ep = (1)
q
(pc)2 + E02
(7.6)
Abbiamo tacitamente supposto che la fase abbia lo stesso valore in punti corrispondenti dei due sistemi. Questo in realtà è un punto delicato, in quanto la fase di un’ampiezza quantistica è in larga misura arbitraria. Una giustificazione completa di questo assunto richiede una discussione più dettagliata concernente le interferenze tra due o più ampiezze.
7.2 • Moto uniforme
© 978-8808-22107-0
dove E0 è ancora l’energia a riposo. In problemi non relativistici possiamo scrivere Ep = Ms c2 + Wp
(7.7)
dove Wp è l’energia in più dell’energia a riposo Ms c2 delle varie parti dell’atomo. In generale, Wp conterrà sia l’energia cinetica dell’atomo, sia la sua energia di legame o di eccitazione, che possiamo chiamare energia «interna». Scriveremo Wp = Wint +
p2 2M
(7.8)
e le ampiezze saranno date da e
(i/~)(Wp t p · x)
(7.9)
Poiché in generale faremo calcoli non relativistici, useremo questa forma per le ampiezze di probabilità. Notate che la nostra trasformazione relativistica ci ha dato, senza bisogno di altre ipotesi, la variazione dell’ampiezza di un atomo che si muove nello spazio. Dalla (7.9), il numero d’onde relativo alle variazioni nello spazio risulta p ~
(7.10)
2⇡ h = k p
(7.11)
k= quindi la lunghezza d’onda è =
Questa è proprio la lunghezza d’onda che abbiamo già usato in precedenza per particelle di impulso p. Questa formula fu ottenuta per la prima volta da de Broglie proprio con questo metodo. Per una particella in movimento, la frequenza delle variazioni dell’ampiezza è ancora data da ~! = Wp (7.12) Il modulo quadrato della (7.9) è semplicemente 1, e quindi, per una particella in moto con energia definita, si ha che la probabilità di trovarla è la stessa dappertutto e non dipende dal tempo. (È importante rilevare che l’ampiezza è un’onda complessa. Se avessimo usato un’onda sinusoidale reale, avremmo trovato che il quadrato varia da punto a punto, il che non è giusto.) Naturalmente, sappiamo benissimo che ci sono delle situazioni in cui le particelle si muovono da un posto all’altro, di modo che la probabilità dipende dalla posizione e varia con il tempo. Come si descrivono queste situazioni? Lo si fa considerando delle ampiezze che siano sovrapposizioni in due o più ampiezze relative a stati di energia definita. Abbiamo già discusso questa situazione nel cap. 48 del vol. 1 – anche per le ampiezze di probabilità! Avevamo visto che la somma di due ampiezze con differenti numeri d’onda k (cioè impulsi) e frequenze ! (energie) dà picchi di interferenza, o battimenti, di modo che il quadrato dell’ampiezza varia nello spazio e nel tempo. Avevamo anche trovato che questi battimenti si muovono con la cosiddetta «velocità di gruppo» data da ! vg = k dove k e ! indicano le differenze tra i numeri d’onda e le frequenze delle due onde. Per onde più complicate, ottenute dalla somma di molte ampiezze tutte con quasi la stessa frequenza, la velocità di gruppo è d! vg = (7.13) dk Ponendo Ep != ~ e p k= ~
91
92
Capitolo 7 • La dipendenza delle ampiezze dal tempo
vediamo che vg = Dall’equazione (7.6), si ottiene
Ma
© 978-8808-22107-0
dEp dp
dEp p = c2 dp Ep
(7.14)
(7.15)
Ep = Mc2
e quindi
dEp p = dp M
(7.16)
che è proprio la velocità classica della particella. Oppure, se usiamo l’espressione non relativistica, abbiamo Wp != ~ e p k= ~ e d * p2 + p d! dWp = = = (7.17) dk dp dp , 2M - M
che è ancora la velocità classica. Concludiamo quindi che, se si hanno più ampiezze corrispondenti a stati puri d’energia, e quest’ultima è circa la stessa per tutti, la loro interferenza dà luogo a «pacchetti» di probabilità che si muovono nello spazio con una velocità pari a quella che avrebbe una particella classica della stessa energia. Vogliamo però far notare che, quando diciamo di sommare due ampiezze con diversi numeri d’onda per ottenere una specie di battimento che viene a corrispondere a una particella in moto, stiamo introducendo qualche cosa di nuovo, un nuovo concetto che non può essere dedotto dalla teoria della relatività. Abbiamo detto quale sia il comportamento dell’ampiezza relativa a una particella in quiete, e da ciò abbiamo poi dedotto cosa succede se invece la particella è in movimento. Ma, con gli stessi ragionamenti, non possiamo dedurre cosa succede quando ci sono due onde che si muovono con velocità diverse. Se ne fermiamo una, l’altra rimane in moto. Perciò, abbiamo tacitamente aggiunto l’ipotesi ulteriore che non solo la (7.9) è una soluzione possibile, ma che ci sono anche soluzioni relative allo stesso sistema per tutti i possibili p, e che i diversi termini interferiscono tra loro.
7.3
Energia potenziale. Conservazione dell’energia
p M
+ –
7.2 Una particella di massa M e impulso p in una regione in cui il potenziale è costante. FIGURA
Vogliamo ora discutere cosa succede nel caso che l’energia di una particella sia soggetta a variazioni. Cominciamo a considerare una particella che si muove in un campo di forze descritto da un potenziale. Trattiamo anzitutto l’effetto di un potenziale costante. Supponiamo di avere una grande cavità metallica che possa essere portata a un dato potenziale elettrostatico , come in FIGURA 7.2. Se dentro la cavità ci sono degli oggetti carichi, la loro energia potenziale sarà q , che indicheremo con V , e sarà assolutamente indipendente dalla posizione. Poiché un potenziale costante non può portare alcuna differenza in ciò che avviene all’interno della cavità, dentro questa la fisica rimarrà immutata. Non c’è alcun modo di dedurre la risposta in questo caso, e perciò bisogna cercare d’immaginarsela. L’idea che si rivela giusta è quella che più o meno ci si aspetta: al posto dell’energia, dobbiamo usare la somma
7.3 • Energia potenziale. Conservazione dell’energia
© 978-8808-22107-0
93
dell’energia potenziale V e dell’energia E p , che è, a sua volta, la somma dell’energia interna e di quella cinetica. L’ampiezza viene a essere proporzionale a e
(i/~)[(Ep +V )t p · x]
(7.18)
Il principio generale è che il coefficiente di t, che possiamo chiamare !, è sempre uguale all’energia totale del sistema: l’energia interna (o di «massa»), più l’energia cinetica, più quella potenziale: ~! = Ep + V (7.19) Ossia, in problemi non relativistici, p2 +V (7.20) 2M Cosa possiamo dire sui fenomeni fisici che avvengono all’interno della scatola? Cosa verrà fuori se ci sono più stati a energia differente? L’ampiezza corrispondente a ciascuno di questi stati presenta lo stesso fattore addizionale e (i/~)V t ~! = Wint +
oltre a quelli che avrebbe per V = 0. Ma tutto questo è proprio come un cambiamento dell’origine nella nostra scala di energia. Ne deriva un’uguale variazione della fase di tutte le ampiezze, ma, come abbiamo già visto, questo non fa cambiare alcuna delle probabilità. Tutti i fenomeni fisici rimangono inalterati. (Stiamo supponendo di avere a che fare con stati differenti dello stesso oggetto carico, nel senso che il prodotto q è uguale per tutti quanti. Altrimenti, se il sistema cambiasse di carica passando da uno stato all’altro, si otterrebbero risultati diversi; ma la conservazione della carica è contro questa eventualità.) Fin qui, la nostra supposizione si rivela in accordo con ciò che ci si aspetta di trovare in conseguenza a un cambiamento del valore di riferimento per le energie. Ma, se è veramente giusta, deve valere anche per un’energia potenziale che non sia una semplice costante. In generale, V varierà in modo arbitrario sia nello spazio sia nel tempo, e il risultato complessivo per l’ampiezza non può che essere espresso in termini di un’equazione differenziale. Per ora però non vogliamo misurarci con il caso più generale, ma ci accontenteremo di una prima idea su come vanno le cose, e considereremo soltanto potenziali costanti nel tempo che varino molto lentamente nello spazio. Saremo poi in grado di paragonare tra loro i concetti classici e quelli quantistici. Supponiamo di considerare una situazione come quella nella FIGURA 7.3, in cui ci sono due cavità mantenute a potenziali costanti 1 e 2 , mentre nella zona intermedia tra le due il potenziale varia con continuità da un valore all’altro. Immaginiamo che ci siano delle particelle con ampiezza non nulla in tutte e due queste cavità. Infine, ci limiteremo al caso in cui l’impulso sia abbastanza grande da far sì che il potenziale rimanga quasi costante in ogni regione di spazio piccola, ma ancora grande rispetto alla lunghezza d’onda. Siamo allora portati a pensare che, in un punto qualsiasi dello spazio, l’ampiezza debba apparire come nella (7.18) con l’espressione di V corrispondente a quella zona di spazio. Re(Amp) Riferiamoci al caso particolare in cui 1 = 0, in modo che l’energia potenziale sia nulla nella prima scatola, mentre q 2 sia negativo; quindi la particella, secondo la fisica classica, avrebbe una energia cinetica maggiore Dist quando si trova nella seconda cavità. Classicamente, pertanto, si muoverebbe più velocemente nella seconda scatola, avrebbe più energia cinetica e, conseguentemente, più impulso. Vediamo ora come questo possa venir fuori dalla meccanica quantistica. FIGURA 7.3 Ampiezza per una particella in transito Considerando le ipotesi fatte, l’ampiezza nella prima scatola risulterà da un potenziale a un altro. proporzionale a 2 e (i/~)[(Wint +p1 /2M+V1 )t p1 · x] (7.21) mentre quella nella seconda scatola sarà proporzionale a e
(i/~)[(Wint +p22 /2M+V2 )t p 2 · x]
(7.22)
94
Capitolo 7 • La dipendenza delle ampiezze dal tempo
© 978-8808-22107-0
(Facciamo conto che l’energia interna non cambi, ma risulti la stessa nelle due regioni.) Si tratta ora di vedere in che modo queste due ampiezze si colleghino l’una all’altra nella regione intermedia. Nel seguito supporremo che i potenziali siano tutti costanti nel tempo, in modo che le condizioni restino immutate. Ammetteremo allora che la variazione dell’ampiezza (ovvero, la sua fase) abbia la stessa frequenza dappertutto, in quanto, per così dire, non c’è niente nel «mezzo» che dipenda dal tempo. Poiché nulla cambia nello spazio circostante, considereremo che l’onda in una delle regioni produca nello spazio nuove «generazioni» di onde che oscillano tutte con la stessa frequenza, proprio come le onde luminose che mantengono inalterata la loro frequenza attraversando i mezzi in quiete. Se le frequenze nella (7.21) e nella (7.22) sono le stesse, se ne deduce che p2 p2 Wint + 1 + V1 = Wint + 2 + V2 (7.23) 2M 2M Entrambi i membri rappresentano le energie totali classiche, di modo che l’equazione (7.23) è l’affermazione della conservazione dell’energia. In altre parole, la conservazione dell’energia della fisica classica è equivalente, nel linguaggio quantistico, al principio che le frequenze relative a una particella sono le stesse dappertutto, se le condizioni esterne non variano col tempo. Tutto ciò è in accordo con l’idea che ~! = E. Nel caso particolare in cui V1 = 0 e V2 è negativo, l’equazione (7.23) ci dice che p2 è maggiore di p1 , e quindi che la lunghezza d’onda è più piccola nella regione 2. Le superfici a fase costante sono rappresentate dalle linee tratteggiate in FIGURA 7.3. Abbiamo anche riportato in un grafico la parte reale dell’ampiezza, per mostrare di nuovo come la lunghezza d’onda decresca passando dalla regione 1 alla regione 2. La velocità di gruppo delle onde, che è data da p/M, varia essa pure nel modo previsto dalla legge classica della conservazione dell’energia, in quanto questa si scrive esattamente come l’equazione (7.23). Si ha un caso particolare interessante quando V2 diventa così grande che V2 V1 risulta maggiore di p12 /2M. In tal caso, p22 , che è dato da p22
"
p2 = 2M 1 2M
V2 + V1
#
(7.24)
risulta negativo. Questo comporta che p2 è un numero immaginario, diciamo ip0. In linguaggio classico, concluderemmo che la particella non va mai a finire nella regione 2, perché non ha energia sufficiente per superare la barriera di potenziale. Tuttavia, in meccanica quantistica, l’ampiezza si ottiene ancora dall’equazione (7.22) e la sua variazione nello spazio è ancora data da e(i/~)p2 · x Solo che, se p2 è immaginario, la dipendenza spaziale è espressa da un esponenziale reale. Facciamo conto che la particella si muova inizialmente nella direzione +x; in tal caso, l’ampiezza varia come 0 e p x/~ (7.25) L’ampiezza decresce rapidamente al crescere di x. Immaginate che le due regioni a potenziale diverso siano molto vicine tra loro, in modo che l’energia potenziale passi bruscamente dal valore V1 al valore V2 , come si vede in FIGURA 7.4a. Se riportiamo in un grafico la parte reale dell’ampiezza di probabilità, otteniamo la dipendenza rappresentata nella FIGURA 7.4b. L’onda nella prima regione è quella che corrisponde a una particella che si muove verso la seconda regione, ma in quest’ultima l’ampiezza diminuisce rapidamente. Si ha, quindi, una certa probabilità di osservare la particella nella seconda regione, dove classicamente non giungerebbe mai, ma l’ampiezza corrispondente è molto piccola tranne che nelle immediate vicinanze della superficie di separazione. La situazione è del tutto simile a quella che avevamo trovato nel caso della riflessione totale interna della luce. Normalmente, la luce non passa dall’altra parte, ma la possiamo osservare se poniamo un rilevatore a una distanza di una o due lunghezze d’onda dalla superficie.
95
7.3 • Energia potenziale. Conservazione dell’energia
© 978-8808-22107-0
(a)
Re(Amp) Re(Amp) (b) x
x
7.4 Ampiezza per una particella che si avvicina a una regione dove il potenziale è fortemente repulsivo. FIGURA
7.5 Penetrazione dell’ampiezza attraverso una barriera di potenziale. FIGURA
Vi ricorderete che se si ha una seconda superficie di separazione vicina a quella in corrispondenza alla quale la luce è stata riflessa totalmente, V (r ) potremo osservare un po’ di luce che è passata nel secondo mezzo. (a) La stessa cosa succede in meccanica quantistica per le particelle. Una particella classica non riuscirebbe mai ad attraversare una ristretta regione nella quale l’energia potenziale V fosse così grande da far risultare E negativa l’energia cinetica classica. Invece, secondo la meccanica quantistica, l’ampiezza, pur diminuendo esponenzialmente, riesce ad attraversare quella zona e a dare quindi una piccola probabilità di trovare la particella r1 r dall’altra parte, dove l’energia cinetica è di nuovo positiva. La situazione è illustrata in FIGURA 7.5. Indicheremo questo fenomeno quantistico come «penetrazione di una barriera di potenziale». Questo effetto da parte di un’ampiezza quantistica ci dà la spiegazione – la descrizione – del decadimento ↵ di un nucleo di uranio. L’energia r · Re(Amp) (b) potenziale di una particella è rappresentata in FIGURA 7.6a, in funzione della distanza dal centro. Se uno cercasse di far entrare una particella ↵ di energia E dentro il nucleo, incontrerebbe una repulsione elettrostatica r dovuta alla carica nucleare z, e, classicamente, non potrebbe avvicinarsi più della distanza r 1 , in corrispondenza alla quale la sua energia totale uguaglia l’energia potenziale V . Più oltre, tuttavia, l’energia potenziale è molto più bassa a causa della forte attrazione dovuta alle forze nucleari che FIGURA 7.6 (a) Il potenziale di una particella α in un sono a corto raggio. Com’è allora possibile che a seguito del decadimento nucleo di uranio. (b) Forma qualitativa dell’ampiezza radioattivo uno osserva una particella ↵, che inizialmente era dentro il di probabilità. nucleo, venire fuori con energia E? Questo avviene perché essa parte con energia E dall’interno del nucleo e «filtra» attraverso la barriera di potenziale. L’ampiezza di probabilità è rappresentata grosso modo in FIGURA 7.6b, per quanto, in realtà, la caduta esponenziale sia molto più accentuata di quella disegnata. Ed è infatti molto notevole la circostanza che la vita media di una particella ↵ in un nucleo di uranio sia addirittura uguale a 4,5 miliardi di anni, mentre le oscillazioni naturali all’interno del nucleo sono enormemente rapide (dell’ordine di 1022 per s!). Come si può arrivare a un numero come 109 anni partendo da 10 22 s? La risposta è che l’esponenziale dà luogo a un fattore così tremendamente piccolo, circa e 45 , il quale tuttavia lascia sopravvivere una data probabilità di filtrare, anche se molto esigua. Se uno considera una
96
Capitolo 7 • La dipendenza delle ampiezze dal tempo
© 978-8808-22107-0
particella ↵ in un nucleo, non c’è quasi nessuna ampiezza di probabilità di trovarla fuori; però, se si prendono tanti nuclei e si aspetta abbastanza a lungo, si può essere fortunati e trovarne una che ne è uscita.
7.4
Forze. Il limite classico
Supponete di considerare una particella in movimento che attraversi una regione nella quale il potenziale varia ortogonalmente alla direzione del moto. Classicamente, questa situazione verrebbe descritta come nella FIGURA 7.7. Se la particella si muove lungo l’asse x ed entra in una zona in cui il potenziale varia lungo y, essa risente di un’accelerazione trasversale dovuta alla forza @V F= @y Se questa forza si fa sentire solo in una regione limitata di larghezza w, essa agirà in complesso per il tempo w/v. La particella acquisterà un impulso trasversale py = F L’angolo di deflessione ✓ è allora ✓=
w v
py Fw = p pv
dove p è l’impulso iniziale. Utilizzando per F l’espressione @V /@ y, si ottiene ✓=
w @V pv @ y
(7.26)
Andiamo ora a vedere se la nostra supposizione che le onde si comportino secondo la (7.20) sia in grado di spiegare lo stesso risultato. Guardiamo lo stesso fenomeno dal punto di vista della meccanica quantistica, assumendo che tutto sia molto grande rispetto alla lunghezza d’onda delle nostre ampiezze di probabilità. In una qualsiasi regione limitata possiamo dire che l’ampiezza varia come 2 e (i/~)[(W +p /2M+V )t p · x] (7.27) Come si vede che da questo si ottiene una deflessione della particella quando V ha un gradiente trasversale? Abbiamo rappresentato in FIGURA 7.8 l’aspetto delle onde di ampiezza di probabilità. Abbiamo tracciato un certo numero di «nodi delle onde» che potete immaginarvi come superfici in corrispondenza alle quali la fase dell’ampiezza è zero. In ogni regione limitata la lunghezza d’onda, cioè la distanza tra due successivi nodi, è data da =
h p V basso
V basso
y
a
F = – ∂V/∂y x px
px
w
py
D
Nodo dell’onda
7.7 Deflessione di una particella dovuta a un gradiente di potenziale trasversale.
b
w
∆x
V alto
V alto
FIGURA
k
7.8 L’ampiezza di probabilità in una regione in cui vi è un gradiente di potenziale trasversale. FIGURA
7.5 • La «precessione» di una particella a spin un mezzo
© 978-8808-22107-0
nella quale p è legato a V dalla relazione W+
p2 + V = cost. 2M
(7.28)
Nella regione in cui V è maggiore, p è minore e la lunghezza d’onda è più grande. Se ne deduce che l’angolo tra le superfici nodali risulta cambiato come in figura. Per trovare la variazione nell’angolo tra le superfici nodali, notiamo che, tra i due cammini a e b in FIGURA 7.8, si ha una differenza di potenziale V= di modo che ne deriva una differenza ottenuta dalla (7.28):
@V D @y
p nell’impulso lungo le due traiettorie, che può essere ! p2 p = 2M M
p=
V
(7.29)
Perciò, il numero d’onda p/~ è diverso lungo i due cammini, il che significa che la fase varia con velocità differente. La differenza nella velocità di incremento della fase è k=
p ~
quindi il salto di fase realizzato sulla distanza totale w è (fase) = k · w =
p w= ~
M V ·w p~
(7.30)
Questa è la quantità della quale la fase lungo il cammino b «sopravanza» quella lungo a nel momento in cui l’onda emerge dalla striscia. Ma fuori da quest’ultima, un anticipo di fase di questa entità corrisponde a un avanzamento del nodo dell’onda pari a x=
2⇡
(fase) =
ovvero x=
~ (fase) p
M V ·w p2
(7.31)
Riferendoci alla FIGURA 7.8, vediamo che i nuovi fronti d’onda risultano spostati di un angolo ✓ dato da x=D ✓ (7.32) quindi si ottiene D ✓=
M V ·w p2
(7.33)
Questa equazione è identica alla (7.26) se si sostituisce p/M con v e V /D con @V /@ y. Il risultato ora ottenuto è corretto solo se il potenziale varia lentamente e con continuità, cioè in quel che si dice il limite classico. Abbiamo mostrato che in tali condizioni si ottengono per la particella le stesse leggi di moto che a partire da F = ma, purché si assuma che un potenziale dia alla fase dell’ampiezza di probabilità un contributo pari a Vt/~. Al limite classico la meccanica quantistica è in accordo con la meccanica newtoniana.
7.5
La «precessione» di una particella a spin un mezzo
Notate che non abbiamo fatto alcuna ipotesi particolare sull’energia potenziale; questa è semplicemente quell’energia la cui derivata dà una forza. Per esempio, nell’esperimento di Stern-Gerlach
97
98
Capitolo 7 • La dipendenza delle ampiezze dal tempo
© 978-8808-22107-0
avevamo a che fare con un’energia U = µ · B, che dà luogo a una forza se B varia nello spazio. Per descrivere le cose quantisticamente, avremmo dovuto dire che l’energia delle particelle in uno dei due fasci varia in un modo, mentre nel secondo varia in modo opposto. (Avremmo potuto inglobare l’energia magnetica U sia nell’energia potenziale V , sia nell’energia «interna» W ; non ha alcuna importanza.) È a causa di questa dipendenza dall’energia che le onde sono rifratte, e che, in conseguenza, i fasci vengono deviati in alto o in basso. (Vediamo ora che la meccanica quantistica ci avrebbe portato alle stesse deflessioni calcolabili con la meccanica classica.) Data la dipendenza dell’ampiezza dall’energia potenziale, ci aspettiamo che, se una particella è a riposo in un campo magnetico diretto come l’asse z, la sua ampiezza di probabilità vari col tempo secondo la legge e (i/~)( µz B)t (In effetti, possiamo considerare questa come una definizione di µz .) In altre parole, se poniamo una particella in un campo magnetico uniforme B per un tempo ⌧, la sua ampiezza di probabilità risulterà moltiplicata per e (i/~)( µz B)⌧ rispetto a quella in assenza di campo. Poiché per una particella di spin un mezzo, µz può assumere solo due valori uguali a più o meno un dato numero, che indichiamo con µ, i due possibili stati subirebbero nel campo magnetico omogeneo una variazione di fase con la stessa velocità ma in direzioni opposte. Le due ampiezze risultano moltiplicate per e±(i/~)µB⌧
(7.34)
Questo risultato ha delle conseguenze interessanti. Supponiamo di avere una particella a spin un mezzo in un dato stato, che non sia uno stato puro di spin «su» o «giù». Possiamo descrivere la sua situazione dando le ampiezze di probabilità di trovarlo nei due stati puri «su» e «giù». Ma, in un campo magnetico, questi due stati hanno una fase che varia con velocità diverse. Perciò, quando ci poniamo un problema riguardo a tali ampiezze, la risposta dipenderà dalla quantità di tempo in cui la particella ha subito l’effetto del campo. Come esempio, consideriamo la disintegrazione del muone in un campo magnetico. Al momento della creazione dei muoni come prodotti di decadimento dei mesoni, essi sono polarizzati (in altre parole, si ha per lo spin una direzione privilegiata). I muoni, a loro volta, si disintegrano, in circa 2,2 µs in media, ed emettono un elettrone e due neutrini: µ!e+
+¯
In questa disintegrazione, si osserva che l’elettrone (almeno intorno all’energia massima) è emesso preferenzialmente in direzione opposta alla direzione dello spin del muone. Supponiamo di considerare l’assetto sperimentale riprodotto nella FIGURA 7.9. Se i muoni polarizzati giungono da sinistra e sono ridotti in quiete in un blocco di materiale in A, essi, dopo un tempuscolo, si disinB z tegreranno. Gli elettroni emessi si distribuiranno, in generale, in tutte le x Spin possibili direzioni. Ma facciamo conto che i muoni entrino tutti nel blocco e A di materiale con lo spin in direzione x. In assenza di campo magnetico si otterrà una certa distribuzione angolare delle direzioni di decadimento; A Contatore ci domandiamo come viene alterata questa distribuzione dalla presenza del di elettroni campo magnetico. Ci aspettiamo che essa vari in qualche modo con il tempo. Possiamo capire cosa succede domandandoci quale sia, a ogni istante, l’ampiezza di probabilità di trovare il muone nello stato (+x). FIGURA 7.9 Un esperimento di decadimento del muone. Possiamo formulare il problema nel modo seguente: si sa che il muone ha lo spin in direzione +x per t = 0; qual è l’ampiezza che esso si trovi nello stesso stato al tempo ⌧? Ora, non sappiamo come si comporti una particella di spin un mezzo in un campo magnetico ortogonale allo spin, ma sappiamo cosa succede agli stati con spin «su» o «giù» nella direzione del campo; precisamente, la loro ampiezza risulta moltiplicata per il fattore (7.34). Il nostro procedimento sarà perciò quello di scegliere una rappresentazione in cui gli stati di base
7.5 • La «precessione» di una particella a spin un mezzo
© 978-8808-22107-0
sono a spin «su» o «giù» rispetto alla direzione z (quella del campo). Qualunque problema può essere riformulato con riferimento alle ampiezze relative a questi stati. Diciamo che (t) rappresenta lo stato del muone. Quando esso entra nel blocco A, il suo stato è (0), e vogliamo conoscere (⌧) al tempo successivo. Indicando i due stati di base con (+z) e ( z), possiamo dire di conoscere le due ampiezze h+z | (0)i e h z | (0)i, in quanto sappiamo che (0) rappresenta uno stato con spin nella condizione (+x). Come risulta dal precedente capitolo, queste ampiezze sono(2) 1 h+z | +xi = C+ = p 2 (7.35) 1 h z | +xi = C = p 2 Si dà il caso che siano uguali. Dal momento che queste ampiezze si riferiscono alla situazione all’istante t = 0, le chiameremo C+ (0) e C (0). Ora sappiamo cosa accade di queste due ampiezze al passare del tempo. Usando la (7.34), si ha C+ (t) = C+ (0) e (i/~)µBt (7.36) C (t) = C (0) e+(i/~)µBt Una volta che conosciamo C+ (t) e C (t), abbiamo in mano tutti gli elementi sulla situazione al tempo t. Il solo guaio è che quello che vogliamo sapere è la probabilità che al tempo t lo spin sia in direzione +x. Però, in ogni caso, le nostre regole generali sono grado di risolvere il problema. Scriviamo che l’ampiezza di probabilità, che possiamo indicare con A+ (t), di essere al tempo t nello stato (+x) è A+ (t) = h+x | (t)i = h+x | +zi h+z | (t)i + h+x | zi h z | (t)i ossia A+ (t) = h+x | +zi C+ (t) + h+x | zi C (t)
(7.37)
Ancora dai risultati del capitolo precedente, o meglio dall’uguaglianza h | i = h | i⇤ del capitolo 5, sappiamo che
1 h+x | +zi = p 2 1 h+x | zi = p 2 Perciò, conosciamo tutte le quantità che compaiono nell’equazione (7.37). Si ottiene A+ (t) =
1 (i/~)µBt 1 e + e 2 2
(i/~)µBt
o anche
µB t ~ Un risultato semplicissimo! Notate che il risultato è in accordo con ciò che ci aspettiamo al tempo t = 0. Si ottiene A+ (0) = 1, che è giusto, perché abbiamo supposto che il muone fosse nello stato (+x) al tempo t = 0. La probabilità P+ di trovare il muone al tempo t nello stato (+x) è (A+ )2 , cioè A+ (t) = cos
P+ = cos2
(2)
µBt ~
Se avete saltato il capitolo 6, potete prendere la (7.35) come una regola non dimostrata, per il momento. Faremo poi (al capitolo 10) una discussione più completa della precessione dello spin, che comprenderà anche una derivazione di queste ampiezze.
99
100
Capitolo 7 • La dipendenza delle ampiezze dal tempo
© 978-8808-22107-0
La probabilità oscilla tra zero e uno, come si vede in FIGURA 7.10. Osservate che la probabilità è di nuovo 1 per µBt/~ = ⇡ (non 2⇡). La probabilità 1 si riproduce con frequenza 2µB/~, poiché abbiamo quadrato la funzione coseno. Quindi, troviamo che la probabilità di rilevare l’elettrone di decadimento nel contatore della FIGURA 7.9 varia periodicamente con l’intervallo di 0 2 tempo durante il quale il muone ha subìto l’effetto del campo magnetico µ. ( B/)t La frequenza dipende dal momento magnetico. Il momento magnetico del muone è stato appunto misurato in questo modo. FIGURA 7.10 Dipendenza dal tempo della probabilità Naturalmente, possiamo usare lo stesso metodo per risolvere un qualsiache una particella a spin un mezzo si trovi in uno stato (+) rispetto all’asse x. si altro problema sul decadimento del muone. Per esempio, come dipende dal tempo la probabilità di rivelare un elettrone di decadimento nella direzione y a 90° rispetto all’asse x e ancora ortogonale al campo? Se fate il conto, dovreste trovare che l’ampiezza per lo stato (+y) varia come ! ⇡ 2 µBt cos ~ 4 Prob. di avere spin in dir. +x
che oscilla con lo stesso periodo, ma raggiunge il massimo valore un quarto di periodo dopo, quando µBt/~ = ⇡/4. Infatti, ciò che accade è che, al variare del tempo, il muone passa per una successione di stati che corrispondono a una completa polarizzazione in una direzione che ruota con continuità intorno all’asse z. Si usa descrivere ciò dicendo che lo spin precede con frequenza !p =
2µB ~
(7.38)
Dovreste cominciare ora a capire che aspetto prende la nostra descrizione quantistica nello studio dell’andamento temporale dei vari fenomeni.
8
La matrice hamiltoniana
8.1
Ampiezze e vettori
Prima di affrontare l’argomento principale di questo capitolo, vorremmo descrivere un certo numero di concetti matematici che sono largamente usati nella letteratura della meccanica quantistica. La loro conoscenza vi renderà più semplice la lettura di altri libri o articoli sull’argomento. Il primo punto sta nella grande somiglianza formale tra le equazioni della meccanica quantistica e le proprietà del prodotto scalare di due vettori. Vi ricorderete che se e sono due stati, l’ampiezza relativa alla transizione da e può essere scritta come una somma su un insieme completo di stati di base dei prodotti delle ampiezze relative alle transizioni da a uno degli stati di base e quindi da quest’ultimo di nuovo a : X h | i= h | ii hi | i (8.1) tutti gli i
Abbiamo giustificato questa relazione servendoci di un apparato di Stern-Gerlach, ma vi ricordiamo che non c’è alcun bisogno di riferirsi a un tale apparato. L’equazione (8.1) è una legge matematica che rimane vera ci sia o no effettivamente il filtro; non è sempre necessario immaginare che ci sia l’apparato. Possiamo benissimo considerarla come una formula che ci dà l’ampiezza h | i. Vogliamo paragonare l’equazione (8.1) con la formula del prodotto scalare di due vettori B e A. Se B e A sono due vettori ordinari in tre dimensioni, possiamo scrivere il prodotto scalare in questo modo: X (B · ei ) (ei · A) (8.2) tutti gli i
con la convenzione che i simboli ei stanno per i tre vettori nelle direzioni x, y e z. Quindi, B · e1 rappresenta ciò che ordinariamente viene indicato con Bx ; B · e2 sta per By ; e così via. Quindi, l’equazione (8.2) è equivalente a Bx Ax + By Ay + Bz Az
che non è altro che il prodotto scalare B · A. Confrontando le equazioni (8.1) e (8.2), si riscontra la seguente analogia: gli stati e corrispondono ai due vettori A e B; gli stati di base i corrispondono a quei particolari vettori ei ai quali riferiamo tutti gli altri vettori. Ogni vettore può essere espresso come combinazione lineare dei tre «vettori di base» ei . Inoltre, si conosce tutto di un vettore, se si conoscono i coefficienti di ciascun «vettore di base» in questa combinazione, ovvero, le sue tre componenti. In modo simile, ogni stato quantistico può essere descritto completamente mediante le ampiezze di transizione nei vari stati di base; e quando si conoscono questi coefficienti, si sa tutto ciò che si deve sapere sullo stato. Proprio per questa stretta analogia, uno «stato», secondo la nostra definizione, viene anche detto «vettore di stato». Poiché i vettori di base ei sono ad angolo retto tra loro, vale la relazione ei · e j =
ij
(8.3)
Ripasso: vol. 1, cap. 49, Modi di vibrazione
102
Capitolo 8 • La matrice hamiltoniana
© 978-8808-22107-0
Quest’ultima corrisponde alle relazioni (5.25) tra gli stati di base i, hi | ji =
ij
(8.4)
Capite ora perché si dice che gli stati di base i sono tutti «ortogonali». C’è una piccola differenza tra l’equazione (8.1) e il prodotto scalare. Si ha che h | i = h | i⇤
(8.5)
Invece, nell’algebra dei vettori, A·B = B· A Mentre con i numeri complessi della meccanica quantistica dobbiamo tenere conto dell’ordine dei termini, questo invece non conta nel prodotto scalare. Consideriamo ora la seguente equazione vettoriale: X A= ei (ei · A) (8.6) i
Questa è una scrittura poco comune, ma corretta. Ha lo stesso significato di X A= Ai ei = Ax e x + Ay e y + Az ez
(8.7)
i
Si noti però che nell’equazione (8.6) compare una quantità diversa da un prodotto scalare. Il prodotto scalare è semplicemente un numero, mentre l’equazione (8.6) è un’equazione vettoriale. Una delle idee fondamentali dell’analisi vettoriale è quella di astrarre dalle equazioni l’idea di vettore in se stesso. In modo del tutto analogo, si può essere tentati di astrarre dalla relazione quantistica, equazione (8.1), un qualcosa che sia l’analogo di un «vettore»; e, in realtà, ciò si può fare. Togliamo il h | da entrambi i membri dell’equazione (8.1) e scriviamo la seguente equazione (non abbiate paura, si tratta solo di una notazione e tra pochi minuti capirete che cosa significano i vari simboli): X | i= | ii hi | i (8.8) i
La parentesi h | i viene considerata come composta di due parti. La seconda parte | i è spesso detta un ket, mentre la prima, h |, è detta un bra (insieme, le due compongono una «bra-ket»(1) ; la notazione è di Dirac); i simboli parziali h | e | i sono detti anche vettori di stato. In ogni caso, essi non sono numeri, mentre in generale noi vogliamo che i risultati dei nostri calcoli siano alla fine dei numeri; perciò, queste quantità «incomplete» sono solo dei passi intermedi nei nostri calcoli. Finora, è successo che abbiamo sempre espresso tutti i nostri risultati per mezzo di numeri. Come abbiamo fatto a evitare i vettori? È interessante osservare che anche nella usuale algebra dei vettori si può fare in modo che in tutte le equazioni compaiano solo dei numeri. Per esempio, al posto di un’equazione vettoriale come F = ma avremmo sempre potuto scrivere C · F = C · (ma) In questo caso si ha un’equazione tra prodotti scalari che è vera per ogni vettore C. Ma se vale per tutti i C, che senso ha seguitare a scrivere C! Guardate ora l’equazione (8.1). Si tratta di una equazione che vale per ogni . Perciò, per risparmiare fatica, si può lasciare fuori la e scrivere l’equazione (8.8). Questa contiene la stessa informazione, purché si intenda sempre «completarla» con il «moltiplicare a sinistra per» – cioè, reinserendo semplicemente un qualche h | ad ambo i membri. Quindi, l’equazione (8.8) ha lo (1)
In inglese la parola bracket significa parentesi. (N.d.T.)
8.2 • Decomposizione dei vettori di stato
© 978-8808-22107-0
stesso significato dell’equazione (8.1), niente di più, niente di meno. Quando volete i numeri, non fate che mettere il h | che vi serve. Forse vi siete già chiesti cosa si possa fare di nell’equazione (8.8). Poiché tale equazione vale per ogni , perché tenerlo? Per l’appunto, Dirac suggerí di fare astrazione anche dalla , di modo che si ha solo X |= | ii hi | (8.9) i
E questa è la grande legge della meccanica quantistica! (Non ne abbiamo una analoga nell’analisi vettoriale.) Essa ci dice che quando si pongono a destra e a sinistra due stati, e , si ritorna all’equazione (8.1). Questo non è in realtà molto utile, ma è un buon modo di ricordare che l’equazione è vera per ogni coppia di stati.
8.2
Decomposizione dei vettori di stato
Riprendiamo in esame l’equazione (8.8); possiamo interpretarla nel modo seguente. Ogni vettore di stato | i può essere rappresentato come una combinazione lineare con opportuni coefficienti di un insieme di «vettori» di base, cioè, se si preferisce, come sovrapposizione in determinate proporzioni di certi «versori». Per sottolineare che i coefficienti hi | i non sono che dei comuni numeri (complessi), supponiamo di scrivere hi | i = Ci Con ciò, si può riscrivere l’equazione (8.8) nella forma X | i= | ii Ci
(8.10)
i
Una simile equazione può essere scritta per un qualsiasi altro vettore di stato, per esempio | i, naturalmente con coefficienti diversi, che indichiamo con Di . Si ha allora X | i= | ii Di (8.11) i
Questi Di sono semplicemente le ampiezze hi | i. Supponiamo di essere partiti facendo astrazione da nell’equazione (8.1). Avremmo allora scritto X h |= h | ii hi | (8.12) i
Ricordando che
h | ii = hi | i⇤
si ha ancora h |=
X
Di⇤ hi |
(8.13)
i
Ora la cosa interessante è che possiamo direttamente moltiplicare l’equazione (8.13) e l’equazione (8.10) per riottenere h | i. Nel fare questa operazione, dobbiamo fare attenzione agli indici di somma, in quanto essi sono del tutto distinti nelle due equazioni. Riscriviamo dapprima l’equazione (8.13) nella forma X h |= D⇤j h j | j
con il che nulla è cambiato. Quindi, mettendo insieme questa con l’equazione (8.10), si ottiene X h | i= D⇤j h j | ii Ci (8.14) ij
103
104
Capitolo 8 • La matrice hamiltoniana
Teniamo però presente che h j | ii = Si ha
© 978-8808-22107-0
i j , di modo che restano nella somma solo i termini con
h | i=
X
Di⇤ Ci
j = i.
(8.15)
i
dove, com’è chiaro,
Di⇤ = hi | i⇤ = h | ii
e
Ci = hi | i
Si ha ancora una stretta analogia con il prodotto scalare X B·A= Bi Ai i
L’unica differenza sta nel fatto che appare il complesso coniugato di Di . Quindi l’equazione (8.15) dice che se si sviluppano i vettori di stato h | e | i in vettori di base hi | oppure | ii, si ottiene l’ampiezza di transizione da a mediante quella specie di prodotto scalare che appare nell’equazione (8.15). Naturalmente questa equazione non è che l’equazione (8.1), solo scritta con un altro simbolismo. Così facendo, abbiamo semplicemente girato in tondo per impratichirci con questi nuovi simboli. Forse sarà meglio sottolineare nuovamente che, mentre i vettori nello spazio a tre dimensioni sono rappresentabili per mezzo di tre versori mutuamente ortogonali, i vettori di base | ii per gli stati quantistici devono variare su quell’insieme completo che si adatta al particolare problema. A seconda dei casi, possono essere necessari, due, tre, cinque, o un numero infinito di stati di base. Abbiamo anche parlato di quello che succede quando si fanno passare delle particelle attraverso un dato apparecchio. Se inizialmente le particelle sono in un certo stato , e facciamo quindi attraversare loro un determinato apparecchio, facendo alla fine una misura per vedere se si trovano nello stato , il risultato può essere descritto dall’ampiezza h | A| i
(8.16)
Questo simbolo non ha un analogo preciso nell’algebra dei vettori. (Assomiglia di più a grandezze proprie dell’algebra tensoriale, ma questo parallelo non è particolarmente utile.) Abbiamo visto nel capitolo 5, equazione (5.32), che avremmo potuto scrivere la (8.16) nella forma X h | A| i = h | ii hi | A | ji h j | i (8.17) ij
Questo è proprio un esempio di applicazione della regola fondamentale dell’equazione (8.9), che è qui usata due volte. Abbiamo anche trovato che se si pone in serie ad A un secondo apparecchio B, si può allora scrivere X h | BA | i = h | ii hi | B | ji h j | A | ki hk | i (8.18) i jk
Ancora una volta, questa relazione si ottiene subito scrivendo 1’equazione (8.9) alla maniera di Dirac, e ricordando che si può sempre interporre una sbarretta ( | ), che è proprio come un fattore 1 tra B e A. Per inciso, possiamo guardare l’equazione (8.17) da un altro punto di vista. Supponiamo di considerare la particella nello stato quando entra nell’apparecchio A e nello stato («psi») quando ne esce. In altre parole, ci poniamo il problema seguente: si può trovare uno stato tale che l’ampiezza di transizione da a sia sempre e dovunque uguale all’ampiezza h | A | i? La risposta è sì. Vogliamo che l’equazione (8.17) sia sostituita dalla relazione X h | i= h | ii hi | i (8.19) i
È chiaro che un tale risultato lo si ottiene se X hi | i = hi | A | ji h j | i = hi | A | i j
(8.20)
8.2 • Decomposizione dei vettori di stato
© 978-8808-22107-0
il che determina . Voi direte: «Non è vero che determina , determina solo hi | i». Il fatto è che hi | i determina , in quanto una volta noti tutti i coefficienti che legano agli stati di base i, risulta univocamente specificato. Infatti, possiamo divertirci con la nostra notazione a scrivere l’ultimo termine dell’equazione (8.20) nella forma X hi | i = hi | ji h j | A | i (8.21) j
Quindi, poiché questa equazione è vera per ogni i, possiamo semplicemente scrivere X | i= | ji h j | A | i
(8.22)
j
Possiamo perciò affermare: «Lo stato è ciò che si ottiene quando si parte con e si attraversa l’apparecchio A». Un ultimo esempio dei trucchi del mestiere. Si parte di nuovo dall’equazione (8.17). Poiché essa è vera per ogni e , li possiamo levare di mezzo tutti e due! Si ottiene allora(2) X A= | ii hi | A | jih j | (8.23) ij
Che significa questa espressione? Significa né più né meno che quello che si ottiene rimettendoci e . Così com’è scritta, è un’equazione «aperta» e incompleta. Se la moltiplichiamo «a sinistra» per | i, essa diventa X A| i = | ii hi | A | ji h j | i (8.24) ij
che è ancora l’equazione (8.22). In effetti, partendo da quell’equazione, avremmo potuto semplicemente lasciar cadere i vari j e scrivere | i = A| i
(8.25)
Il simbolo A non rappresenta né un’ampiezza, né un vettore; sta per qualche cosa di nuovo che si indica con il nome di operatore. Si tratta di un oggetto che «opera su» uno stato per produrne un altro; l’equazione (8.25) dice che | i è ciò che risulta quando A opera su | i. Ancora una volta, si tratta di un’equazione aperta fino a quando non viene completata con un bra qualsiasi come h | per dare allora h | i = h | A| i (8.26) Naturalmente si conosce completamente l’operatore A una volta nota la matrice formata dalle ampiezze hi | A | ji, indicata anche con Ai j , riferita a un insieme qualsiasi di stati di base. In realtà, con tutte queste notazioni matematiche, non abbiamo aggiunto niente di nuovo. Una delle ragioni per tirare in ballo tutto ciò è stata quella di mostrarvi come si scrivono questi pezzi di equazione, in quanto in molti libri troverete delle relazioni scritte in forma incompleta, e non c’è ragione che voi rimaniate di stucco quando vi capiterà d’imbattervi in una di queste. Se preferite potete sempre aggiungere i pezzi mancanti e ricostituire un’equazione tra numeri che avrà un aspetto più familiare. Inoltre, come vedrete, la notazione con i «bra» e i «ket» è particolarmente conveniente. Anzitutto, d’ora in poi potremo identificare uno stato mediante il suo vettore di stato. Quando vogliamo fare riferimento a uno stato di impulso definito p, possiamo dire: «lo stato | pi». Oppure si potrà parlare di un qualche stato | i arbitrario. Per coerenza useremo sempre il ket per identificare uno stato, scrivendo | i. (Naturalmente, si tratta di una scelta arbitraria; avremmo potuto benissimo decidere di usare il bra, h |.) (2)
Forse penserete che avremmo dovuto scrivere | A | invece che solo A. Ma, in tal caso, si sarebbe potuto far confusione con il simbolo che indica il «valore assoluto di A», ed è per questo che le sbarrette sono di solito omesse. In genere, il simbolo ( | ) si comporta in modo del tutto simile al fattore uno.
105
106
Capitolo 8 • La matrice hamiltoniana
8.3
© 978-8808-22107-0
Quali sono gli stati di base dell’universo?
Abbiamo scoperto che un qualsiasi stato al mondo può essere espresso come una sovrapposizione, cioè una combinazione lineare con coefficienti opportuni di stati di base. Anzitutto voi potete chiedere quali stati di base? Veramente ci sono molte possibilità distinte. Per esempio, uno spin può essere proiettato nella direzione z o in qualche altra. Ci sono moltissime rappresentazioni differenti, in analogia con i diversi sistemi di coordinate che si possono usare per rappresentare i vettori ordinari. E poi, quali coefficienti? Questo dipende dalle circostanze fisiche. Insiemi diversi di coefficienti corrispondono a condizioni fisiche diverse. Quello che è importante sapere è lo «spazio» sul quale si sta lavorando, o, in altre parole, che cosa significhino fisicamente gli stati di base. Perciò, in generale, la prima cosa che bisogna sapere è che aspetto hanno gli stati di base. Dopo di che, si potrà capire come rappresentare una certa situazione con riferimento a tali stati di base. Vorremmo adesso dare uno sguardo un po’ più in là e parlare brevemente di come vada inquadrata la descrizione quantistica della natura in generale, almeno secondo le idee correnti della fisica. Prima di tutto si decide per una particolare rappresentazione degli stati di base; rappresentazioni diverse sono sempre possibili. Per esempio, per una particella a spin un mezzo possiamo usare gli stati più o meno rispetto all’asse z. Ma l’asse z non ha niente di particolare; potete scegliere ogni altro asse che vi piaccia. Tuttavia, per procedere sistematicamente, prenderemo sempre l’asse z. Supponiamo di partire da una situazione in cui si ha un solo elettrone. Oltre alle due possibili orientazioni per lo spin («su» e «giù» lungo la direzione z), c’è da considerare anche l’impulso dell’elettrone. Prendiamo un insieme di stati di base, ciascuno corrispondente a un dato valore dell’impulso. E se l’elettrone non ha un impulso definito? Va benissimo lo stesso; stiamo solo dicendo quali sono gli stati di base. Se l’elettrone non ha un impulso definito, avrà una data ampiezza di probabilità per un certo impulso, un’altra ampiezza per un altro impulso, e così via. E se il suo spin non è necessariamente rivolto verso l’alto, ci sarà una certa ampiezza che lo sia mentre viaggia con quel certo impulso, e un’altra ampiezza che abbia lo spin rivolto in basso, sempre in corrispondenza di quel dato impulso, e così via. Per una descrizione completa di un elettrone si richiede, stando a ciò che si sa, che gli stati di base siano definiti dall’impulso e dallo spin. Perciò, un insieme accettabile di stati di base | ii per un singolo elettrone si riferisce a differenti valori dell’impulso e alle possibilità che lo spin sia giù o su. Differenti miscele di ampiezze, cioè diverse combinazioni delle C, descrivono situazioni differenti. Quel che fa un particolare elettrone, lo si descrive dicendo con quale ampiezza esso abbia lo spin su o giù e un dato impulso o un altro, e così via, per tutti i possibili impulsi. Vedete perciò quali siano le grandezze che entrano in una descrizione quantistica completa di un singolo elettrone. E per i sistemi con più di un elettrone? In tal caso gli stati di base diventano più complicati. Supponiamo di avere due elettroni. Anzitutto abbiamo quattro possibili stati rispetto allo spin: tutti e due gli elettroni con lo spin su, il primo giù e il secondo su, il primo su e il secondo giù, tutti e due giù. Dobbiamo inoltre specificare che il primo elettrone ha un impulso p1 e il secondo elettrone l’impulso p2 . Gli stati di base per due elettroni richiedono la specificazione dei due impulsi e dei due spin. Con sette elettroni bisogna specificarne sette sia dei primi sia dei secondi. Se si ha un protone e un elettrone, dobbiamo indicare la direzione dello spin del protone e il suo impulso, così come la direzione dello spin dell’elettrone e il suo impulso. Questo è vero almeno approssimativamente. In realtà noi non sappiamo quale sia la rappresentazione giusta del mondo. Si può benissimo partire ammettendo che, una volta specificati lo spin e l’impulso dell’elettrone, e analogamente per il protone, si abbiano gli stati di base: ma quel che c’è nelle «viscere» del protone, chi lo conosce? Consideriamo la cosa da questo punto di vista. Gli stati di base di un atomo di idrogeno, che è composto di un protone e un elettrone, vanno descritti dando le molte diverse combinazioni di spin su e giù per l’elettrone e il protone e delle varie possibilità dei rispettivi impulsi. Si hanno perciò diverse combinazioni di ampiezze Ci che insieme descrivono la situazione dell’atomo di idrogeno in stati differenti. Ma supponiamo di guardare l’intero atomo di idrogeno come una «particella». Se uno non sa che l’atomo di idrogeno è composto di un protone e di un elettrone, potrebbe dire: «Ah, io so quali sono gli stati di base; essi corrispondono a un particolare impulso dell’atomo di idrogeno». No, perché l’atomo di idrogeno ha una struttura
© 978-8808-22107-0
8.3 • Quali sono gli stati di base dell’universo?
interna. Può, perciò, avere vari stati d’energia interna differente e quindi il descriverne la reale natura richiede un maggiore dettaglio. Si pone il problema: il protone ha una struttura interna? Per descrivere il protone, dobbiamo dare tutti i possibili stati di protoni, di mesoni e di particelle strane? Non lo sappiamo. E anche se ammettiamo che l’elettrone sia semplice, di modo che tutto ciò che di esso va specificato sia l’impulso e lo spin, tuttavia, nel futuro, potremmo scoprire che anche l’elettrone ha ingranaggi e rotelline interne. Ciò comporterebbe che la nostra rappresentazione è incompleta, sbagliata, o approssimata, allo stesso modo come una rappresentazione dell’atomo di idrogeno che descrivesse solo il suo impulso sarebbe incompleta, in quanto avrebbe trascurato il fatto che l’atomo di idrogeno può essere eccitato internamente. Se si potesse eccitare internamente un elettrone e mutarlo in qualche cosa di diverso come, per esempio, un muone, allora esso andrebbe descritto non dando semplicemente gli stati della nuova particella, ma presumibilmente per mezzo di qualche più complicato meccanismo interno. Il problema principale nello studio delle particelle fondamentali è oggi quello di scoprire quale sia la rappresentazione corretta per la descrizione della natura. Per adesso, ci sembra di capire che per l’elettrone sia sufficiente specificare l’impulso e lo spin. Così pure pensiamo che si può idealizzare un protone associandogli i suoi mesoni ⇡, i suoi mesoni k, e così via, i quali vanno tutti specificati. Alcune dozzine di particelle; roba da pazzi! Il problema di quale sia e quale non sia una particella fondamentale, un argomento di cui si sente molto parlare in questi tempi, non è altro che il problema di quale sarà l’aspetto finale della rappresentazione nella descrizione quantistica definitiva del mondo. L’impulso dell’elettrone sarà ancora la cosa giusta da usare nella descrizione della natura? O, addirittura, si può poi porre la questione in questi termini? Questo problema sorgerà sempre in una qualsiasi indagine scientifica. In ogni modo, noi vediamo un problema: quello di trovare una rappresentazione. E non ne conosciamo la soluzione. Non sappiamo neppure se questo è il problema «giusto», ma se lo è, per prima cosa dobbiamo provare a capire se una qualsiasi particella è «fondamentale» oppure no. In meccanica quantistica non relativistica, cioè quando le energie non sono troppo alte, di modo che il lavorio interno delle particelle strane o altro non ne risulta disturbato, si può fare un ottimo lavoro anche senza preoccuparsi di questi particolari. Potete stabilire di specificare gli impulsi e gli spin degli elettroni e dei nuclei, dopo di che tutto andrà benissimo. Nella maggior parte delle reazioni chimiche, o in altri fenomeni di bassa energia, non succede niente nei nuclei: essi non vengono eccitati. Inoltre, se un atomo di idrogeno si muove lentamente, e urta dolcemente contro altri atomi di idrogeno, senza mai eccitarsi nel suo interno, irradiare o fare altre cose complicate, ma rimanendo sempre nello stato fondamentale per quanto riguarda il moto interno, allora si può usare un’approssimazione in cui si parla dell’atomo di idrogeno come di un oggetto, o particella, e non ci si preoccupa di ciò che potrebbe avvenire all’interno. Questa sarà una buona approssimazione fino a che l’energia cinetica in ciascuna collisione è al di sotto di 10 eV, che è l’energia necessaria a eccitare l’atomo di idrogeno in un diverso stato interno. Spesso faremo delle approssimazioni in cui non si tiene conto della possibilità del moto interno, con ciò diminuendo il numero di particolari da includere nei nostri stati di base. Naturalmente, in tal caso, si perde qualche fenomeno che appare (di solito) a un’energia un po’ più alta, ma facendo queste approssimazioni, si semplifica moltissimo l’analisi dei problemi fisici. Per esempio, si può discutere la collisione di due atomi di idrogeno a bassa energia, oppure un qualsiasi processo chimico, senza preoccuparsi del fatto che i nuclei atomici possano essere eccitati. Per riassumere, quindi, quando si possono trascurare gli effetti di tutti gli stati di eccitazione interna di una particella, si può scegliere un insieme di stati di base di impulso e componente z del momento angolare definito. Dunque uno dei problemi che s’incontrano nella descrizione della natura è quello di trovare una rappresentazione adatta per gli stati di base. Ma questo è solo il principio. Vogliamo inoltre essere in grado di dire che cosa «succede». A partire dalla conoscenza della «condizione» del mondo in un dato istante, vorremmo poterne conoscere la situazione a un istante successivo. Perciò dobbiamo anche trovare le leggi che determinano come le cose varino con il tempo. Ci rivolgiamo adesso a questa seconda parte nella struttura della meccanica quantistica: come gli stati cambiano col tempo.
107
108
Capitolo 8 • La matrice hamiltoniana
8.4
© 978-8808-22107-0
Come gli stati cambiano col tempo
Abbiamo già avuto occasione di parlare di come si rappresenta una situazione in cui qualcosa viene fatto passare attraverso un certo apparecchio. Ora un «apparecchio» economico e piacevolissimo da considerare è costituito dalla semplice attesa di qualche minuto; cioè si prepara uno stato e poi, prima di analizzarlo, lo si lascia stare per un po’. Eventualmente, lo si lascia in qualche campo elettrico o magnetico particolare; questo dipenderà dalla situazione fisica dell’universo circostante. Comunque, quale che siano tali condizioni, si lascia in pace il nostro oggetto dal tempo t 1 al tempo t 2 . Supponete che esso esca da un primo apparecchio nella condizione al tempo t 1 . E che successivamente attraversi un secondo «apparecchio», ma che quest’ultimo consista semplicemente in un ritardo fino al tempo t 2 . In questo intervallo, varie cose possono capitare: forze esterne applicate o altri imbrogli, in modo che qualche cosa succeda. Alla fine dell’intervallo, l’ampiezza di probabilità di trovare l’oggetto in un qualche stato non sarà più esattamente la stessa che si sarebbe ottenuta senza tale ritardo. Poiché «aspettare» non è che un tipo particolare di «apparecchio», possiamo descrivere quel che succede scrivendo un’ampiezza nella stessa forma dell’equazione (8.17). Poiché l’operazione di «aspettare» ha un’importanza particolare, la indicheremo con U invece che con A, e per specificare gli istanti iniziale e finale, t 1 e t 2 , scriveremo U(t 2, t 1 ). L’ampiezza che cerchiamo è h | U(t 2, t 1 ) | i
(8.27)
Come ogni altra ampiezza simile, questa può essere espressa in uno o in un altro sistema di base scrivendola come X h | ii hi | U(t 2, t 1 ) | ji h j | i (8.28) ij
Perciò U è completamente specificata quando si conosce l’intero insieme di ampiezze, cioè la matrice hi | U(t 2, t 1 ) | ji (8.29) Possiamo sottolineare, per inciso, che la matrice hi | U(t 2, t 1 ) | ji dà molti più dettagli di quanti ne possano servire. Il fisico teorico di classe che lavora in fisica delle alte energie considera problemi della seguente natura generale (in quanto gli esperimenti sono fatti di solito in tal modo). Egli parte con una coppia di particelle, come un protone e un protone, che dall’infinito giungono a incontrarsi. (Nel laboratorio, in genere, una particella sta ferma mentre l’altra proviene da un acceleratore che in pratica, confrontato con la scala atomica, è all’infinito.) Questi oggetti si urtano ed escono, per esempio, due mesoni k, sei mesoni ⇡ e due neutroni in certe direzioni con determinati impulsi. Qual è l’ampiezza di probabilità che ciò accada? La matematica si presenta come segue: lo stato specifica gli spin e gli impulsi delle particelle incidenti. Il riguarda il problema di ciò che viene fuori. Per esempio, con quale ampiezza si ottengono i sei mesoni che vanno in tali e tali altre direzioni, e i due neutroni che escono in quelle altre direzioni con gli spin così e così. In altre parole, sarà specificato dando tutti gli impulsi, gli spin e così via dei prodotti finali. Il compito del teorico è di calcolare l’ampiezza (8.27). In realtà, a lui interessa solo il caso che t 1 = 1 e t 2 = +1. (Dall’esperienza, non si hanno dettagli sullo svolgimento del processo, ma solo su ciò che entra e ciò che viene fuori.) Il limite di U(t 2, t 1 ) per t 1 ! 1 e t 2 ! +1 si indica con S, e quel che egli vuole è h |S| i Oppure, usando la forma (8.28), egli vorrebbe calcolarsi la matrice hi | S | ji che si chiama matrice S. Quindi, quando vedete un fisico teorico che misura coi suoi passi la stanza dicendo, «Tutto quello che ho da fare è di calcolare la matrice S», sapete di che si sta preoccupando.
8.4 • Come gli stati cambiano col tempo
© 978-8808-22107-0
È un problema interessante quello di analizzare la matrice S, cioè di determinarne le leggi. Nella meccanica quantistica relativistica delle alte energie, si procede in un modo, mentre nel caso non relativistico si può fare in un’altra maniera che è molto conveniente. (Questo procedimento può essere usato anche nel caso relativistico, ma allora non è più così utile.) Si tratta di determinare la matrice U per un piccolo intervallo di tempo, ovvero per t 2 e t 1 vicini tra loro. Se riusciamo a trovare una successione di tali U per intervalli di tempo consecutivi, possiamo vedere come vadano le cose in funzione del tempo. Voi capite immediatamente che questo sistema non funziona tanto bene per la relatività, perché in tal caso non si vuole essere costretti a specificare come si presentano le cose «contemporaneamente» dappertutto. Ma non vogliamo interessarci di questo: qui ci interessa la meccanica quantistica non relativistica. Immaginiamo di considerare la matrice U per un intervallo che va da t 1 a t 3 maggiore di t 2 . In altre parole, consideriamo tre istanti successivi: t 1 minore di t 2 minore di t 3 . Noi sosteniamo allora che la matrice che fa passare da t 1 a t 3 è il prodotto in successione di ciò che accade passando da t 1 a t 2 e poi da t 2 a t 3 . È proprio come la situazione che si ha con due apparecchi B e A in serie. Possiamo quindi scrivere, seguendo la notazione del paragrafo 5.6, U(t 3, t 1 ) = U(t 3, t 2 ) · U(t 2, t 1 )
(8.30)
In altri termini, possiamo analizzare un intervallo di tempo qualunque se sappiamo analizzare una successione di piccoli intervalli di tempo in esso contenuta. Basta moltiplicare insieme tutte le parti; così procede l’analisi della meccanica quantistica nel caso non relativistico. Il nostro problema, perciò, è quello di trovare la matrice U(t 2, t 1 ) per un intervallo di tempo infinitesimo, cioè per t 2 = t 1 + t. Ci poniamo la seguente domanda: se abbiamo uno stato ora, quale sarà il suo aspetto dopo un intervallo di tempo infinitesimo t? Cerchiamo di mettere in formule tutto ciò. Indichiamo con | (t)i lo stato al tempo t (scriviamo esplicitamente la dipendenza dal tempo di per rendere perfettamente chiaro che intendiamo la condizione al tempo t). Adesso domandiamo: qual è la situazione dopo un piccolo intervallo di tempo t? La risposta è | (t + t)i = U(t + t, t) | (t)i (8.31) Il significato di questa equazione è lo stesso della (8.25), cioè che l’ampiezza di probabilità di trovare al tempo t + t è h | (t + t)i = h | U(t + t, t) | (t)i
(8.32)
Poiché ancora non ci sentiamo perfettamente a nostro agio con queste astrazioni, proiettiamo le nostre ampiezze in una rappresentazione definita. Moltiplicando entrambi i membri dell’equazione (8.31) per hi |, otteniamo hi | (t + t)i = hi | U(t + t, t) | (t)i (8.33) Possiamo anche risolvere | (t)i in stati di base e scrivere X hi | (t + t)i = hi | U(t + t, t) | ji h j | (t)i
(8.34)
j
Possiamo capire l’equazione (8.34) nel modo seguente: se indichiamo con Ci (t) = hi | (t)i l’ampiezza di trovarsi nello stato di base i al tempo t, possiamo immaginarci che questa ampiezza (che è nient’altro che un numero, ricordatevi!) varii nel tempo. Ogni Ci diventa una funzione di t. Abbiamo anche qualche informazione su come le ampiezze Ci varino con il tempo. Ogni ampiezza al tempo (t + t) è legata linearmente a tutte le altre ampiezze al tempo t per mezzo di un insieme di coefficienti. Indichiamo con Ui j gli elementi della matrice U, intendendo che Ui j = hi | U | ji Dopo di che, possiamo scrivere l’equazione (8.34) come X Ci (t + t) = Ui j (t + t, t) C j (t) j
(8.35)
109
110
Capitolo 8 • La matrice hamiltoniana
© 978-8808-22107-0
Così, dunque, si presenta la dinamica della meccanica quantistica. Per ora non sappiamo molto sugli Ui j a parte un fatto. Sappiamo che se t ! 0, non può succedere niente, cioè si deve riottenere lo stato di partenza. Quindi Uii ! 1 e Ui j ! 0, se i , j. In altri termini, Ui j ! i j per t ! 0. Possiamo anche supporre che per piccoli t ciascuno dei coefficienti Ui j debba differire da i j per quantità proporzionali a t; possiamo quindi scrivere Ui j =
ij
(8.36)
+ Ki j t
Si usa però estrarre il fattore ( i/~)(3) dai coefficienti Ki j , per ragioni in parte storiche, in parte di altra natura; si preferisce scrivere Ui j (t + t, t) =
ij
i Hi j (t) t ~
(8.37)
Naturalmente, è lo stesso che l’equazione (8.36) e, se volete, non è che una definizione dei coefficienti Hi j (t). I fattori Hi j sono le derivate rispetto a t 2 dei coefficienti Ui j (t 2, t 1 ) valutate per t 2 = t 1 = t. Usando nella (8.35) questa forma della U, si ottiene # X" i Ci (t + t) = H (t) t C j (t) (8.38) ij ij ~ j Sommando i termini in i j si ottiene proprio Ci (t), che possiamo portare al primo membro. Dividendo poi per t, si ottiene qualcosa che si riconosce essere una derivata: Ci (t + t) t ossia i~
Ci (t)
=
i X Hi j (t) C j (t) ~ j
dCi (t) X = Hi j (t) C j (t) dt j
(8.39)
Si ricordi che Ci (t) è l’ampiezza di probabilità hi | i di trovare lo stato in uno degli stati di base i (al tempo t). Quindi l’equazione (8.39) ci dice come ciascuno dei coefficienti hi | i vari col tempo. Ma ciò equivale a dire che l’equazione (8.39) ci dice come varia col tempo lo stato , poiché stiamo descrivendo lo stato per mezzo delle ampiezze hi | i. La variazione di col tempo è descritta mediante la matrice Hi j , la quale naturalmente deve contenere ciò che facciamo subire al sistema e che causa in esso dei cambiamenti. Se si conoscono gli Hi j , che contengono tutta la fisica della situazione, e che in generale possono dipendere dal tempo, si possiede una descrizione completa del comportamento del sistema nel tempo. L’equazione (8.39) è quindi la legge quantistica che regola la dinamica dell’universo. (Vorremmo precisare che useremo sempre un insieme di stati di base che sono fissi e non variano col tempo. Alcuni usano stati di base che variano anch’essi. Tuttavia, questo è come usare un sistema di coordinate rotante in meccanica, e non vogliamo andarci a cacciare in queste complicazioni.)
8.5
La matrice hamiltoniana
L’idea sarebbe dunque quella che, per descrivere l’universo quantistico, occorre scegliere un insieme di stati di base i e di compendiare le leggi fisiche nella matrice dei coefficienti Hi j . Con ciò si ha tutto in mano, e si è in grado di rispondere a una qualsiasi domanda su ciò che accadrà. (3)
Siamo un po’ nei guai qui con la notazione. Nel fattore ( i/~), la i sta per l’unità immaginaria i che si riferisce all’i-esimo stato di base! Speriamo che non facciate troppa confusione.
p
1, e non per l’indice
8.5 • La matrice hamiltoniana
© 978-8808-22107-0
Dobbiamo perciò imparare le regole per trovare la H che corrisponde a una qualsiasi situazione fisica: quella che corrisponde a un campo magnetico, o a un campo elettrico, e così via. E questa è la cosa più difficile. Per esempio, per le nuove particelle strane, non abbiamo alcuna idea su quali Hi j usare. In altre parole, nessuno conosce Hi j completamente, per il mondo intero. (Parte della difficoltà sta nel fatto che difficilmente si può sperare di scoprire i valori di Hi j , quando non si conosce nemmeno quali siano gli stati di base!) Abbiamo, in realtà, delle ottime approssimazioni per i fenomeni non relativistici e per qualche altro caso particolare. Per esempio, conosciamo le espressioni necessarie per il moto degli elettroni negli atomi, cioè per descrivere la chimica. Ma non conosciamo la matrice H completa, esatta e valida per tutto l’universo. I coefficienti Hi j formano la cosiddetta matrice hamiltoniana, o, in breve, l’hamiltoniana. (Come fece Hamilton, che operò negli anni 1830, a dare il suo nome a una matrice quantistica, è una cosa che si spiega con la storia.) Sarebbe meglio chiamarla matrice energia, per ragioni che saranno chiare man mano che ci lavoreremo. Quindi il problema è: conosci la tua hamiltoniana! L’hamiltoniana ha una proprietà che può essere direttamente dedotta, cioè che Hi⇤j = H ji
(8.40)
Questo segue dal fatto che la probabilità totale di trovare il sistema in un qualche stato non cambia. Se si parte con una particella, un certo oggetto, o con il mondo, poi vi ritrovate sempre con quello, man mano che il tempo scorre. La probabilità totale di trovarlo in uno stato qualsiasi è X i
|Ci (t)| 2
che non deve variare col tempo. Se ciò deve risultare vero per ogni condizione iniziale , allora l’equazione (8.40) deve essere valida. Come primo esempio, consideriamo il caso in cui le circostanze fisiche non variano col tempo; parliamo delle condizioni fisiche esterne, cosicché H risulta indipendente dal tempo. Nessuno accende o spegne magneti. Ci limitiamo anche a dei sistemi per i quali un solo stato di base è sufficiente per la loro descrizione; si tratta di un’approssimazione che può essere appropriata per un atomo di idrogeno a riposo, o qualche cosa di simile. L’equazione (8.39) ci dice allora che i~
dC1 = H11 C1 dt
(8.41)
Una sola equazione, e questo è tutto! E se H11 , è costante, questa equazione differenziale può essere facilmente risolta, e si ottiene C1 = (cost.) e
(i/~)H11 t
(8.42)
Questa è la dipendenza dal tempo di uno stato a energia definita E = H11 . Vedete perché Hi j andrebbe detta la matrice dell’energia. È la generalizzazione dell’energia a situazioni più complicate. Consideriamo poi, per comprendere un po’ meglio quale sia il significato della nostra equazione, il caso di un sistema che possiede due stati di base. In tal caso l’equazione (8.39) ci dà dC1 = H11 C1 + H12 C2 i~ dt (8.43) dC2 i~ = H21 C1 + H22 C2 dt Se, di nuovo, gli H sono indipendenti dal tempo, queste equazioni possono essere risolte facilmente. Lasciamo a voi la possibilità di farlo per divertimento; in un secondo tempo ritorneremo sulla cosa e lo faremo noi. Proprio così; si può risolvere la meccanica quantistica senza conoscere gli H, fino a che questi sono indipendenti dal tempo.
111
112
Capitolo 8 • La matrice hamiltoniana
8.6
© 978-8808-22107-0
La molecola di ammoniaca
Vogliamo ora mostrarvi come l’equazione che esprime la dinamica quantistica possa essere usata per descrivere una particolare situazione fisica. Abbiamo pescato un esempio semplice ma interessante, nel quale, facendo delle ipotesi ragionevoli sulla forma dell’hamiltoniana, si possono ricavare risultati d’importanza anche pratica. Considereremo una situazione descrivibile con due stati: la molecola di ammoniaca. La molecola di ammoniaca è costituita «da un atomo di azoto e da tre atomi di idrogeno posti su un piano giacente sotto l’azoto, cosicché la molecola ha la forma di una piramide, come mostrato nella FIGURA 8.1a. Questa molecola, come qualsiasi altra, può trovarsi in un numero infinito N di stati. Essa può ruotare intorno a un qualunque asse; può muoversi in qualsiasi direzione; può avere delle vibrazioni interne, e così via. Perciò, H non è affatto un sistema a due stati. Ma intendiamo fare un’approssimazione in cui tutti gli altri stati rimangono fissi, in quanto questi non entrano (a) H nelle considerazioni alle quali siamo per ora interessati. Prenderemo in considerazione solo il moto di rotazione della molecola intorno al suo asse di simmetria (come mostrato in figura), e supporremo che il suo H impulso di traslazione sia nullo e le vibrazioni le più piccole possibili. Questo determina tutte le condizioni tranne una: si hanno ancora due possibilità per l’atomo di azoto, cioè quest’ultimo può trovarsi da una parte H o dall’altra del piano degli atomi di idrogeno, come si vede nelle FIGURE 8.1a e 8.1b. Tratteremo perciò la molecola come se fosse un sistema a due stati. (b) H Intendiamo dire con ciò che ci sono solo due stati di cui ci preoccuperemo realmente, mentre supporremo che tutto il resto rimanga fisso. Si capisce che anche se sapessimo che ruota con un certo momento angolare intorno H all’asse, che si muove con un certo impulso e che vibra in una data maniera, si avrebbero sempre due stati possibili. Diremo che la molecola è nello stato N | 1i quando l’azoto è «su», come in FIGURA 8.1a, e nello stato | 2i quando l’azoto è «giù», come in 8.1b. Prenderemo gli stati | 1i e | 2i come nostro insieme di stati di base per analizzare il comportamento della molecola di ammoniaca. In ogni momento, lo stato istantaneo | i della molecola può FIGURA 8.1 Due disposizioni geometriche equivalenti della molecola di ammoniaca. essere rappresentato mediante C1 = h1 | i che è ampiezza relativa allo stato | 1i, e C2 = h2 | i che è ampiezza relativa allo stato | 2i. Allora, usando l’equazione (8.8), possiamo scrivere il vettore di stato | i come | i = | 1i h1 | i + | 2i h2 | i ossia | i = | 1i C1 + | 2i C2
(8.44)
La cosa interessante è che se si sa che la molecola è in un dato stato a un dato istante, essa poi non sarà nello stesso stato qualche tempo dopo. I due coefficienti C cambieranno col tempo secondo le equazioni (8.43), che sono valide per ogni sistema a due stati. Supponiamo, per esempio, di aver fatto una misura, oppure di aver operato una selezione delle molecole, in modo da sapere che inizialmente la molecola si trova nello stato | 1i. A un certo istante successivo, c’è una certa probabilità di trovarla nello stato | 2i. Per trovare quale sia questa probabilità, dobbiamo risolvere l’equazione differenziale che ci dice come le ampiezze varino col tempo. La sola difficoltà consiste nel fatto che non sappiamo che cosa mettere al posto dei coefficienti Hi j nell’equazione (8.43). Possiamo però dire qualche cosa. Supponiamo che, una volta che la
8.6 • La molecola di ammoniaca
© 978-8808-22107-0
molecola si trovi nello stato | 1i, non abbia alcuna possibilità di finire mai nello stato | 2i, e viceversa. Allora H12 e H21 sarebbero entrambi zero, e le equazioni (8.43) si scriverebbero i~
dC1 = H11 C1 dt
i~
dC2 = H22 C2 dt
Sappiamo facilmente risolvere queste equazioni ottenendo C1 = (cost.) e
(i/~)H11 t
C2 = (cost.) e
(i/~)H22 t
(8.45)
Queste sono appunto le ampiezze per stati stazionari di energie E1 = H11 ed E2 = H22 . Notiamo, però, che per la molecola di ammoniaca i due stati | 1i e | 2i hanno una simmetria definita. Se la natura ha un minimo di ragionevolezza, gli elementi di matrice H11 e H22 devono essere uguali. Li chiamiamo ambedue E0 , poiché corrispondono all’energia che gli stati avrebbero se H12 e H21 fossero zero. Ma le equazioni (8.45) non ci dicono che cosa fa realmente l’ammoniaca. Si trova che esiste la possibilità che l’azoto si faccia strada attraverso i tre atomi di idrogeno e si porti dall’altra parte. È molto difficile; per passare al di là, ci vuole un sacco di energia. Come può farcela a passare se non ha abbastanza energia? Esiste una certa ampiezza non nulla che riesca a passare la barriera energetica. In meccanica quantistica, è possibile sgattaiolare velocemente attraverso una regione che energeticamente sarebbe vietata. Perciò, c’è una piccola ampiezza che una molecola inizialmente nello stato | 1i si porti nello stato | 2i. Ma i coefficienti H12 e H21 non sono in realtà uguali a zero. Ancora, per simmetria, essi devono essere uguali, almeno in modulo. Infatti sappiamo già che in generale Hi j deve essere uguale al complesso coniugato di H ji , di modo che essi possano differire solo di una fase. Si trova che non si perde in generalità prendendoli uno uguale all’altro. Per motivi che saranno chiari in seguito, li poniamo uguali a un numero negativo; prendiamo H12 = H21 = A. Abbiamo allora la seguente coppia di equazioni: i~
dC1 = E0 C1 dt
(8.46)
AC2
dC2 = E0 C2 AC1 (8.47) dt Queste equazioni sono semplicissime e possono essere risolte in un numero illimitato di modi. Un modo conveniente è il seguente. Sommando le due otteniamo i~
i~
d (C1 + C2 ) = (E0 dt
A) (C1 + C2 )
la cui soluzione è C1 + C2 = ae
(i/~)(E0 A)t
(8.48)
Poi, facendo la differenza fra la (8.46) e la (8.47), troviamo i~
d (C1 dt
C2 ) = (E0 + A) (C1
C2 )
che dà C1
C2 = be
(i/~)(E0 +A)t
(8.49)
Abbiamo indicato con a e b le due costanti di integrazione; ovviamente, queste vanno specificate per dare le condizioni iniziali appropriate a ogni particolare problema fisico. Addizionando e sottraendo le (8.48) e (8.49), otteniamo ora C1 e C2 : C1 (t) =
a e 2
(i/~)(E0 A)t
+
b e 2
(i/~)(E0 +A)t
(8.50)
113
114
Capitolo 8 • La matrice hamiltoniana
© 978-8808-22107-0
a (i/~)(E0 A)t b (i/~)(E0 +A)t e e (8.51) 2 2 Questi sono uguali tranne che per il segno del secondo termine. Ecco le soluzioni; ma qual è il loro significato? (Il problema in meccanica quantistica non è solo quello di risolvere le equazioni, ma anche quello di capire il significato delle soluzioni!) Si noti anzitutto che se b = 0, entrambi i termini hanno la stessa frequenza C2 (t) =
!=
E0
A ~
Se tutto varia con la stessa frequenza, significa che il sistema è in uno stato di energia definita, in questo caso E0 A. Esiste quindi uno stato stazionario di tale energia per il quale le due ampiezze C1 e C2 sono uguali. Otteniamo il risultato che la molecola di ammoniaca ha un’energia definita E0 A se sono uguali le ampiezze di probabilità di trovare l’atomo di azoto «su» o «giù». Se a = 0, si ha un altro stato stazionario possibile; in questo caso tutte e due le ampiezze hanno frequenza (E0 A)/~. Quindi c’è un altro stato con energia definita E0 + A se le due ampiezze sono uguali ma con il segno opposto C2 = C1 . Questi sono gli unici stati di energia definita. Discuteremo con maggiore dettaglio gli stati della molecola di ammoniaca nel prossimo capitolo; diremo ora solo un paio di cose. Concludiamo che, a causa del fatto che esiste una certa possibilità che l’atomo di azoto possa saltare da una posizione all’altra, l’energia della molecola non è semplicemente E0 , come ci saremmo aspettati, ma ci sono due livelli energetici E0 + A ed E0 A. Ognuno dei possibili stati della molecola, qualunque sia la sua energia, viene «risolto» in due livelli. Diciamo ognuno dei possibili stati perché, come ricorderete, abbiamo considerato un particolare stato di rotazione, energia interna, e così via. Per ogni possibile situazione di questo tipo si ha un doppietto di livelli energetici a causa della possibilità che ha la molecola di fare su-e-giù. Poniamoci questo problema a proposito della molecola di ammoniaca. Ammettiamo di sapere che a t = 0, la molecola sia nello stato | 1i, o, in altre parole, che C1 (0) = 1 e C2 (0) = 0. Che probabilità si hanno di trovare al tempo t la molecola nello stato | 2i, oppure ancora nello stato | 1i? Le nostre condizioni iniziali ci fissano i valori di a e b nelle equazioni (8.50) e (8.51). Ponendo t = 0, si ha che a+b C1 (0) = =1 2 a b C2 (0) = =0 2 Chiaramente, a = b = 1. Introducendo tali valori nelle formule per C1 (t) e C2 (t) e risistemando alcuni termini, si ha e(i/~)At + e (i/~)At + C1 (t) = e (i/~)E0 t * 2 , C2 (t) = e
(i/~)E0 t
Riscriviamo queste espressioni nella forma C1 (t) = e
*e ,
(i/~)At
(i/~)E0 t
e
2
cos
At ~
(i/~)At
+ -
(8.52)
At (8.53) ~ Le due ampiezze variano in modulo armonicamente col tempo. La probabilità di trovare la molecola nello stato | 2i al tempo t è uguale al modulo quadrato di C2 (t): At |C2 (t)| 2 = sen2 (8.54) ~ La probabilità parte da zero (come essa deve fare), cresce fino a uno, e quindi oscilla tra zero e uno avanti e indietro, come si vede dalla curva indicata con P2 in FIGURA 8.2. Naturalmente, la C2 (t) = ie
(i/~)E0 t
sen
8.6 • La molecola di ammoniaca
© 978-8808-22107-0
115
probabilità di essere nello stato | 1i non rimane fissa al P valore uno. Essa «si scarica» sul secondo stato finché la probabilità di trovare la molecola nel primo stato è 1 zero, come si vede dalla curva P1 in FIGURA 8.2. La P1 probabilità fluttua avanti e indietro tra i due estremi. Tanto tempo fa abbiamo visto cosa succede per due pendoli uguali con un leggero accoppiamento (vedi 0,5 cap. 49 del vol. 1). Quando ne tiriamo uno indietro e poi lo lasciamo andare, questo oscilla, ma poi gradualP2 mente anche l’altro comincia a oscillare. Ben presto il secondo pendolo si prende tutta l’energia. Poi il processo s’inverte ed è il pendolo numero uno che si 0 t riprende l’energia. È esattamente lo stesso genere di (unità di /A) cose. La velocità con cui l’energia si scambia avanti e indietro dipende dall’accoppiamento tra i due pendoli, cioè dalla rapidità con cui «l’oscillazione» riesce a FIGURA 8.2 Probabilità P 1 che una molecola di ammoniaca che si trova nello sfuggire. Vi ricorderete anche che ai due pendoli sono stato |1i a t =0, si trovi ancora in |1i a t, e probabilità P 2 che si trovi invece in |2 i. associati due speciali tipi di moto, ciascuno con frequenza definita, che si dicono modi fondamentali. Se tiriamo da una parte tutti e due i pendoli, questi oscillano insieme a una data frequenza. Se invece tiriamo l’uno da una parte e l’altro dall’altra si ha un altro moto stazionario anch’esso di frequenza definita. Ebbene, anche in questo caso si ha una situazione simile: la molecola di ammoniaca è matematicamente analoga a una coppia di pendoli. Si hanno le due frequenze seguenti E0
A ~
E0 + A ~
la prima per quando si ha oscillazione in accordo e la seconda per quando si ha oscillazione in opposizione di fase. L’analogia con i pendoli non è molto più profonda del principio che le stesse equazioni hanno le stesse soluzioni. Le equazioni lineari per le ampiezze (8.39) sono molto simili alle equazioni lineari degli oscillatori armonici. (In realtà, questa è la ragione del successo della nostra teoria classica dell’indice di rifrazione, in cui si sostituiva all’atomo quantistico un oscillatore armonico, anche se, classicamente, questa non è una descrizione ragionevole degli elettroni che circolano intorno al nucleo.) Se si tira l’azoto da una parte, si ottiene una sovrapposizione di queste due frequenze e si produce una specie di battimento, poiché il sistema non si trova in nessuno dei due stati a frequenza definita. Tuttavia, lo sdoppiamento dei livelli di energia della molecola di ammoniaca è un effetto strettamente quantistico. Lo sdoppiamento dei livelli di energia della molecola di ammoniaca ha importanti applicazioni pratiche che descriveremo nel prossimo capitolo. Finalmente, ecco un esempio di un problema fisico concreto che si può comprendere con la meccanica quantistica!
9
Il maser ad ammoniaca
9.1 MASER = Microwave Amplification by Stimulated Emission of Radiation, Amplificazione di Microonde tramite Emissione Stimolata di Radiazione
Gli stati di una molecola di ammoniaca
In questo capitolo ci proponiamo di discutere l’applicazione della meccanica quantistica a un dispositivo di uso pratico, il maser ad ammoniaca. Forse vi chiederete come mai interrompiamo l’esposizione del formalismo della meccanica quantistica per risolvere un problema particolare, ma vi accorgerete che molte delle caratteristiche di questo problema specifico s’incontrano tali e quali nella teoria generale della meccanica quantistica, e quindi imparerete moltissimo dallo studio dettagliato di questo problema. Il maser ad ammoniaca è un dispositivo per generare onde elettromagnetiche, il cui funzionamento è basato sulle proprietà della molecola di ammoniaca che abbiamo brevemente discusso nel capitolo precedente. Cominciamo con il riassumere i risultati che abbiamo trovato. La molecola di ammoniaca può trovarsi in molti stati diversi, ma noi ci limitiamo a considerarla come un sistema a due stati, preoccupandoci solo di ciò che succede quando la molecola si trova in un qualsiasi stato particolare di rotazione o di traslazione. Un modello fisico dei due stati può essere visualizzato nel modo seguente. Se si considera la molecola di ammoniaca come rotante intorno a un asse passante per l’atomo di azoto e perpendicolare al piano degli atomi di idrogeno, come si vede in FIGURA 9.1, si hanno ancora due possibilità a seconda che l’atomo di azoto si trovi da una parte o dall’altra rispetto al piano degli atomi di idrogeno. Indichiamo questi stati con | 1i e | 2i. Essi verranno presi come stati di base nella nostra analisi del comportamento della molecola di ammoniaca. In un sistema a due stati di base, un qualunque stato | i del sistema può sempre essere descritto come una combinazione lineare dei due stati di base; cioè, c’è una certa ampiezza C1 di probabilità di trovarlo nel primo stato e un’ampiezza C2 di trovarlo nel secondo. Possiamo scrivere il corrispondente vettore di stato come (9.1)
| i = | 1i C1 + | 2i C2
N
H
Momento di dipolo H H
H
H Centro di massa
9.1
Un modello fisico per i due stati di base della molecola di ammoniaca. Questi stati hanno momenti di dipolo elettrico uguali a �. FIGURA
H
N
9.1 • Gli stati di una molecola di ammoniaca
© 978-8808-22107-0
dove C1 = h1 | i C2 = h2 | i Queste due ampiezze variano con il tempo secondo le equazioni hamiltoniane (8.43). Sfruttando la simmetria dei due stati della molecola di ammoniaca, poniamo H11 = H22 = E0 H12 = H21 = A Si ottengono allora le soluzioni (si vadano le equazioni (8.50) e (8.51)): C1 =
a e 2
(i/~)(E0 A)t
+
b e 2
(i/~)(E0 +A)t
(9.2)
a (i/~)(E0 A)t b (i/~)(E0 +A)t e e (9.3) 2 2 Vogliamo ora dare uno sguardo più da vicino a queste soluzioni. Immaginate che la molecola sia inizialmente nello stato | II i per il quale il coefficiente b è uguale a zero. In tal caso, per t = 0, le ampiezze di probabilità di essere negli stati | 1i e | 2i sono identiche, e rimangono tali per qualsiasi istante. Le loro fasi variano entrambe nello stesso modo col tempo, con frequenza (E0 A)/~. Analogamente, se avessimo posto la molecola nello stato | I i per il quale a = 0, l’ampiezza C2 sarebbe stata opposta a C1 , e tale sarebbe rimasta per sempre. Tutte e due le ampiezze varierebbero ora col tempo con frequenza (E0 + A)/~. Questi sono gli unici stati possibili per i quali la relazione tra C1 e C2 è indipendente dal tempo. Abbiamo trovato due particolari soluzioni in cui le due ampiezze non variano in modulo e, inoltre, hanno fasi che variano con la stessa frequenza. Esse corrispondono a stati stazionari secondo la definizione del paragrafo 7.1, il che significa che si tratta di stati a energia definita. Lo stato | II i ha energia EII = E0 A, mentre lo stato | I i ha energia EI = E0 + A. Questi sono gli unici stati stazionari esistenti, di modo che possiamo dire che la molecola ha due livelli, separati da una differenza di energia pari a 2A. (Naturalmente, intendiamo due livelli di energia relativi a quel dato stato di rotazione e vibrazione cui ci siamo riferiti nelle nostre ipotesi iniziali(1) .) Se non avessimo lasciata aperta la possibilità per l’azoto di oscillare avanti e indietro, avremmo posto A uguale a zero e i due livelli di energia avrebbero finito per sovrapporsi in corrispondenza di un’energia E0 . Invece i livelli reali non sono così fatti; in media hanno un’energia pari a E0 , ma sono spostati di ±A, di modo che ne risulta una separazione di 2A tra le energie dei due stati. Poiché, in effetti, A è molto piccolo, anche la differenza in energia è molto piccola. Per poter eccitare un elettrone all’interno di un atomo, occorrono energie relativamente molto alte, che richiedono fotoni nella regione ottica ultravioletta. Invece per eccitare le vibrazioni delle molecole si richiedono fotoni infrarossi. Se si parla poi di eccitare rotazioni, le differenze di energia fra gli stati corrispondono a fotoni nell’estremo infrarosso. Ma la differenza di energia 2A è ancora più piccola di ognuna delle altre e cade, infatti, al di sotto dell’infrarosso, proprio all’interno della regione delle microonde. Sperimentalmente, si è trovato che c’è una coppia di livelli con una separazione di 10 4 eV, corrispondenti alla frequenza di 24 000 megacicli. Ovviamente, ciò significa che 2A = h f , con f = 24 000 megacicli (corrispondenti a una lunghezza d’onda di 1,25 cm). Si ha a che fare in questo caso con una molecola che può compiere una transizione che non causa emissione di luce nel senso ordinario della parola, ma invece di microonde. Per l’elaborazione che segue, occorre descrivere un po’ meglio questi due stati a energia definita. Ammettiamo di voler costruire un’ampiezza CII facendo la somma dei due numeri C1 e C2 : CII = C1 + C2 = h1 | i + h2 | i (9.4) C2 =
(1)
In ciò che segue è utile, leggendo per conto vostro o parlandone con qualcun altro, avere un modo comodo di distinguere tra i numeri arabi 1 e 2 e i numeri romani I e II. Troviamo conveniente riferire i nomi «uno» e «due» ai numeri arabi, e di chiamare I e II con i nomi «eins» e «zwei» (anche se «unus» e «duo» sarebbero più appropriati!).
117
118
Capitolo 9 • Il maser ad ammoniaca
© 978-8808-22107-0
Che significato avrebbe? Non sarebbe altro che l’ampiezza di probabilità di trovare lo stato | i in un nuovo stato | IIi per il quale risultano uguali le ampiezze relative agli stati di base originali. O anche, scrivendo CII = hII | i possiamo lasciar cadere | i dall’equazione (9.4), in quanto questa vale per ogni , e scrivere hII | = h1 | + h2 | che ha lo stesso significato di (9.5)
| IIi = | 1i + | 2i L’ampiezza dello stato | IIi nello stato | 1i è h1 | IIi = h1 | 1i + h1 | 2i
la quale ovviamente è uguale a 1, poiché | 1i e | 2i sono stati di base. Anche l’ampiezza dello stato | IIi nello stato | 2i vale 1, cosicché lo stato | IIi ha ampiezze uguali nei due stati di base | 1i e | 2i. Però ci troviamo un poco nei pasticci. Lo stato | IIi ha una probabilità totale maggiore di uno di trovarsi in uno qualsiasi degli stati di base. Ma ciò significa semplicemente che il vettore di stato non è «normalizzato» come si deve. Possiamo rimediare a ciò ricordando che si deve avere hII | IIi = 1, come deve sempre essere per qualsiasi stato. Facendo ricorso alla relazione generale X h | i= h | ii hi | i i
ponendo sia
sia
uguali a II, e sommando sugli stati di base | 1i e | 2i, si ottiene hII | IIi = hII | 1i h1 | IIi + hII | 2i h2 | IIi
Questa espressione sarà uguale a 1, come deve, se si cambia la definizione di CII , nella equazione (9.4), nel modo seguente: ⌘ 1 ⇣ CII = p C1 + C2 2 Analogamente, possiamo costruire un’ampiezza
ovvero
1 ⇣ CI = p C1 2 1 ⇣ CI = p h1 | i 2
C2
⌘
h2 | i
⌘
(9.6)
Questa ampiezza è la proiezione dello stato | i in un nuovo stato | Ii che ha ampiezze di probabilità opposte di trovarsi negli stati | 1i e | 2i. In effetti, l’equazione (9.6) ha lo stesso significato che
oppure
da cui segue che
1 ⇣ hI | = p h1 | 2
h2 |
⌘
1 ⇣ | Ii = p | 1i 2
| 2i
⌘
1 h1 | Ii = p = 2
h2 | Ii
(9.7)
La ragione per la quale abbiamo fatto questo è che gli stati | Ii e | IIi possono essere considerati come un nuovo insieme di stati di base che è particolarmente conveniente per descrivere gli stati stazionari della molecola di ammoniaca. Si ricordi che le condizioni che un insieme di stati di base devono soddisfare sono hi | ji = i j
9.1 • Gli stati di una molecola di ammoniaca
© 978-8808-22107-0
Abbiamo già sistemato le cose in modo che hI | Ii = hII | IIi = 1 Si dimostra facilmente dalle equazioni (9.5) e (9.7) che hI | IIi = hII | Ii = 0 Le ampiezze C1 = hI | i e CII = hII | i da uno stato qualsiasi nei nostri nuovi stati di base | Ii e | IIi devono anch’esse soddisfare un’equazione hamiltoniana della forma dell’equazione (8.39). Se infatti si sottraggono le due equazioni (9.2) e (9.3) e si differenzia rispetto a t, si vede che i~
dCI = (E0 + A) CI = EI CI dt
(9.8)
Così pure, sommando le equazioni (9.2) e (9.3), si vede che i~
dCII = (E0 dt
A) CII = EII CII
(9.9)
Usando | Ii e | IIi come stati di base, la matrice hamiltoniana acquista la forma semplice HI,I = EI
HI,II = 0
HII,I = 0
HII,II = EII
Si noti che ciascuna delle equazioni (9.8) e (9.9) è del tutto simile all’equazione che abbiamo ottenuto nel paragrafo 8.6 per i sistemi a uno stato. Esse mostrano la semplice dipendenza esponenziale dal tempo che corrisponde a una sola energia. Al variare del tempo, le ampiezze di probabilità di essere in ciascuno degli stati evolvono indipendentemente. Naturalmente, i due stati stazionari | I i e | II i, che abbiamo trovato prima, sono soluzioni delle equazioni (9.8) e (9.9). Lo stato | I i (per il quale C1 = C2 ) dà CI = e
(i/~)(E0 +A)t
(9.10)
CII = 0 Così lo stato |
II i
(per il quale C1 = C2 ) dà CI = 0 CII = e
(i/~)(E0 A)t
(9.11)
Ricordiamoci che le ampiezze nell’equazione (9.10) sono CI = hI |
Ii
CII = hII |
Ii
cosicché, l’equazione (9.10) equivale a dire |
Ii
= | Ii e
(i/~)(E0 +A)t
In altre parole, il vettore di stato dello stato stazionario | I i è uguale al vettore dello stato di base | Ii a parte il fattore esponenziale appropriato all’energia dello stato stesso. Infatti per t = 0 |
Ii
= | Ii
cioè lo stato | Ii si trova nella stessa situazione fisica dello stato stazionario di energia E0 + A. In modo del tutto analogo, abbiamo per il secondo stato stazionario che |
II i
= | IIi e
(i/~)(E0 A)t
119
120
Capitolo 9 • Il maser ad ammoniaca
© 978-8808-22107-0
Lo stato | IIi non è che lo stato stazionario di energia E0 A a t = 0. Quindi i nostri due nuovi stati di base | Ii e | IIi hanno, fisicamente, la forma degli stati a energia definita, quando a questi ultimi si sia tolto il fattore esponenziale, in modo da ottenere stati di base indipendenti dal tempo. (In ciò che segue spesso riterremo conveniente di non fare sempre distinzione tra gli stati stazionari | I i e | II i e i corrispondenti stati di base | Ii e | IIi, poiché differiscono solo negli ovvi fattori temporali.) Riassumendo, i vettori di stato | Ii e | IIi costituiscono una coppia di vettori di base che si rivelano adatti alla descrizione degli stati a energia definita della molecola di ammoniaca. Essi sono legati ai nostri stati di base originali dalle relazioni ⌘ 1 ⇣ | Ii = p | 1i | 2i 2 ⌘ 1 ⇣ | IIi = p | 1i + | 2i 2
(9.12)
⌘ 1 ⇣ CI = p C1 C2 2 ⌘ 1 ⇣ CII = p C1 + C2 2
(9.13)
Le ampiezze di probabilità di essere negli stati | Ii e | IIi sono legate a C1 e C2 da
Un qualsiasi stato può essere espresso come combinazione lineare di | 1i e | 2i, con i coefficienti C1 e C2 , oppure come combinazione lineare degli stati di base a energia definita | Ii e | IIi, con i coefficienti CI e CII . Perciò | i = | 1i C1 + | 2i C2 oppure | i = | Ii CI + | IIi CII La seconda forma ci dà le ampiezze dello stato | i nello stato con energia EI = E0 + A oppure nello stato con energia EII = E0 A.
9.2
La molecola in un campo elettrico stazionario
Se la molecola di ammoniaca si trova in uno dei due stati di energia definita e la disturbiamo con una frequenza ! tale che ~! = EI EII = 2A, il sistema può compiere una transizione da uno stato all’altro. Oppure, se si trova nello stato superiore, può passare allo stato più basso ed emettere un fotone. Ma per provocare queste transizioni occorre avere un legame fisico con gli stati, una qualche maniera di disturbare il sistema. Ci deve essere qualche meccanismo esterno in grado di agire sugli stati, come un campo elettrico o magnetico. Nel nostro caso specifico, gli stati sono sensibili a un campo elettrico. Esamineremo perciò ora il problema del comportamento della molecola di ammoniaca in un campo elettrico esterno. Per discutere ciò che avviene in un campo elettrico, ritorneremo agli stati di base originali | 1i e | 2i, invece di usare | Ii e | IIi. Ammettiamo che ci sia un campo elettrico in direzione perpendicolare al piano degli atomi di idrogeno. Trascurando per il momento la possibilità delle transizioni avanti e indietro, sarà vero che l’energia di questa molecola è la stessa per le due possibili posizioni dell’atomo di azoto? In generale, no. Gli elettroni hanno la tendenza a stare più vicini all’azoto che ai nuclei di idrogeno, di modo che gli idrogeni sono leggermente positivi. L’ammontare effettivo di questa carica dipende dai particolari della distribuzione degli elettroni. È un problema complicato quello di capire esattamente quale sia questa distribuzione, ma, in ogni caso, il risultato finale è che la molecola di ammoniaca ha un momento di dipolo elettrico, come si vede in FIGURA 9.1. Possiamo portare avanti la nostra analisi anche senza conoscere esattamente la direzione e la grandezza dello spostamento della carica. Tuttavia, per essere coerenti con
9.2 • La molecola in un campo elettrico stazionario
© 978-8808-22107-0
la notazione di altri, supponiamo che il momento di dipolo elettrico sia µ, la cui direzione è perpendicolare al piano degli atomi di idrogeno nel senso che va dall’atomo di azoto verso il piano stesso. Quando l’azoto passa da una parte all’altra, il baricentro non si sposta, ma il momento di dipolo elettrico si inverte. In conseguenza di questo momento, l’energia della molecola in un campo elettrico E dipenderà dalla sua orientazione(2) . Con l’ipotesi che si è fatta, l’energia potenziale sarà maggiore se l’atomo di azoto punta nella direzione del campo, e minore se punta in direzione opposta; la separazione tra le due energie sarà 2µE. Fino a questo punto della discussione, abbiamo supposto di conoscere i valori di E0 e di A senza sapere come calcolarli. Secondo la teoria fisica esatta, dovrebbe essere possibile calcolare queste costanti in funzione della posizione e del movimento di tutti i nuclei e di tutti gli elettroni. Ma nessuno è mai riuscito a farlo. Questo sistema comprende dieci elettroni e quattro nuclei, ed è quindi un sistema troppo complicato. È un dato di fatto che non c’è nessuno che ne sappia più di noi su questa molecola. Tutto quello che si sa dire è che quando c’è un campo elettrico, l’energia dei due stati è differente, e la differenza è proporzionale al campo elettrico. Abbiamo posto il coefficiente di proporzionalità uguale a 2µ, ma il suo valore deve essere determinato sperimentalmente. Possiamo anche dire che la molecola ha un’ampiezza A d’inversione, ma anche questa deve essere misurata sperimentalmente. Nessuno può fornire dei valori teorici precisi di µ e di A, perché i calcoli sono troppo complicati nei dettagli. La nostra descrizione va cambiata nel caso di una molecola di ammoniaca in un campo elettrico. Se ignorassimo l’ampiezza di probabilità che la molecola passi da una configurazione all’altra, ci aspetteremmo che l’energia dei due stati | 1i e | 2i fosse (E0 ± µE ). Seguendo la procedura del precedente capitolo, poniamo H11 = E0 + µE H22 = E0
µE
(9.14)
Ammetteremo inoltre che per i campi elettrici che ci interessano questi non alterino sensibilmente la forma geometrica della molecola, e che, perciò, non muti l’ampiezza relativa al passaggio dell’azoto da una parte all’altra. Possiamo perciò supporre che H12 e H21 restino invariati in modo che H12 = H21 = A (9.15) Dobbiamo ora risolvere le equazioni hamiltoniane (8.43) con questi nuovi valori di Hi j . Potremmo risolverle esattamente come prima, ma, poiché in molte altre occasioni ci serviranno le soluzioni per un sistema a due stati, troviamo una volta per tutte le soluzioni nel caso generale per Hi j arbitrari, supponendo solo che non varino con il tempo. Vogliamo la soluzione generale della coppia di equazioni hamiltoniane i~
dC1 = H11 C1 + H12 C2 dt
(9.16)
i~
dC2 = H21 C1 + H22 C2 dt
(9.17)
Poiché si tratta di equazioni differenziali lineari con coefficienti costanti, possiamo sempre trovare soluzioni sotto forma di funzioni esponenziali della variabile indipendente t. Dapprima cerchiamo una soluzione in cui C1 e C2 abbiano la stessa dipendenza dal tempo; possiamo usare le funzioni di prova C1 = a1 e i!t C2 = a2 e (2)
i!t
Ci dispiace di dovere introdurre una nuova notazione. Poiché siamo soliti usare p ed E per indicare l’impulso e l’energia, non vogliamo usarli di nuovo per rappresentare il momento di dipolo e il campo elettrico. Ricordatevi che in questo paragrafo µ è il momento di dipolo elettrico.
121
122
Capitolo 9 • Il maser ad ammoniaca
© 978-8808-22107-0
Dato che questa soluzione corrisponde a uno stato di energia E = ~!, possiamo anche scrivere direttamente C1 = a1 e (i/~)Et (9.18) C2 = a2 e
(i/~)Et
(9.19)
dove E per ora è un’incognita che va determinata in modo da soddisfare le equazioni differenziali (9.16) e (9.17). Quando a partire dalle (9.18) e (9.19) sostituiamo C1 e C2 nelle equazioni differenziali (9.16) e (9.17), le derivate ci danno semplicemente iE/~ moltiplicato per C1 o C2 , e quindi al primo membro si ottiene semplicemente EC1 ed EC2 . Cancellando i fattori esponenziali comuni, si ottiene Ea1 = H11 a1 + H12 a2 Ea2 = H21 a1 + H22 a2 O anche, cambiando l’ordine dei vari termini, si ha (E
H11 ) a1
H21 a1 + (E
H12 a2 = 0
(9.20)
H22 ) a2 = 0
(9.21)
Un tale sistema omogeneo di equazioni algebriche, ammetterà soluzioni non nulle per a1 e a2 solo se il determinante dei coefficienti di a1 e di a2 è zero, cioè se Det *. ,
E
H12 + /=0 H22 -
H11 H21
E
(9.22)
D’altra parte, avendo a che fare con solo due equazioni in due incognite, non c’è neppure bisogno di un concetto così sofisticato. Ciascuna delle due equazioni (9.20) e (9.21) fissa il rapporto dei due coefficienti a1 e a2 , e i due rapporti devono risultare uguali. Dalla (9.20) si ha che a1 H12 = a2 E H11
(9.23)
E H22 a1 = a2 H21
(9.24)
e dalla (9.21) che
Uguagliando questi due rapporti, si ottiene che E deve soddisfare l’equazione (E
H11 ) (E
H22 )
H12 H21 = 0
Questo risultato è lo stesso che si sarebbe ottenuto risolvendo l’equazione (9.22). In ogni modo, si ha un’equazione quadratica per E che possiede due soluzioni: r H11 + H22 (H11 H22 )2 E= ± + H12 H21 (9.25) 2 4 Si hanno due possibili valori per l’energia E. Si noti che entrambe le soluzioni danno valori reali ⇤ = |H | 2 , che è reale per l’energia, in quanto H11 e H22 sono reali, e H12 H21 è uguale a H12 H12 12 e positivo. Usando la medesima convenzione di prima, indicheremo con EI l’energia più alta e con EII quella più bassa. Si ha r (H11 H22 )2 H11 + H22 EI = + + H12 H21 (9.26) 2 4 r (H11 H22 )2 H11 + H22 + H12 H21 (9.27) EII = 2 4
9.2 • La molecola in un campo elettrico stazionario
© 978-8808-22107-0
Ponendo separatamente questi due valori per l’energia nelle equazioni (9.18) e (9.19), si ottengono le ampiezze per i due stati stazionari (cioè gli stati a energia definita). Se non ci sono perturbazioni esterne, un sistema inizialmente in uno di questi stati, vi rimarrà per sempre, e solo la sua fase varierà. Possiamo controllare i nostri risultati in due casi particolari. Se H12 = H21 = 0, si ha EI = H11 ed EII = H22 . Questo è certamente corretto, perché, in tal caso, le equazioni (9.16) e (9.17) non sono accoppiate, e ciascuna di esse rappresenta uno stato di energia H11 e H22 . Inoltre, se poniamo H11 = H22 = E0 H21 = H12 = A riotteniamo la soluzione di prima: EI = E0 + A EII = E0
A
In generale, le due soluzioni EI ed EII si riferiscono a due stati, che indicheremo nuovamente come | I i = | Ii e (i/~)EI t |
II i
= | IIi e
(i/~)EII t
Questi stati corrisponderanno a C1 e C2 dati dalle equazioni (9.18) e (9.19), dove a1 e a2 sono ancora da determinare. Il loro rapporto è dato dalla (9.23) oppure dalla (9.24). Devono anche soddisfare un’altra condizione. Se si sa che il sistema è in uno degli stati stazionari, la somma delle probabilità di trovarlo in | 1i oppure in | 2i deve essere uguale a uno. Si deve avere che
oppure, ciò che è equivalente,
|C1 | 2 + |C2 | 2 = 1
(9.28)
|a1 | 2 + |a2 | 2 = 1
(9.29)
Queste condizioni non specificano univocamente a1 e a2 ; queste risultano ancora indeterminate per una fase arbitraria, in altre parole per un fattore come ei . Per quanto sia possibile scrivere le soluzioni generali per le a(3) , è di solito più conveniente trovarle per ciascun caso particolare. Ritorniamo ora al nostro esempio specifico della molecola di ammoniaca in un campo elettrico. Specificando i valori di H11 , H22 e H12 secondo la (9.14) e la (9.15), si ottengono le energie dei due stati stazionari q EI = E0 + A2 + µ2 E2 (9.30) q 2 2 2 EII = E0 A +µ E
Queste due energie sono rappresentate in funzione dell’intensità del campo elettrico E nella FIGU9.2. Quando il campo elettrico è zero le due energie sono ovviamente uguali a E0 ± A. Quando si applica un campo elettrico, la separazione tra i due livelli aumenta. Quest’ultima dapprima aumenta lentamente con E, ma alla fine diventa proporzionale a E. (La curva è un’iperbole.) Per campi enormemente grandi, le energie diventano semplicemente RA
EI = E0 + µE = H11 EII = E0
(9.31)
µE = H22
Il fatto che l’azoto abbia una certa ampiezza di probabilità di andare avanti e indietro ha poca importanza quando i due livelli hanno un’energia molto differente. Questo è un punto interessante sul quale ritorneremo nuovamente più avanti. (3)
Per esempio, come si verifica facilmente, la seguente è una soluzione accettabile: a1 =
[(E
H12 H11 )2 + H12 H21 ]1/2
a2 =
[(E
E H11 H11 )2 + H12 H21 ]1/2
123
124
Capitolo 9 • Il maser ad ammoniaca
© 978-8808-22107-0
9.2 Livelli di energia della molecola di ammoniaca in un campo elettrico. FIGURA
1
2
3
4
Finalmente siamo in grado di capire il funzionamento di un maser ad ammoniaca. L’idea è la seguente. Anzitutto bisogna trovare un sistema per separare le molecole nello stato | Ii da quelle nello stato | IIi(4) . Dopo ciò le molecole nello stato con energia più alta vengono fatte passare attraverso una cavità di frequenza risonante pari a 24 000 megacicli. Le molecole possono cedere energia alla cavità, in un modo che discuteremo più avanti, e lasciano la cavità nello stato | IIi. Ogni molecola che compie una tale transizione cederà alla cavità un’energia E = EI EII . L’energia perduta dalle molecole apparirà come energia elettrica nella cavità. Come possiamo separare i due stati molecolari? Un possibile sistema è il seguente. Il gas di ammoniaca viene fatto uscire da un piccolo orifizio e inviato attraverso una coppia di fenditure in modo da ottenere un fascetto, II come si vede in FIGURA 9.3. Quindi quest’ultimo viene fatto passare attraverso una regione in cui agisce un forte campo elettrico trasversale. Gli NH3 elettrodi cui si deve il campo sono sagomati in modo che il campo elettrico stesso vari rapidamente attraverso il fascio. In tale maniera il quadrato del I campo elettrico E · E avrà un forte gradiente ortogonale al fascio. Poiché Fenditure una molecola nello stato | Ii ha un’energia che cresce con E2 , questa parte crescente del fascio sarà deflessa verso la regione dove E2 è minore. Viceversa, una molecola nello stato | IIi sarà deflessa verso la regione in cui E2 è maggiore, FIGURA 9.3 Il fascio di ammoniaca può essere poiché la sua energia decresce quando E2 aumenta. suddiviso da un campo elettrico in cui E2 ha un gradiente perpendicolare al fascio. Per inciso, con i campi elettrici che si possono generare in laboratorio, l’energia µE risulta sempre molto minore di A. In tali condizioni, la radice quadrata che compare nelle equazioni (9.30) può essere approssimata da 1 µ2 E2 + A *1 + 2 A2 ,
(9.32)
Quindi, a tutti gli effetti pratici, i livelli energetici risultano: EI = E0 + A +
µ2 E2 2A
(4) D’ora in poi, scriveremo | Ii e | IIi invece di | I i e | II i. Si ricordi che gli stati effettivi | base a energia fissata moltiplicati per l’opportuno fattore esponenziale.
(9.33)
Ii
e|
II i
sono gli stati di
125
9.3 • Transizioni in un campo dipendente dal tempo
© 978-8808-22107-0
µ2 E2 (9.34) 2A Le energie variano quindi in modo approssimativamente lineare con E2 . Ne consegue che la forza agente sulle molecole è µ2 rE2 (9.35) F= 2A Molte molecole in un campo elettrico hanno un’energia proporzionale a E2 . Il coefficiente è la polarizzabilità della molecola. L’ammoniaca ha una polarizzabilità eccezionalmente alta a causa del piccolo valore di A che compare nel denominatore. Quindi, le molecole di ammoniaca sono particolarmente sensibili all’azione di un campo elettrico. (Come prevedete che sarà la costante dielettrica del gas NH3 ?) EII = E0
9.3
A
Transizioni in un campo dipendente dal tempo
Nel maser ad ammoniaca, il fascio contenente le molecole nello stato | Ii di energia EI viene inviato attraverso una cavità risonante, come si vede in FIGURA 9.4. L’altro fascio viene scartato. Dentro la cavità ci sarà un campo elettrico variabile nel tempo, e quindi la questione che ora si pone riguarda il comportamento di una molecola sottoposta a un campo elettrico che varia con il tempo. Si tratta di un problema completamente diverso dal precedente, in cui si ha a che fare con un’hamiltoniana che varia con il tempo. Poiché gli Hi j dipendono da E, essi verranno a dipendere dal tempo, e si deve determinare il comportamento del sistema in questa situazione. Per prima cosa, cominciamo a scrivere le equazioni da risolvere: i~
dC1 = (E0 + µE) C1 dt
dC2 i~ = AC1 + (E0 dt
AC2 (9.36) µE) C2
Per essere concreti, supponiamo che il campo elettrico vari sinusoidalmente; si può allora scrivere ⇣ ⌘ E = 2E0 cos !t = E0 ei!t + e i!t (9.37)
Per l’effettivo funzionamento, la frequenza ! dovrà essere quasi uguale alla frequenza risonante della transizione molecolare !0 = 2A/~, ma per ora vogliamo trattare il caso generale, e perciò non ne specificheremo in alcun modo il valore. Il modo migliore di risolvere le nostre equazioni è quello di formare opportune combinazioni lineari di C1 e C2 , come abbiamo fatto in precedenza. Sommiamo perciò le due equazioni, dividiamo per la radice quadrata di 2, e usiamo le definizioni di CI e CII stabilite con l’equazione (9.13). Si ottiene i~
dCII = (E0 dt
(9.38)
A) CII + µECI
II Cavità del maser a frequenza
Tutto II
I
v
Campo elettrico
9.4 Diagramma schematico del maser ad ammoniaca. FIGURA
vT
126
Capitolo 9 • Il maser ad ammoniaca
© 978-8808-22107-0
Noterete come questa equazione sia la stessa della (9.9) con l’aggiunta di un termine dovuto al campo elettrico. Analogamente, se si sottraggono le due equazioni (9.36), si ottiene i~
dCI = (E0 + A) CI + µECII dt
(9.39)
Il problema che ora si pone è quello di risolvere queste equazioni. Queste sono più difficili di quelle di prima perché ora E dipende da t; e, infatti, per un E(t) qualsiasi la soluzione non è esprimibile con funzioni elementari. Si può però ottenere una buona approssimazione finché il campo elettrico è piccolo. Anzitutto scriviamo CI = CII =
I
i(E0 +A)t/~
e II
e
=
i(E0 A)t/~
I
=
e
i(EI )t/~
II
e
(9.40)
i(EII )t/~
Se non ci fosse il campo elettrico, queste sarebbero le soluzioni giuste con I e II uguali a due costanti complesse. Infatti, poiché la probabilità di essere nello stato | Ii è il modulo quadrato di CI , e la probabilità di essere nello stato | IIi è il modulo quadrato di CII , la probabilità di essere nello stato | Ii o nello stato | IIi non è altro che | I | 2 o | II | 2 . Per esempio, se il sistema era in origine nello stato | IIi, di modo che I era 0 e | II | 2 era 1, questa situazione si sarebbe protratta indefinitamente. Se originariamente la molecola si fosse trovata nello stato | IIi non ci sarebbe stata alcuna possibilità per quest’ultima di passare nello stato | Ii. L’idea di scrivere le nostre equazioni nella forma dell’equazione (9.40) si basa sulla considerazione che se µE è piccolo rispetto ad A, le soluzioni avranno ancora questa forma, solo che in tale caso I e II saranno delle funzioni lentamente variabili nel tempo, dove con «lentamente variabili» s’intende lentamente rispetto alle funzioni esponenziali. Questo è il trucco. Si sfrutta il fatto che I e II siano lentamente variabili per ottenere una soluzione approssimata. Vogliamo ora ricavare C1 dalla (9.40) e sostituirlo nell’equazione differenziale (9.39), ma dobbiamo ricordarci, nel far questo, che I è anch’essa una funzione di t. Si ottiene i~
dCI = EI dt
L’equazione differenziale diviene ! d I EI I + i~ e dt
I
(i/~)EI t
e
iEI t/~
= EI
I
Analogamente, l’equazione in dCI I /dt diviene ! d II EII II + i~ e (i/~)EII t = EII dt
+ i~
d I e dt
e
(i/~)EI t
II
e
iEI t/~
+ µE
(i/~)EII t
II
e
+ µE
I
(i/~)EII t
e
(i/~)EI t
(9.41)
(9.42)
Noterete ora che si hanno termini uguali a entrambi i membri delle due equazioni. Cancelliamo questi termini, e moltiplichiamo allo stesso tempo la prima equazione per e+iEI t/~ e la seconda per e+iEII t/~ . Ricordando che (EI EII ) = 2A = ~!0 si ha infine i~
d I = µE(t) ei!0 t dt
II
(9.43) d II i!0 t i~ = µE(t) e I dt Siamo così giunti a una coppia di equazioni apparentemente semplici, le quali sono ancora del tutto esatte, naturalmente. La derivata della prima funzione incognita è uguale a una funzione del tempo µE(t) ei!0 t , moltiplicata per la seconda funzione incognita; la derivata della seconda è uguale a un’analoga funzione del tempo moltiplicata per la prima incognita. Per quanto queste equazioni non possano essere risolte in generale, noi ne daremo la soluzione in qualche caso particolare.
9.4 • Transizioni alla risonanza
© 978-8808-22107-0
Almeno per il momento, siamo interessati solo al caso che il campo elettrico sia una funzione oscillante. Prendendo E(t) come nell’equazione (9.37), si ottengono per I e II le seguenti equazioni: ⇣ ⌘ d I i~ = µE0 ei(!+!0 )t + e i(! !0 )t II dt (9.44) ⇣ ⌘ d II i(! !0 )t i(!+!0 )t i~ = µE0 e +e I dt Se ora E0 è sufficientemente piccolo, le variazioni di I e II saranno anch’esse piccole. Le due non varieranno molto con il tempo, specialmente se confrontate con le rapide variazioni dovute ai termini esponenziali. Questi esponenziali hanno parti reali e immaginarie che oscillano con frequenze ! + !0 oppure ! !0 . I termini con ! + !0 oscillano molto rapidamente intorno al valore medio zero, e perciò non danno un grande contributo in media alla derivata di . Si ottiene quindi un’approssimazione ragionevole sostituendo a questi termini il loro valore medio, cioè zero. Li toglieremo quindi di mezzo, e prenderemo come equazioni approssimate le seguenti: i~
d I = µE0 e dt
i(! !0 )t
d II i~ = µE0 ei(! dt
II
(9.45) !0 )t
I
Anche i termini restanti, i cui esponenti sono proporzionali a (! !0 ), varieranno molto rapidamente a meno che ! non sia vicino a !0 . Solo in questo caso il secondo membro varierà abbastanza lentamente così da contribuire in maniera apprezzabile all’integrale in t delle equazioni. In altre parole, se il campo elettrico è debole, le sole frequenze significative sono quelle prossime a !0 . Nelle approssimazioni fatte per ottenere l’equazione (9.45), le equazioni possono essere risolte esattamente, ma i calcoli sono piuttosto laboriosi, e pertanto non li affronteremo, finché non ci troveremo di fronte a un altro problema dello stesso tipo. Per ora ci accontenteremo di trovare una soluzione approssimata, o meglio una soluzione esatta nel caso di una perfetta risonanza, ! = !0 , e una soluzione approssimata per frequenze vicine alla risonanza.
9.4
Transizioni alla risonanza
Cominciamo dal caso di una risonanza perfetta. Se si pone ! = !0 , gli esponenziali sono uguali a uno in entrambe le equazioni (9.45), e si ha d I i µE0 = dt ~ d II i µE0 = dt ~
II
(9.46) I
Eliminando prima I e poi II da queste equazioni, si trova che ciascuno di questi soddisfa all’equazione differenziale del moto armonico semplice: !2 d2 µE0 = (9.47) ~ dt 2 Le soluzioni generali di queste equazioni possono essere ottenute come sovrapposizioni di seni e coseni. Come potete verificare facilmente si ha una soluzione per ! ! µE0 µE0 t + b sen t I = a cos ~ ~ (9.48) ! ! µE0 µE0 t ia sen t II = ib cos ~ ~
127
128
9.5 Probabilità dei due stati di una molecola di ammoniaca in un campo elettrico sinusoidale.
Capitolo 9 • Il maser ad ammoniaca
© 978-8808-22107-0
FIGURA
P 1 PI
PII 0 0
1
2
t
dove a e b sono costanti da determinarsi in ogni caso specifico in base alle condizioni fisiche. Per esempio, supponiamo che per t = 0, la nostra molecola si trovi nello stato | Ii di energia più alta, il che comporta, in base all’equazione (9.40), che I = 1 e II = 0 per t = 0. In questo caso, dovremmo porre a = 1 e b = 0. La probabilità di trovare la molecola nello stato | Ii a un certo istante t successivo è il modulo quadrato di I , ossia ! 2 2 µE0 PI = | I | = cos t (9.49) ~ Analogamente, la probabilità di trovare la molecola nello stato | IIi è data dal modulo quadrato di II : ! 2 2 µE0 PII = | II | = sen t (9.50) ~
Fin quando E è piccolo e si è alla risonanza, le probabilità sono espresse da semplici funzioni oscillanti. La probabilità di trovare la molecola nello stato | Ii passa da uno a zero e poi ancora a uno, mentre la probabilità di trovarla nello stato | IIi passa da zero a uno e così via. La FIGURA 9.5 mostra l’andamento nel tempo delle due probabilità. Inutile dire che la somma delle due probabilità è sempre uguale a uno; la molecola deve sempre essere in qualche stato! Ammettiamo che la molecola impieghi un tempo T per attraversare la cavità. Se scegliamo la lunghezza della cavità in modo che µE0T ⇡ = ~ 2 allora una molecola che al momento di entrare nella cavità si trovi nello stato | Ii, si troverà certamente nello stato | IIi all’uscita. Se entra nella cavità stando nello stato più alto, ne uscirà stando nello stato più basso. In altre parole, la sua energia diminuisce, e questa differenza di energia non può finire altro che nel meccanismo che genera il campo. Non è semplice farvi vedere in dettaglio come l’energia della molecola passa ad alimentare le oscillazioni della cavità; a ogni modo non c’è bisogno di studiare questi particolari, in quanto si può usare il principio della conservazione dell’energia. (Volendo, si potrebbe fare questa analisi, ma per fare ciò dovremmo considerare anche la quantizzazione del campo della cavità, oltre che quella dell’atomo.) Riassumendo: la molecola entra nella cavità, il campo dentro quest’ultima, oscillando con la giusta frequenza, induce delle transizioni dallo stato più alto a quello più basso, e l’energia ottenuta passa al campo oscillante. Durante il funzionamento del maser, le molecole cedono un’energia sufficiente a mantenere le oscillazioni della cavità; non solo, ma oltre a fornire la potenza necessaria a compensare le perdite della cavità, esse cedono un sovrappiù di energia che può essere estratto dalla cavità. In tal modo, l’energia delle molecole viene convertita in energia del campo elettromagnetico esterno. Ricorderete che prima che il fascio entri nella cavità, occorre usare un filtro che lo analizzi facendo passare solo le molecole nello stato superiore. È facile dimostrare che se si parte da molecole nello stato più basso, il processo va in senso inverso e la cavità perde energia. Se poi si fa entrare il fascio non polarizzato, ci saranno tante molecole che acquistano energia e altrettante
9.5 • Transizioni lontano dalla risonanza
© 978-8808-22107-0
129
che la perdono, cosicché non succede niente di particolare. Naturalmente, per il funzionamento del dispositivo, non è necessario che µE0T/~ sia esattamente uguale a ⇡/2. Per un qualsiasi altro valore (escluso un multiplo intero di ⇡), si ha una certa probabilità di transizione dallo stato | Ii allo stato | IIi. Per questi altri valori, però, il rendimento del dispositivo non è del 100%; molte delle molecole che lasciano la cavità avrebbero potuto cedere dell’energia ma non l’hanno fatto. Nella situazione reale, la velocità delle molecole non è la stessa per tutte; esse avranno una certa distribuzione di Maxwell. Ciò significa che il periodo ideale è differente per le varie molecole, ed è quindi impossibile ottenere il rendimento del 100% simultaneamente per tutte le molecole. Inoltre si ha un’ulteriore complicazione cui è facile ovviare, ma della quale non vogliamo occuparci in questo momento. Vi ricorderete che il campo elettrico all’interno di una cavità in generale varia da punto a punto. Quindi, mentre le molecole viaggiano attraverso la cavità, sono soggette a un campo elettrico che varia nel tempo in un modo più complesso che non quello delle semplici oscillazioni sinusoidali che abbiamo supposto. È chiaro che per risolvere esattamente il problema bisognerebbe ricorrere a un’integrazione più complicata, ma il procedimento generale è sempre lo stesso. Ci sono altre maniere di realizzare un maser. Invece di separare gli atomi nello stato | Ii da quelli nello stato | IIi per mezzo di un apparecchio di Stern-Gerlach, si può partire da atomi già contenuti nella cavità (come un gas o un solido) e far passare in qualche modo gli atomi dallo stato | IIi allo stato | Ii. Un esempio di tale sistema lo si ha nel cosiddetto maser a tre stati. In tale caso, si usano sistemi atomici che hanno tre livelli energetici, come in FIGURA 9.6, con le seguenti proprietà particolari. Il sistema, assorbendo radiazione (diciamo, luce) di frequenza ~!1 , passa dallo stato di energia minima EII a un qualche stato di energia più alta E 0, ed emette quindi rapidamente dei fotoni di frequenza ~!2 e passa E nello stato con energia EI . Lo stato | Ii ha una lunga vita media in modo E' che la sua popolazione può essere aumentata, raggiungendo le condizioni adatte al funzionamento di un maser tra gli stati | Ii e | IIi. Per quanto un ω1 ω2 tale apparecchio si chiami maser a «tre stati», il suo funzionamento è, in realtà, esattamente uguale a quello di un sistema a due stati come quello che abbiamo descritto. EI Un laser (Light Amplification by Stimulated Emission of Radiation, ω0 Amplificazione di Luce tramite Emissione Stimolata di Radiazione) non EII è che un maser che funziona a frequenze ottiche. In generale la «cavità» di un laser consiste in due specchi piani tra i quali vengono generate onde stazionarie. FIGURA 9.6 I livelli di energia di un maser a «tre stati».
9.5
Transizioni lontano dalla risonanza
Per finire, vogliamo determinare come cambiano gli stati nel caso che la frequenza della cavità sia quasi, ma non esattamente, uguale a !0 . Si potrebbe risolvere questo problema esattamente, ma, invece di prendere questa strada, considereremo il caso particolarmente importante in cui il campo elettrico sia piccolo, e in cui anche il periodo di tempo T sia breve, in modo che il prodotto µE0T/~ sia molto minore di 1. In tale situazione, anche nel caso di esatta risonanza che abbiamo appena trattato, la probabilità di compiere una transizione è piccola. Ammettiamo ancora una volta di partire con I = 1 e II = 0. Durante il tempo T ci aspettiamo che I rimanga quasi uguale a 1, e che II si mantenga molto piccolo rispetto all’unità. In queste circostanze il problema è molto semplice. Possiamo calcolare II dalla seconda equazione (9.45), prendendo I uguale a 1 e integrando da t = 0 a t = T. Si ottiene II
=
µE0 * 1 ei(! !0 )T + ~ , ! !0 -
(9.51)
Questa espressione per II , posta nell’equazione (9.40), ci dà l’ampiezza relativa a una transizione dallo stato | Ii allo stato | IIi durante l’intervallo di tempo T. La probabilità P(I ! II) che si compia
130
Capitolo 9 • Il maser ad ammoniaca
la transizione è |
II |
2,
© 978-8808-22107-0
ossia µE0T P(I ! II) = | II | = ~ 2
!2
⇥ ⇤ sen2 (! !0 ) T/2 ⇥ ⇤2 (! !0 ) T/2
(9.52)
È interessante fare un grafico di questa probabilità per un fissato intervallo di tempo in funzione della frequenza della cavità, per vedere come essa sia sensibile alle variazioni di frequenza in prossimità della frequenza di risonanza !0 . Questo grafico di P(I ! II) è mostrato in FIGURA 9.7. (La scala verticale è stata scelta in modo che il valore 1 corrisponda al picco, il che si ottiene dividendo per il valore della probabilità per ! = !0 .) Abbiamo già visto una curva come questa studiando la teoria della diffrazione, quindi vi dovrebbe già essere familiare. La curva precipita a zero piuttosto rapidamente per (! !0 ) = 2⇡/T e non raggiunge più valori significativi per grandi deviazioni della frequenza. Infatti, la maggior parte dell’area totale sottesa dalla curva è compresa nell’intervallo ±⇡/T. È possibile mostrare(5) che l’area compresa sotto la curva è uguale proprio a 2⇡/T, ed è uguale all’area del rettangolo tratteggiato che si vede in figura. Esaminiamo le conseguenze dei nostri risultati per il funzionamento di un maser reale. Supponiamo che la molecola di ammoniaca resti nella cavità per un ragionevole intervallo di tempo, diciamo un millisecondo. Allora per f 0 = 24 000 megacicli, si può calcolare che la probabilità di transizione cade a zero per una deviazione di frequenza pari a f
f0 f0
=
1 T f0
ovvero uguale a cinque parti su 108 . Evidentemente, la frequenza deve essere molto vicina a !0 per ottenere una probabilità di transizione significativa. Questo effetto è alla base della grande precisione che si può ottenere con gli orologi «atomici», che funzionano sfruttando il principio del maser.
9.6
L’assorbimento della luce
La trattazione precedente si applica a una situazione più generale del maser ad ammoniaca. Abbiamo studiato il comportamento di una molecola sottoposta all’influenza di un campo elettrico, sia questo confinato a una cavità o meno. Potremmo semplicemente illuminare le molecole con un raggio di «luce» con la frequenza delle microonde, e chiederci quale sia la probabilità di emissione o di assorbimento. Le nostre equazioni continuano a valere anche in questo caso, ma è meglio riformularle in funzione dell’intensità della radiazione piuttosto che del campo elettrico. Se definiamo l’intensità I come il flusso medio di energia per unità di superficie per secondo, allora, in accordo con quanto visto nel cap. 27 del vol. 2, possiamo scrivere I = ✏ 0 c2 |E ⇥ B|med =
1 ✏ 0 c2 |E ⇥ B|max = 2✏ 0 cE20 2
(Il valore massimo di E è 2E0 .) La probabilità di transizione diviene ora ⇥ ⇤ 2 sen2 (! !0 ) T/2 µ 2 +IT ⇥ P(I ! II) = 2⇡ * ⇤2 2 (! !0 ) T/2 , 4⇡✏ 0 ~ c -
(9.53)
In genere, la luce che incide su questo sistema non sarà esattamente monocromatica. È perciò interessante risolvere un altro problema, cioè quello di calcolare la probabilità di transizione quando la luce ha un’intensità I(!) per intervallo unitario di frequenza, su una banda abbastanza (5)
Usando la formula
⌅
1 1
sen2 x dx = ⇡ x2
9.6 • L’assorbimento della luce
© 978-8808-22107-0
1
1/2
π/T 2π/T
0
ω0
ω
9.7 Probabilità di transizione per una molecola di ammoniaca in funzione della frequenza. FIGURA
9.8 L’intensità spettrale I(ω) può essere approssimata con il suo valore a ω0 . FIGURA
ampia che includa !0 . In tal caso, la probabilità di passare da | Ii a | IIi diventa uguale a un integrale: ⇥ ⇤ ⌅ sen2 (! !0 ) T/2 µ2 + 2 1 * P(I ! II) = 2⇡ T I(!) ⇥ (9.54) ⇤2 d! 2 0 (! !0 ) T/2 , 4⇡✏ 0 ~ c -
Di solito I(!) varierà molto più lentamente con ! che non il termine risonante con il suo picco molto pronunciato. Le due funzioni possono apparire come in FIGURA 9.8. In tali casi si può sostituire a I(!) il suo valore I(!0 ) nel centro del picco di risonanza e portarlo fuori dall’integrale. Ciò che rimane non è altro che l’integrale della curva in FIGURA 9.7, che, come abbiamo visto, è uguale a 2⇡/T. Si ottiene il risultato che µ2 + P(I ! II) = 4⇡ 2 * I(!0 )T 2c 4⇡✏ ~ 0 , -
(9.55)
Questo risultato è molto importante, perché costituisce la teoria generale dell’assorbimento della luce da parte di qualsiasi sistema atomico o molecolare. Per quanto noi avessimo cominciato con il considerare un caso in cui lo stato | Ii aveva un’energia maggiore dello stato | IIi, in realtà nessuno dei nostri ragionamenti dipende da questo fatto. L’equazione (9.55) è ancora valida se lo stato | Ii ha un’energia inferiore allo stato | IIi; in tal caso, P(I ! II) rappresenta la probabilità di una transizione con assorbimento di energia dall’onda elettromagnetica incidente. L’assorbimento di luce da parte di un qualsiasi sistema atomico comporta sempre un’ampiezza di transizione indotta da un campo elettrico oscillante tra due stati separati da un’energia E = ~!0 . Per ogni caso particolare, la si ottiene proprio nel modo che abbiamo visto, e si giunge a un’espressione del tipo dell’equazione (9.55). Vogliamo perciò sottolineare le seguenti caratteristiche di questo risultato. In primo luogo, la probabilità è proporzionale a T. In altri termini, si ha una probabilità costante per unità di tempo che avvenga la transizione. In secondo luogo, questa probabilità è proporzionale all’intensità della luce incidente sul sistema. Infine, la probabilità di transizione è proporzionale a µ2 , dove, come ricorderete, µE era definito come lo spostamento di energia dovuto al campo elettrico. In conseguenza di ciò, µE compariva anche nelle equazioni (9.38) e (9.39) come il termine di accoppiamento responsabile della transizione tra gli stati | Ii e | IIi, che altrimenti sarebbero stati stazionari. In altri termini, per i piccoli valori di E che stiamo considerando, µE è il cosiddetto «termine di perturbazione» nell’elemento di matrice hamiltoniana che connette gli stati | Ii e | IIi. Nel caso più generale, si avrebbe al posto di µE, l’elemento di matrice hII | H | Ii (vedi paragrafo 5.6).
131
132
Capitolo 9 • Il maser ad ammoniaca
© 978-8808-22107-0
Nel paragrafo 42.5 del vol. 1 abbiamo parlato delle relazioni che ci sono tra l’assorbimento della luce, l’emissione indotta e quella spontanea in funzione dei coefficienti A e B di Einstein. Infine, ora abbiamo trovato il procedimento che si segue in meccanica quantistica per calcolare questi coefficienti. La quantità che abbiamo indicato con P(I ! II) per la nostra molecola di ammoniaca a due stati corrisponde precisamente al coefficiente di assorbimento Bnm della teoria della radiazione di Einstein. Nel caso della molecola di ammoniaca, che è un sistema così complicato che nessuno è in grado di farci dei calcoli sopra, abbiamo posto l’elemento di matrice, hII | H | Ii uguale a µE, aggiungendo che µ andava ricavato dall’esperienza. Per sistemi atomici più semplici, il coefficiente µmn relativo a una particolare transizione si può ricavare dalla definizione µmn E = hm | H | ni = Hmn (9.56) dove Hmn è l’elemento di matrice dell’hamiltoniana che include gli effetti di un campo elettrico debole. Il µmn ricavato in questo modo si dice elemento di matrice del dipolo elettrico. La teoria quantistica dell’assorbimento e dell’emissione della luce si riduce perciò alla valutazione di questi elementi di matrice per particolari sistemi atomici. Il nostro studio di un semplice sistema a due stati ci ha così condotti alla comprensione del problema generale dell’assorbimento e dell’emissione della luce.
10
Altri sistemi a due stati
10.1
Lo ione di idrogeno molecolare
Nel capitolo precedente abbiamo discusso alcune proprietà della molecola di ammoniaca, nell’approssimazione che consiste nel considerarla un sistema a due stati. Naturalmente, essa non è in realtà un sistema a due stati; vi sono anche molti stati di rotazione, vibrazione, traslazione e via di seguito, ma ciascuno di questi stati di moto deve essere ancora sdoppiato nei due stati interni dovuti all’andirivieni dell’atomo di azoto. Adesso ci accingiamo a prendere in esame altri sistemi che, con una certa approssimazione, possono essere considerati dei sistemi a due stati. Ci saranno molte approssimazioni, poiché vi sono sempre molti altri stati che dovrebbero venire presi in considerazione in un’analisi più precisa. Tuttavia, in ognuno di questi esempi, riusciremo ugualmente a capire un bel po’ di cose, semplicemente riferendoci a due stati soltanto. Visto che tratteremo solo sistemi a due stati, l’hamiltoniana, di cui avremo bisogno, si presenterà proprio come quella che abbiamo utilizzato nel capitolo precedente. Quando l’hamiltoniana è indipendente dal tempo, sappiamo che vi sono due stati stazionari con energie definite e, almeno di solito, differenti. Tuttavia noi, in generale, svilupperemo la nostra analisi a partire da un insieme di stati di base che non coincide con questi stati stazionari, ma è invece composto da stati che eventualmente hanno qualche altro significato fisico semplice. In tal caso gli stati stazionari del sistema saranno rappresentati come combinazioni lineari di questi stati di base. Per comodità, riassumeremo ora le equazioni importanti del capitolo 9. Indichiamo gli stati di base che abbiamo scelto inizialmente con | 1i e | 2i. Di conseguenza, ogni stato | i è rappresentato dalla combinazione lineare | i = | 1i h1 | i + | 2i h2 | i = | 1i C1 + | 2i C2
(10.1)
Le ampiezze Ci (intendendo con questo sia C1 sia C2 ) soddisfano le due equazioni differenziali lineari dCi X i~ = Hi j C j (10.2) dt j
dove sia i sia j assumono i valori 1 e 2. Quando i termini dell’hamiltoniana Hi j non dipendono da t, i due stati di energia definita (gli stati stazionari), che indicheremo con |
Ii
= | Ii e
|
II i
= | IIi e
(i/~)EI t (i/~)EII t
possiedono le energie H11 + H22 EI = + 2 EII =
H11 + H22 2
r✓ r✓
2
H22 ◆ 2
+ H12 H21
2
H22 ◆ 2
+ H12 H21
H11 H11
(10.3)
134
Capitolo 10 • Altri sistemi a due stati
© 978-8808-22107-0
I due C di ciascuno di tali stati hanno la stessa dipendenza dal tempo. I vettori di stato | Ii e | IIi, che si riferiscono agli stati stazionari, sono connessi ai nostri stati di base originali | 1i e | 2i da | Ii = | 1i a1 + | 2i a2 | IIi = | 1i a10 + | 2i a20
(10.4)
Le a sono costanti complesse, che soddisfano le relazioni |a1 | 2 + |a2 | 2 = 1 a1 H12 = a2 EI H11
(10.5)
|a10 | 2 + |a20 | 2 = 1 a10 H12 = 0 a2 EII H11
(10.6)
Se H11 e H22 sono uguali tra loro – diciamo che siano entrambi uguali a E0 – e H12 = H21 = A, allora EI = E0 + A EI I = E0
A
e gli stati | Ii e | IIi risultano particolarmente semplici: 1 ⇣ | Ii = p | 1i 2
| 2i
⌘
⌘ 1 ⇣ | IIi = p | 1i + | 2i 2
(10.7)
Faremo ora uso di questi risultati per discutere un certo numero di esempi interessanti tratti dalla fisica e dalla chimica. Il primo esempio è quello Protone dello ione di idrogeno molecolare. Una molecola di idrogeno ionizzato + + positivamente consiste in due protoni e in un elettrone che circola attorno a essi. Quali sono gli stati che ci aspettiamo per questo sistema quando i protoni sono molto distanziati? La risposta è piuttosto chiara: l’elettrone se ne starà vicino a uno dei protoni formando un atomo di idrogeno nel suo stato più basso, mentre l’altro protone resterà solo, apparendo come uno + + ione positivo. Perciò, se i due protoni sono molto lontani l’uno dall’altro, possiamo visualizzare uno stato fisico in cui l’elettrone è «attaccato» a uno dei protoni. Ovviamente, vi è un altro stato, simmetrico a questo, in cui l’elettrone si trova nelle vicinanze dell’altro protone, e il primo protone FIGURA 10.1 Un insieme di stati di base per due è quello che appare come uno ione. Prenderemo questi come insieme protoni e un elettrone. di stati di base e li indicheremo con | 1i e | 2i. Tali stati sono mostrati schematicamente in FIGURA 10.1. Nella realtà, vi sono ovviamente molti stati possibili con un elettrone nelle vicinanze di un protone, perché tale combinazione può aver luogo in uno qualsiasi degli stati eccitati dell’atomo di idrogeno. Ma ora a noi non interessa tutta questa varietà di stati; prenderemo in esame soltanto la situazione in cui l’atomo di idrogeno è nel suo stato più basso, lo stato fondamentale, e, per il momento, trascureremo lo spin dell’elettrone. Possiamo, per esempio, supporre che in tutti i nostri stati l’elettrone abbia lo spin «su» rispetto all’asse z (1) . Sappiamo che per estrarre un elettrone da un atomo di idrogeno sono necessari 13,6 eV di energia. Finché i due protoni dello ione di idrogeno molecolare sono ben distanziati, per avere l’elettrone più o meno Elettrone
(1)
Questa approssimazione è soddisfacente finché non vi siano campi magnetici di una certa importanza. Gli effetti dei campi magnetici sull’elettrone saranno discussi più avanti in questo capitolo, e i piccolissimi effetti dovuti allo spin nell’atomo di idrogeno nel capitolo 12.
© 978-8808-22107-0
10.1 • Lo ione di idrogeno molecolare
135
nel punto a metà strada tra i due protoni è sempre necessaria all’incirca questa energia, che per le nostre attuali considerazioni è un bel po’ di energia. Perciò, classicamente, sarebbe impossibile per l’elettrone saltare da un protone all’altro. Tuttavia, ciò è possibile in meccanica quantistica, per quanto non molto probabile. Esiste cioè una piccola ampiezza corrispondente al passaggio dell’elettrone da un protone all’altro. Di conseguenza, in prima approssimazione, ciascuno dei nostri stati di base | 1i e | 2i avrà energia E0 , cioè proprio l’energia di un atomo di idrogeno più un protone. Possiamo ammettere che gli elementi H11 e H22 della matrice hamiltoniana siano entrambi approssimativamente uguali a E0 . Gli altri elementi della matrice, H12 e H21 , che ci danno le ampiezze corrispondenti ai movimenti avanti e indietro dell’elettrone, li indicheremo ancora con A. Vedete quindi che questo è lo stesso gioco a cui abbiamo giocato nei due precedenti capitoli. Se trascuriamo il fatto che l’elettrone può saltare avanti e indietro, ci troviamo ad avere due stati esattamente della stessa energia. Questa però si suddividerà in due livelli energetici a causa della possibilità che l’elettrone ha di andare avanti e indietro, e, quanto maggiore sarà la probabilità di transizione, tanto maggiore sarà la separazione tra i due livelli. In conclusione, i due livelli energetici del sistema sono E0 + A ed E0 A, e gli stati che hanno queste ben definite energie sono dati dalle equazioni (10.7). Dalla nostra soluzione vediamo che se un protone e un atomo d’idrogeno sono posti in qualche modo l’uno accanto all’altro, l’elettrone non rimarrà vicino a uno dei protoni, ma salterà avanti e indietro tra essi. Se all’inizio si trova vicino a uno dei due, oscillerà di continuo tra gli stati | 1i e | 2i, dando luogo a una soluzione che varia col tempo. Per ottenere la soluzione con la minima energia (che non varia col tempo), è necessario partire con il sistema in uno stato con uguali ampiezze di probabilità dell’elettrone di trovarsi vicino a ciascuno dei due protoni. Ricordate che non vi sono due elettroni e che non stiamo quindi dicendo che vi è un elettrone attorno a p ciascun protone. Vi è un elettrone soltanto ed è lui che ha la stessa ampiezza – di modulo 1/ 2 – di trovarsi in ciascuna delle due posizioni. Ora noi sappiamo che l’ampiezza A, che corrisponde al fatto che un elettrone che orbita vicino a uno dei protoni possa essere trovato nelle vicinanze dell’altro, dipende dalla separazione dei due protoni. Più i protoni sono vicini, maggiore è tale ampiezza. Ricordatevi di quando, nel capitolo 7, si era parlato dell’ampiezza di un elettrone per «attraversare una barriera», cosa che non avrebbe potuto fare classicamente. Qui ci troviamo nella stessa situazione. L’ampiezza perché un elettrone passi diminuisce con la distanza all’incirca esponenzialmente, almeno per grandi distanze. PoiD ché la probabilità di transizione, e perciò A, aumenta (distanza tra i protoni) quando i protoni sono più vicini tra loro, anche la separazione dei livelli aumenterà. Se il sistema è nello stato | Ii, l’energia E0 + A aumenterà al diminuire della distanza, di modo che questi effetti quantistici producano una forza repulsiva che tende a mantenere lontani i protoni. D’altra parte, se il sistema si trova nello stato | IIi, l’energia totale diminuisce quando i FIGURA 10.2 Energia dei due stati stazionari dello ione H2+ in funzione della protoni vengono ravvicinati: si ha quindi una forza at- distanza tra i due protoni. trattiva che tira i due protoni uno vicino all’altro. La variazione delle due energie con la distanza tra i due protoni dovrebbe grosso modo comportarsi come mostrato in FIGURA 10.2. Otteniamo, così, una spiegazione quantistica della forza di legame che tiene unito lo ione H+2 . Ci siamo però dimenticati di una cosa. In aggiunta alla forza che abbiamo appena descritto, vi è anche una forza elettrostatica repulsiva tra i due protoni. Quando essi sono molto lontani l’uno dall’altro, come in FIGURA 10.1, il protone «nudo» vede solo un atomo neutro e in tal caso la forza elettrostatica è trascurabile. A distanza molto piccola però, il protone «nudo» comincia a penetrare all’«interno» della distribuzione elettronica, cioè, in media, è più vicino al protone
136
Capitolo 10 • Altri sistemi a due stati
© 978-8808-22107-0
che all’elettrone. Così, comincia a farsi sentire un po’ di energia elettrostatica aggiuntiva, la quale, naturalmente, è positiva. Questa energia, che varia anch’essa con la separazione, deve essere inclusa in E0 . Di conseguenza, per E0 dobbiamo considerare qualcosa del 0,3 tipo della curva tratteggiata di FIGURA 10.2, che sale rapidamente per distanze minori del raggio di un atomo 0,2 di idrogeno. L’energia di scambio A deve essere sommata e sottratta a partire da questa E0 . Facendo ciò, le 0,1 energie EI ed EII varieranno in funzione della distanza interprotonica D, come mostrato in FIGURA 10.3. (In 0 questa figura abbiamo riportato i risultati di un calcolo più dettagliato. La distanza tra i protoni è espressa in –0,1 unità angstrom (1 Å = 10 8 cm), e l’energia in eccesso a quella di un protone più un atomo di idrogeno –0,2 D (Å) è espressa in unità di energia di legame dell’atomo 2 3 4 0 1 di idrogeno, cioè la cosiddetta energia di 1 rydberg, 13,6 eV.) Come si vede, lo stato | IIi ha un punto di FIGURA 10.3 I livelli di energia dello ione H2+ in funzione della distanza D minimo nell’energia. Questa sarà la configurazione di tra i protoni. (E H =13,6 eV.) equilibrio dello ione H+2 , cioè la condizione in cui la sua energia è minima. L’energia in questo punto è minore di quella di un protone e di uno ione idrogeno separati e il sistema è perciò legato. Un solo elettrone fa in modo di tener insieme due protoni. Un chimico chiamerebbe questo stato di cose un «legame a elettrone singolo». Questo tipo di legame chimico viene spesso indicato come «risonanza quantistica» (in analogia ai due pendoli accoppiati che abbiamo descritto in precedenza). Ma, in effetti, tale denominazione suona assai più misteriosa di quanto non sia in realtà, perché si può parlare di «risonanza» solo se si parte da una scelta infelice degli stati di base, come anche noi abbiamo fatto! Se si scegliesse lo stato | IIi, si avrebbe subito lo stato di minima energia e questo sarebbe tutto. Si può anche vedere in un altro modo perché un tale stato debba avere un’energia minore di quella di un protone e di un atomo di idrogeno. Prendiamo in esame un elettrone che si trovi nelle vicinanze di due protoni separati da una certa distanza fissa, non troppo grande. Ricorderete che nel caso di un solo protone, l’elettrone è «diffuso» su una certa regione a causa del principio d’indeterminazione. Esso cerca di barcamenarsi tra l’avere una piccola energia potenziale coulombiana e l’evitare di essere confinato in una regione di spazio troppo piccola, cosa che gli darebbe un’energia cinetica elevata (a causa della relazione di indeterminazione p x ⇡ ~ ). Se ora si hanno due protoni, la regione di spazio dove l’elettrone possiede una piccola energia potenziale è maggiore. Può quindi distribuirsi, abbassando così la sua energia cinetica, senza al tempo stesso aumentare la sua energia potenziale. Il risultato netto è un’energia minore di quella dell’atomo di idrogeno. Perché allora l’altro stato | Ii ha un’energia maggiore? Notate che tale stato è la differenza degli stati | 1i e | 2i. A causa della simmetria di | 1i e | 2i, la loro differenza deve avere un’ampiezza nulla per l’elettrone a mezza strada tra i due protoni. Ciò implica che la posizione dell’elettrone risulta un po’ più delimitata, e questo fatto porta a un aumento dell’energia. A questo punto, bisogna dire che la nostra trattazione approssimata dello ione H+2 come un sistema a due stati crolla malamente quando i protoni sono vicini tra loro quanto lo sono nel minimo della curva di FIGURA 10.3, e, di conseguenza, non otterremmo un valore soddisfacente per l’effettiva energia di legame. Per piccole separazioni, le energie dei due «stati» che abbiamo immaginato in FIGURA 10.1 non sono in realtà uguali a E0 ; si rende perciò necessaria una trattazione quantistica più raffinata. Immaginiamo di chiederci ora cosa accadrebbe se invece di due protoni vi fossero due oggetti differenti, come, per esempio, un protone e uno ione positivo di litio (cioè, ancora particelle che hanno entrambe una sola carica positiva). In tal caso, i due termini H11 e H22 dell’hamiltoniana non sarebbero più uguali; in effetti, sarebbero molto diversi l’uno dall’altro. Quando accade che la differenza H11 H22 è, in valore assoluto, molto maggiore di A = H12 , la forza attrattiva diviene molto debole, come si può vedere nel seguente modo.
10.1 • Lo ione di idrogeno molecolare
© 978-8808-22107-0
Introducendo la relazione H12 H21 = A2 nelle equazioni (10.3), si ottiene s H11 + H22 H11 H22 4A2 E= ± 1+ 2 2 (H11 H22 )2 Quando H11 uguale a
H22 è molto maggiore di A2 , la radice quadrata è con buona approssimazione 1+
2A2 (H11 H22 )2
Le due energie sono allora EI = H11 +
A2 H11
H22 A2
EII = H22
(10.8)
H11 H22 Queste sono quasi esattamente le energie degli atomi isolati, H11 e H22 , spostate solo di poco dall’ampiezza di scambio A. La differenza di energia EI EII è (H11
H22 ) +
2A2 H11 H22
La separazione addizionale derivante dallo scambio dell’elettrone non è più uguale a 2A; ora è diminuita del fattore A/(H11 H22 ), che noi immaginiamo minore di uno. Inoltre, la dipendenza di EI EII dalla separazione dei due nuclei è molto minore che nel caso dello ione H+2 , essendo anch’essa ridotta del fattore A/(H11 H22 ). Vediamo così perché il legame di molecole diatomiche asimmetriche è generalmente molto debole. Nella nostra teoria dello ione H+2 abbiamo trovato una spiegazione del meccanismo con cui un elettrone, condivisio tra due protoni, dà luogo in effetti a una forza attrattiva tra i due protoni, che sussiste anche quando i protoni si trovano a grande distanza l’uno dall’altro. La forza attrattiva deriva dal fatto che l’energia del sistema è diminuita, ciò che a sua volta è causato dalla possibilità per l’elettrone di saltare da un protone all’altro. In uno di tali salti il sistema passa dalla configurazione (atomo di idrogeno, protone) a quella (protone, atomo di idrogeno), o compie la transizione inversa. Possiamo indicare questo processo simbolicamente come (H, p) ⌦ (p, H) La variazione di energia dovuta a questo processo è proporzionale all’ampiezza A che corrisponde alla transizione da un protone all’altro di un elettrone di energia WH (cioè, la sua energia di legame nell’atomo di idrogeno). Quando la distanza R tra i due protoni è grande, l’energia elettrostatica dell’elettrone è pressoché zero nella maggior parte dello spazio che l’elettrone attraversa per fare il salto. In tale regione, l’elettrone si muove come una particella libera nel vuoto, ma possiede un’energia negativa! Abbiamo visto nel capitolo 3, equazione (3.7), che l’ampiezza di probabilità perché una particella di energia definita passi da un punto a un altro a distanza r dal primo è proporzionale a e(i/~)pr r dove p è l’impulso corrispondente a quella data energia. Nel caso attuale (facendo uso della formula non relativistica), p è dato da p2 = WH 2m Ciò significa che p è un numero immaginario: p p = i 2mWH
(10.9)
137
138
Capitolo 10 • Altri sistemi a due stati
© 978-8808-22107-0
(la scelta dell’altro segno per il radicale non ha significato in questo caso). Ci si può aspettare quindi che l’ampiezza A dello ione H+2 vari come A/
e
p ( 2mWH /~)R
R
(10.10)
per grandi separazioni R tra i due protoni. La variazione di energia dovuta al legame elettronico è proporzionale ad A, perciò c’è una forza che trattiene insieme i due protoni proporzionale, per grandi R, alla derivata della (10.10) rispetto a R. Infine, per completezza, dobbiamo far notare che, nel sistema con due protoni e un elettrone, vi è ancora un effetto che dà luogo a una dipendenza dell’energia da R. Finora, lo abbiamo trascurato perché di solito non è molto importante, con l’eccezione di quelle circostanze in cui, per distanze molto grandi, l’energia del termine di scambio A diminuisce esponenzialmente a valori piccolissimi. Il nuovo effetto di cui ci occupiamo è quello dell’attrazione elettrostatica tra il protone e l’atomo di idrogeno, che si produce allo stesso modo di quella tra qualunque oggetto carico e un oggetto neutro. Il protone isolato produce un campo elettrico E (che varia come 1/R2 ) nella regione occupata dall’atomo di idrogeno neutro. L’atomo si polarizza, assumendo un momento dipolare indotto µ, il cui valore è proporzionale a E. L’energia del dipolo è µE, che è proporzionale a E2 , cioè a 1/R4 . C’è quindi un termine nell’energia del sistema che decresce con la quarta potenza della distanza. (Si tratta quindi di una correzione a E0 ). Questa energia diminuisce con la distanza più lentamente della variazione A data dalla (10.10); a un certo punto, per grandi separazioni R, questo è l’unico termine importante che rimane e che produce una variazione dell’energia con R, e perciò questa è l’unica forza che sopravvive. Si noti che il termine elettrostatico ha lo stesso segno per i due stati di base (la forza è attrattiva, cosicché l’energia è negativa) e quindi per i due stati stazionari, mentre il termine elettronico di scambio A ha segno opposto in tali stati.
10.2
Forze nucleari
Abbiamo visto che il sistema costituito da un atomo di idrogeno e da un protone ha un’energia di interazione dovuta allo scambio di un singolo elettrone che, per grandi separazioni R, varia come e
↵R
R con
(10.11)
r
2mWH ~ (Di solito, si dice che si ha lo scambio di un elettrone «virtuale» quando, come in questo caso, l’elettrone deve compiere un salto attraversando una regione dove avrebbe energia negativa. Più precisamente, uno «scambio virtuale» implica che il fenomeno sia connesso con una qualche interferenza quantistica tra gli stati in cui lo scambio è avvenuto o meno.) Possiamo ora porci la seguente domanda: non potrebbe essere che le forze tra altri tipi di particelle abbiano un’origine analoga? Che dire, per esempio, della forza nucleare tra un protone e un neutrone, o tra due protoni? In un tentativo di spiegare la natura delle forze nucleari, Yukawa ha proposto che la forza tra due nucleoni fosse dovuta a un analogo effetto di scambio, solo che, in questo caso, non si aveva lo scambio virtuale di un elettrone, ma di una nuova particella, che egli chiamò «mesone». Oggi, il mesone di Yukawa viene identificato con il mesone ⇡ (o «pione») che viene prodotto nelle collisioni ad alta energia tra protoni o altre particelle. Vediamo, a titolo di esempio, che tipo di forza ci si aspetta risulti dallo scambio di un pione positivo ⇡+ di massa m⇡ tra un protone e un neutrone. Così come un atomo d’idrogeno H0 può trasformarsi in un protone p+ cedendo un elettrone e , ↵=
H0 ! p+ + e
(10.12)
10.2 • Forze nucleari
© 978-8808-22107-0
un protone p+ può trasformarsi in un neutrone n0 emettendo un mesone ⇡+ : p+ ! n0 + ⇡+
(10.13)
Perciò, se abbiamo un protone in a e un neutrone in b separati da una distanza R, il protone può divenire un neutrone emettendo un ⇡+ , che viene poi assorbito dal neutrone in b, che diventa così un protone. Vi è un’energia di interazione del sistema dei due nucleoni (più il pione) che dipende dall’ampiezza di scambio del pione A, proprio come si era trovato per lo scambio dell’elettrone nel caso dello ione H+2 . Nella reazione (10.12), l’energia dell’atomo H0 è minore di quella del protone della quantità WH (facendo il calcolo non relativisticamente e omettendo l’energia a riposo dell’elettrone mc2 ), di modo che l’elettrone ha un’energia cinetica negativa, cioè un impulso immaginario, come nella (10.9). Nella reazione nucleare (10.13), il protone e il neutrone hanno masse quasi uguali, così che il ⇡+ avrà un’energia totale nulla. La relazione tra l’energia totale E e l’impulso p per un pione di massa m⇡ è E 2 = p2 c2 + m⇡2 c4 Poiché E è zero (o almeno trascurabile rispetto a m⇡ ), l’impulso risulta ancora immaginario: p = im⇡ c Ripetendo gli stessi ragionamenti fatti studiando l’ampiezza di un elettrone legato per penetrare la barriera che si trova nella regione di spazio compresa tra i due protoni, si ottiene nel caso nucleare un’ampiezza di scambio A che, per grandi R, varia come e
(m⇡ c/~)R
R
(10.14)
L’energia di interazione è proporzionale ad A, e quindi varia allo stesso modo. Troviamo quindi una variazione di energia della forma detta del potenziale di Yukawa tra due nucleoni. La stessa formula l’avevamo tra l’altro già ottenuta direttamente dall’equazione differenziale di moto per un pione nello spazio libero (vedi cap. 28 del vol. 2, equazione (28.18)). Seguendo la stessa linea di ragionamento, possiamo ora discutere l’interazione tra due protoni (o tra due neutroni) che deriva dallo scambio di un pione neutro (⇡0 ). Il processo fondamentale è ora p+ ! p+ + ⇡0 (10.15) Un protone può emettere un ⇡0 virtuale, ma, in tal caso, rimane sempre un protone. Se abbiamo due protoni, il protone numero 1 può emettere un ⇡0 virtuale che viene assorbito dal protone numero 2. Alla fine, abbiamo ancora due protoni. Questa situazione è un po’ diversa dal caso dello ione H+2 . Allora H0 finiva in una condizione differente – quella di protone dopo aver emesso l’elettrone. Adesso invece stiamo ammettendo che un protone possa emettere un ⇡0 senza cambiare il suo carattere. Processi di questo tipo vengono effettivamente osservati nelle collisioni ad alta energia. Si ha qui analogia tra il nostro processo e l’emissione di un fotone da parte di un elettrone che al termine della reazione rimane ancora tale: e ! e + fotone
(10.16)
Noi non «vediamo» i fotoni dentro gli elettroni, prima che vengano emessi o dopo che sono stati assorbiti, e la loro emissione non cambia la «natura» dell’elettrone. Ritornando ai due protoni, si ha un’energia di interazione che deriva dall’ampiezza A corrispondente all’emissione da parte di un protone di un pione neutro, che poi viaggia (con impulso immaginario) fino all’altro protone dove viene assorbito. Questa ampiezza è ancora proporzionale alla (10.14), con m⇡ uguale alla massa del pione neutro. Questi stessi ragionamenti ci danno un’uguale energia di interazione nel caso di due neutroni. Poiché le forze nucleari (trascurando cioè gli effetti elettrici) sono le stesse tra neutrone e protone, protone e protone, e neutrone e neutrone, concludiamo che le masse dei pioni carichi e neutri debbano essere le stesse. Sperimentalmente si trova che le masse sono effettivamente quasi uguali e che la piccola differenza è circa dell’entità
139
140
Capitolo 10 • Altri sistemi a due stati
© 978-8808-22107-0
che ci si aspetta dalle correzioni per l’energia intrinseca elettromagnetica (vedi cap. 28 del vol. 2). Vi sono altri tipi di particelle, come i mesoni K, che possono essere scambiati tra due nucleoni. È anche possibile che due pioni vengano scambiati contemporaneamente. Ma tutti questi altri «oggetti» scambiati hanno una massa a riposo m x maggiore della massa del pione, m⇡ , e portano perciò a termini nell’ampiezza di scambio che variano come e
(m x c/~)R
R Questi termini, all’aumentare di R muoiono più rapidamente del termine con un mesone. Nessuno, al giorno d’oggi, è in grado di calcolare questi termini corrispondenti a masse maggiori, ma, per valori sufficientemente grandi di R, solo il termine con un pione sopravvive. E, infatti, gli esperimenti che riguardano solo le interazioni nucleari a grande distanza dimostrano che l’energia di interazione è in accordo con quella che viene predetta dalla teoria dello scambio di un solo pione. Nella teoria classica dell’elettricità e del magnetismo, l’interazione elettrostatica coulombiana e l’irradiazione di luce da parte di una carica in moto accelerato sono intimamente connesse, in quanto entrambe derivano dalle equazioni di Maxwell. Si è visto che nella teoria quantistica la luce può essere rappresentata tramite le eccitazioni quantistiche degli oscillatori armonici dei campi elettromagnetici classici, contenuti in una cavità. O, alternativamente, la teoria quantistica può essere costruita descrivendo la luce per mezzo di particelle, i fotoni, che seguono la statistica di Bose. Nel paragrafo 4.5 abbiamo insistito sul fatto che i due alternativi punti di vista danno sempre luogo a identiche previsioni. È possibile sviluppare completamente il secondo punto di vista in modo da comprendere tutti gli effetti elettromagnetici? In particolare, se vogliamo descrivere il campo elettromagnetico soltanto per mezzo di particelle di Bose, cioè per mezzo di fotoni, a cosa è dovuta la forza coulombiana? Dal punto di vista «corpuscolare», l’interazione coulombiana tra due elettroni deriva dallo scambio di un fotone virtuale. Un elettrone emette un fotone – come nella reazione (10.16) – che raggiunge il secondo elettrone dove viene assorbito per effetto della reazione inversa alla precedente. L’energia di interazione è ancora data da una formula simile alla (10.14), ma ora m⇡ viene sostituito dalla massa a riposo del fotone, che è zero. Così lo scambio di un fotone virtuale tra due elettroni produce un’energia di interazione che varia semplicemente come l’inverso di R, distanza tra i due elettroni, proprio come la normale energia potenziale coulombiana! Nella teoria «corpuscolare» dell’elettromagnetismo, il processo di scambio di un fotone virtuale produce tutti i fenomeni dell’elettrostatica.
10.3
La molecola di idrogeno
Il successivo sistema a due stati che prenderemo in esame sarà la molecola di idrogeno neutra, H2 . Naturalmente, è più difficile da capire, perché ha due elettroni. Ancora una volta, cominciamo col considerare cosa avviene se i due protoni sono ben separati l’uno dall’altro. Solo che ora dobbiamo aggiungerci due elettroni. Per distinguerli, chiameremo uno di essi «elettrone a» e l’altro «elettrone b». Possiamo ancora immaginare due possibili stati. Una possibilità è che l’«elettrone a» stia intorno al primo protone e l’«elettrone b» stia intorno al secondo, com’è mostrato nella FIGURA 10.4. Abbiamo semplicemente due atomi di idrogeno. Indicheremo questo stato con | 1i. Ma vi è anche un’altra possibilità: che l’«elettrone b» stia intorno al primo protone e l’«elettrone a» intorno al secondo. Indicheremo questo stato con | 2i. A causa della simmetria della situazione, queste due possibilità sono energeticamente equivalenti, ma, come vedremo, l’energia del sistema non è semplicemente l’energia dei due atomi di idrogeno. Bisogna dire che vi sono anche molte altre possibilità. Per esempio, l’«elettrone a» potrebbe stare vicino al primo protone e l’«elettrone b» potrebbe trovarsi in un altro stato intorno allo stesso protone. Non prenderemo in considerazione una tale possibilità, poiché essa darebbe certamente luogo a un’energia maggiore (a causa della forte energia coulombiana di repulsione tra i due
141
10.3 • La molecola di idrogeno
© 978-8808-22107-0
10.4 Un insieme di stati di base per la molecola di H2 . FIGURA
Elettroni a
b
+
+ Protoni
a
b
+
+
elettroni). Per maggior precisione, dovremmo includere anche stati come questi, ma possiamo ricavare tutto l’essenziale sul legame molecolare semplicemente prendendo in esame i due stati di FIGURA 10.4. In questa approssimazione possiamo descrivere un qualsiasi stato dando le ampiezze h1 | i di essere nello stato | 1i e h2 | i di essere nello stato | 2i. In altre parole, il vettore di stato | i può essere scritto come una combinazione lineare: | i=
X
| ii hi | i
i
Per procedere oltre, supponiamo, come sempre, che vi sia una qualche ampiezza A che corrisponda alla possibilità che gli elettroni si muovano attraverso lo spazio che li separa e si scambino le loro posizioni. Questa 0,4 possibilità di scambio significa che l’energia del sistema si sdoppia, come si è visto per gli altri sistemi a due stati. Così come per lo ione di idrogeno molecolare, la separazione delle energie risulta assai piccola quando la 0,2 distanza tra i protoni è grande. Via via che i protoni si avvicinano l’un l’altro, l’ampiezza per il moto avanti e indietro degli elettroni aumenta e di conseguenza aumenta la separazione delle energie. L’abbassarsi dello 0 stato di energia minore indica la presenza di una forza attrattiva che tira gli atomi uno verso l’altro. Ancora una volta, i livelli energetici salgono quando i due protoni sono molto vicini l’uno all’altro a causa della repulsione –0,2 coulombiana. Il risultato netto alla fine è che i due stati stazionari hanno delle energie che variano con la separazione, com’è mostrato in FIGURA 10.5. Per una separazione di circa 0,74 Å, il livello della minore delle due energie –0,4 raggiunge un minimo; questa è la distanza tra i due protoni nella reale 2 0 1 3 D (Å) molecola di idrogeno. Ora probabilmente starete pensando a un’obiezione. Che ne è del fatto che i due elettroni sono particelle identiche? Noi li abbiamo chiamati «elet- FIGURA 10.5 I livelli di energia della molecola di H2 trone a» ed «elettrone b», ma, in realtà, non vi è alcun modo di stabilire per varie distanze D tra i protoni. (E H =13,6 eV.) qual è l’uno e qual è l’altro. E nel capitolo 4, parlando degli elettroni, che sono particelle di Fermi, abbiamo detto che, se vi sono due modi di far avvenire una certa cosa scambiando tra loro gli elettroni, le due corrispondenti ampiezze interferiscono con un segno negativo. Ciò significa che se scambiamo tra loro i ruoli dei due elettroni, il segno dell’ampiezza deve cambiare. Ma poco fa abbiamo anche concluso che lo stato legato della molecola di idrogeno è (a t = 0 ) ⌘ 1 ⇣ | IIi = p | 1i + | 2i 2
142
Capitolo 10 • Altri sistemi a due stati
© 978-8808-22107-0
Tuttavia, secondo le regole del capitolo 4, questo stato non è permesso. Se scambiamo tra loro i due elettroni, otteniamo lo stato ⌘ 1 ⇣ p | 2i + | 1i 2 cioè con lo stesso segno di prima invece che col segno opposto. Questi ragionamenti sono giusti, se entrambi gli elettroni hanno lo stesso spin. È vero che se tutti e due gli elettroni hanno spin su (oppure spin giù) l’unico stato permesso è 1 ⇣ | Ii = p | 1i 2
| 2i
Per un tale stato, lo scambio degli elettroni dà
1 ⇣ p | 2i 2
| 1i
⌘
⌘
che è uguale a | Ii, come deve essere. Perciò, se avviciniamo i due atomi di idrogeno con gli spin degli elettroni che puntano nella stessa direzione, essi finiranno nello stato | Ii e non nello stato | IIi. Ma notate che lo stato | Ii è lo stato con energia maggiore. La sua curva dell’energia in funzione della separazione non ha alcun minimo. I due idrogeni si respingeranno sempre e non formeranno una molecola. Perciò concludiamo che la molecola di idrogeno non può esistere con gli spin degli elettroni paralleli. E questo è vero. D’altra parte, il nostro stato | IIi è perfettamente simmetrico nei due elettroni. Infatti, se scambiamo l’elettrone che abbiamo chiamato a con quello che abbiamo chiamato b, riotteniamo esattamente lo stesso stato. Abbiamo visto nel paragrafo 4.7 che, se due particelle di Fermi sono nello stesso stato, esse debbono avere spin opposti. Perciò, la molecola di idrogeno legata deve avere un elettrone con lo spin su e l’altro con lo spin giù. L’intera storia della molecola di idrogeno è in realtà un po’ più complicata se si vuole tener conto anche degli spin dei protoni. In tal caso non è più consentito considerare la molecola come un sistema a due stati. Bisogna invece considerarla come un sistema a otto stati, poiché vi sono quattro possibili combinazioni di spin per ognuno degli stati | 1i e | 2i, quindi abbiamo semplificato di un bel po’ la faccenda trascurando gli spin. Le nostre conclusioni finali sono però giuste. Abbiamo scoperto che lo stato di energia minima della molecola H2 – che è anche il solo stato legato – ha i due elettroni con gli spin opposti. Il momento angolare totale di spin degli elettroni è zero. D’altra parte, due atomi di idrogeno vicini con gli spin paralleli, e quindi con momento angolare totale pari a ~, devono trovarsi in uno stato (non legato) di energia più alta. Vi è quindi un’interessante correlazione tra spin ed energie. Questo ci illustra nuovamente un fatto che avevamo già menzionato, cioè che esiste una certa energia di «interazione» tra i due spin, visto che il caso di spin paralleli possiede un’energia maggiore di quello opposto. In un certo senso, si potrebbe dire che gli spin tendono verso una condizione di antiparallelismo e, nel farlo, hanno la possibilità di cedere energia, non perché vi sia presente una notevole forza magnetica, ma a causa del principio di esclusione. Si è visto nel paragrafo 10.1 che il legame tra due ioni differenti per mezzo di un singolo elettrone risulta di solito molto debole. Questo non è più vero per il legame a mezzo di due elettroni. Supponiamo di sostituire i due protoni di FIGURA 10.4 con due ioni qualsiasi (con gli strati elettronici interni completi e con carica ionica unitaria), e inoltre che l’energia di legame di un elettrone sia diversa nei due ioni. L’energia degli stati | 1i e | 2i sarebbe ancora uguale, perché in ciascuno di questi due stati abbiamo un elettrone legato per ogni ione. Perciò, avremo ancora una separazione di energia proporzionale ad A. Il legame a due elettroni è diffusissimo: è il tipo di legame di valenza che più comunemente si incontra. I legami chimici di solito hanno a che fare con questo tipo di scambi, giocato tra due elettroni. Per quanto sia possibile legare insieme due atomi con un elettrone soltanto, questo avviene relativamente di rado, perché richiede che si presentino esattamente tutte le circostanze giuste. Infine, vogliamo ricordare che, se l’energia di attrazione di un elettrone verso uno dei due nuclei è molto maggiore che verso l’altro, allora cessa di essere vero quanto abbiamo detto circa
143
10.4 • La molecola del benzene
© 978-8808-22107-0
la possibilità di ignorare gli altri possibili stati. Supponiamo che il nucleo a (che potrebbe anche essere uno ione positivo) attragga gli elettroni molto più fortemente di quanto non faccia il nucleo b. Può allora accadere che l’energia totale seguiti a essere molto bassa anche quando tutti e due gli elettroni sono vicini al nucleo a, e nessuno vicino al nucleo b. Se ciò avviene, lo stato di energia minima può avere un’ampiezza grande per due elettroni in a (cosa che rende quest’ultimo uno ione negativo) e un’ampiezza piccola per uno degli elettroni in b. Questa forte attrazione può compensare la repulsione mutua tra i due elettroni. Lo stato perciò si presenta come l’insieme di uno ione positivo e di uno ione negativo. Questo è, in realtà, quel che succede in una molecola «ionica» come NaCl. Come vedete, sono possibili tutte le graduazioni tra il legame covalente e quello ionico. Cominciate quindi a vedere come avviene che molti fenomeni chimici si possano interpretare molto chiaramente per mezzo di una descrizione quantistica.
10.4
La molecola del benzene
I chimici hanno inventato dei bei diagrammi per rappresentare complicate molecole organiche. Andremo ora a discuterne una delle più interessanti, la molecola del benzene, la cui formula di struttura è rappresentata in FIGURA 10.6. Tale molecola contiene sei atomi di carbonio e sei di idrogeno disposti secondo uno schema simmetrico. Ciascuna delle sbarrette del diagramma rappresenta una coppia di elettroni, con gli spin opposti, impegnati nella danza del legame covalente. Ciascun atomo di idrogeno contribuisce con un elettrone e ciascun atomo di carbonio con quattro elettroni per fare un totale di 30 elettroni in gioco. (Vi sono ancora due elettroni che stanno vicino al nucleo del carbonio e che formano il primo strato, detto strato K. Questi non sono indicati, perché sono legati così strettamente da non intervenire in maniera apprezzabile nel legame covalente.) Perciò ogni sbarretta in figura rappresenta un legame, o coppia di elettroni, e i doppi legami indicano che vi sono due coppie di elettroni scambiate tra due atomi di carbonio. Nella molecola del benzene vi è qualcosa di misterioso. Possiamo calcolare l’energia richiesta per formare questo composto chimico, poiché i chimici hanno misurato le energie dei vari componenti che fanno parte dell’anello; per esempio, si conosce l’energia del doppio legame dagli studi sull’etilene e così via. Possiamo perciò calcolare qual è l’energia che ci possiamo aspettare per la molecola del benzene. Però l’energia effettiva dell’anello benzenico è molto minore di quel che risulta da un tale calcolo; cioè questo sistema è più fortemente legato di quello che ci si attende per un cosiddetto «sistema a doppio legame non saturo». Di solito, un sistema a doppio legame che non faccia parte di un anello di questo tipo, viene attaccato chimicamente con facilità, poiché ha un’energia relativamente alta, in quanto i doppi legami possono essere spezzati facilmente con l’aggiunta di altri idrogeni. Ma nel benzene l’anello è estremamente stabile e difficile da rompere. In altre parole, il benzene ha un’energia molto minore di quella che si calcola usando lo schema dei legami chimici. C’è poi un’altra cosa misteriosa. Supponete di sostituire due idrogeni adiacenti con atomi di bromo, così da formare l’orto-dibromobenzene. Vi sono due modi di fare ciò, come si vede in FIGURA 10.7. Gli atomi di bromo possono trovarsi ai capi opposti di un doppio legame, come mostrato nella FIGURA 10.7a, oppure possono trovarsi agli estremi di un legame semplice come nella FIGURA 10.7b. Si potrebbe pensare che l’orto-dibromobenzene esiste in due forme differenti. Ma in chimica ne esiste una soltanto(2) . Daremo ora una soluzione a questi misteri e forse voi avrete già indovinato in che modo – ovviamente, notando che lo «stato fondamentale» dell’anello benzenico è in effetti un sistema a due stati. Possiamo pensare che i legami del benzene possano trovarsi in ognuna delle due disposizioni mostrate in FIGURA 10.8. Voi direte: «Ma in pratica sono (2) Stiamo semplificando un po’ troppo. Inizialmente, i chimici pensavano che ci dovessero essere quattro forme di dibromobenzene; in due di queste, gli atomi di bromo sarebbero legati a due atomi di carbonio adiacenti (ortodibromobenzene), nella terza il secondo atomo di bromo sarebbe legato non al carbonio adiacente, ma a quello successivo (meta-dibromobenzene) e nella quarta i due atomi di bromo sarebbero l’uno opposto all’altro (para-dibromobenzene). Però, si sono trovate solo tre di queste forme, poiché c’è una sola forma di orto-molecola.
H C H
H
C
H C
C
C H
C H
10.6 La molecola di benzene, C6 H6 . FIGURA
H H
H
C C
C
C
C C
(a)
Br
Br
H
H H
H
C C
C
C
(b)
C C
Br
Br
H
10.7 Due possibilità di orto-dibromobenzene. I due atomi di bromo possono essere separati da un legame semplice o doppio. FIGURA
144
Capitolo 10 • Altri sistemi a due stati
H C H
H
C
H C
C
C H
C H
H C H
H
C
H C
C
C C
H
H
10.8 Un insieme di stati di base per la molecola di benzene. FIGURA
© 978-8808-22107-0
la stessa cosa; quindi avranno la stessa energia». E infatti dovrebbero averla. E per tale ragione devono essere analizzati come un sistema a due stati. Ciascuno stato rappresenta una diversa configurazione dell’intero insieme di elettroni e vi è una certa ampiezza di probabilità, A, perché tutti quanti insieme passino dall’una all’altra delle varie sistemazioni; vi è una certa probabilità che gli elettroni cambino, per così dire, figura di danza. Come abbiamo visto, questa possibilità di cambiamento produce uno stato misto, la cui energia è minore di quella che si calcolerebbe considerando separatamente ciascuno dei due schemi di FIGURA 10.8. Vi sono invece due stati stazionari, uno di energia maggiore del valore che ci saremmo aspettati, e l’altro di energia minore. Quindi, in realtà, l’effettivo stato normale del benzene (quello di minima energia) non coincide con nessuna delle due alternative mostrate p in FIGURA 10.8, ma ha invece un’ampiezza 1/ 2 di trovarsi in ciascuno degli stati ivi riprodotti. Questo è l’unico stato che ha importanza nella chimica del benzene a temperature normali. Fra l’altro, anche lo stato con energia superiore esiste; possiamo affermarlo perché il benzene presenta un forte assorbimento per la luce ultravioletta a una frequenza ! = (EI EII )/~. Ricorderete che nel caso dell’ammoniaca, dove ciò che compiva le transizioni avanti e indietro erano tre protoni, si aveva una separazione di energia che cadeva nella regione delle microonde. Nel benzene, gli oggetti interessati sono degli elettroni, e, siccome essi sono molto più leggeri, hanno più facilità a muoversi avanti e indietro, e questo rende il coefficiente A molto più grande. Di conseguenza, la differenza di energia è molto più grande, circa 1,5 eV, energia che corrisponde a quella di un fotone ultravioletto(3) . Che succede se ora facciamo delle sostituzioni con il bromo? Ancora una volta le due «possibilità» di FIGURA 10.7a e 10.7b rappresentano due diverse configurazioni elettroniche. L’unica differenza è che i nostri due stati di base di partenza hanno delle energie leggermente diverse. Lo stato stazionario di energia minima sarà ancora una combinazione lineare dei due stati di base, ma con ampiezze esempio un valore pari p differenti. L’ampiezza dello stato | 1i potrebbe avere per p all’incirca a 2/3, mentre l’ampiezza dello stato | 2i un valore di circa 1/3, in modulo. Non possiamo dirlo con precisione senza avere altre informazioni, ma una volta che le due energie H11 e H22 non sono più uguali, nemmeno le ampiezze C1 e C2 possono esserlo. Ciò significa, naturalmente, che una delle due possibilità è più probabile dell’altra, ma che la mobilità degli elettroni è comunque sufficiente a far sì che ciascuna delle p p due ampiezze sia diversa da zero. L’altro stato ha ampiezze differenti (per esempio, 1/3 e 2/3 ) e si trova a un’energia più alta. Vi è un solo stato fondamentale e non due, come invece suggerirebbe l’ingenua teoria del legame chimico fisso.
10.5
Coloranti
Vi daremo ancora un esempio di un fenomeno connesso con i sistemi a due stati preso dalla chimica, questa volta su una scala molecolare più grande. Esso è collegato con la teoria dei coloranti. Molti coloranti, in effetti la maggior parte di quelli artificiali, hanno un’interessante caratteristica: possiedono una qualche specie di simmetria. La FIGURA 10.9 mostra lo ione di un particolare colorante, detto magenta, che ha un colore rosso purpureo. La molecola presenta tre strutture ad anello, due delle quali sono anelli benzenici. La terza non è esattamente uguale al benzene, perché ha solo due doppi legami nell’anello. Nella figura si vedono due schemi ugualmente soddisfacenti e si potrebbe pensare che a essi corrispondano uguali energie. Ma vi (3) Ciò che abbiamo detto può creare una certa confusione. Infatti, nel sistema a due stati con cui abbiamo schematizzato il benzene, l’assorbimento di luce ultravioletta sarebbe estremamente debole, perché l’elemento di matrice del momento dipolare è nullo tra i nostri due stati. (Essi sono elettricamente simmetrici, così che nella formula (9.55) per la probabilità di transizione, il momento dipolare µ è nullo e la luce non viene assorbita.) Se questi fossero gli unici stati, l’esistenza dello stato di energia più alta dovrebbe venire provata in altro modo. Tuttavia se si fa una teoria più completa del benzene, cominciando col tenere un maggior numero di stati di base (come quelli con doppi legami adiacenti), si trova che i veri stati stazionari del benzene sono leggermente distorti rispetto a quelli che abbiamo trovato noi. Il momento di dipolo che ne risulta permette che la transizione che abbiamo menzionato nel testo possa aver luogo tramite l’assorbimento di luce ultravioletta.
© 978-8808-22107-0
10.6 • L’hamiltoniana di una particella a spin un mezzo in un campo magnetico
145
è una certa ampiezza di probabilità che gli elettroni possano saltare da una condizione all’altra, spostando all’estremità opposta la posizione della configurazione «non saturata». Con un numero di elettroni in gioco così grande, l’ampiezza di transizione è leggermente minore che nel caso del benzene, e minore è anche la differenza di energia tra i due stati stazionari. Nondimeno, vi sono i soliti due stati stazionari | Ii e | IIi che si ottengono combinando per somma e per differenza i due stati di base mostrati in figura. La separazione in energia tra | Ii e | IIi risulta uguale a quella di un fotone nella regione ottica. Illuminando la molecola, si osserva un forte assorbimento a una ben definita frequenza, e la molecola stessa appare vividamente colorata. Ecco perché è un colorante! Un’altra caratteristica interessante di questa molecola colorante è che, nei due stati di base che abbiamo disegnato, il baricentro delle cariche elet+ triche è situato in posizioni diverse. Di conseguenza, la molecola dovrebbe H 2N C NH2 risentire fortemente dell’influenza di un campo elettrico esterno. Un simile effetto lo avevamo incontrato nella molecola di ammoniaca. Possiamo evidentemente analizzare questo caso per mezzo delle stesse espressioni matematiche di prima, purché conosciamo i numeri E0 e A. In genere, questi si possono ricavare raccogliendo dati sperimentali. Facendo delle misure su un gran numero di coloranti, è spesso possibile poi indovinare + NH2 H 2N C cosa succede con molecole coloranti simili. A causa del grande spostamento nella posizione del baricentro delle cariche elettriche, il valore di µ nella formula (9.55) è grande, e il materiale ha una grande probabilità di assorbire luce di frequenza caratteristica 2A/~. Perciò, non soltanto è colorata, ma lo è fortemente, perché una piccola quantità di sostanza assorbe una gran quantità di luce. La frequenza con cui gli elettroni vanno e vengono – e, di conseguenza, FIGURA 10.9 Due stati di base per la molecola A – è molto sensibile alla struttura completa della molecola. Un cambia- del colorante magenta. mento di A provoca una variazione della separazione di energia tra i due stati e contemporaneamente una variazione del colore. Inoltre, non c’è bisogno che le molecole siano perfettamente simmetriche. Infatti, si è visto che si produce essenzialmente lo stesso fenomeno, con solo leggere modifiche, anche in presenza di qualche piccola asimmetria. Perciò è possibile modificare leggermente i colori, introducendo delle piccole asimmetrie nelle molecole. Per esempio, un’altra tintura importante, il verde malachite, è assai simile al magenta, ma, in esso, due degli idrogeni sono sostituiti da CH3 . Il colore è diverso perché A è variato e la frequenza della transizione avanti e indietro è cambiata.
10.6
L’hamiltoniana di una particella a spin un mezzo in un campo magnetico
Esamineremo ora un sistema a due stati in cui è in gioco una particella di spin un mezzo. Una parte di ciò che diremo è già stata trattata in capitoli precedenti, ma la ripetizione può aiutare a render più chiari alcuni dei punti più intricati. Un elettrone in quiete può essere considerato un sistema a due stati. Naturalmente, anche se in questo paragrafo parleremo sempre di «elettroni», i risultati che troveremo saranno validi per qualsiasi particella a spin un mezzo. Immaginiamo di scegliere per i nostri stati di base | 1i e | 2i quelli in cui la componente z dello spin dell’elettrone sia +~/2 e ~/2. Questi sono, naturalmente, gli stessi stati che avevamo indicato con (+) e ( ) in capitoli precedenti. Tuttavia, per mantenere coerente la notazione di questo capitolo, chiameremo lo stato «più» stato | 1i e lo stato «meno» stato | 2i, dove «più» e «meno» si riferiscono alla componente del momento angolare in direzione z. Un qualsiasi possibile stato dell’elettrone può essere descritto, come nell’equazione (10.1), dando l’ampiezza di probabilità C1 che l’elettrone sia nello stato | 1i e l’ampiezza C2 che l’elettrone sia nello stato | 2i. Per trattare questo problema, abbiamo bisogno di conoscere l’hamiltoniana per questo sistema a due stati, cioè l’hamiltoniana di un elettrone in un campo magnetico. Cominciamo col caso particolare in cui il campo magnetico è diretto lungo z.
146
Capitolo 10 • Altri sistemi a due stati
© 978-8808-22107-0
Supponiamo cioè che il vettore B abbia soltanto la componente z, Bz . Dalla definizione dei due stati di base (cioè quelli con spin parallelo e antiparallelo a B), sappiamo che essi sono già stati stazionari che hanno una definita energia in un campo magnetico. Lo stato | 1i corrisponde a un’energia(4) pari a µBz e lo stato | 2i a un’energia pari a +µBz . In questo caso l’hamiltoniana sarà molto semplice, poiché C1 , l’ampiezza corrispondente a trovarsi nello stato | 1i, non è influenzata da C2 , e viceversa: i~
dC1 = E1 C1 = µBz C1 dt
dC2 i~ = E2 C2 = +µBz C2 dt
(10.17)
In questo caso particolare, l’hamiltoniana è H11 = µBz
H12 = 0
H21 = 0
H22 = +µBz
(10.18)
Perciò ora conosciamo l’hamiltoniana quando il campo magnetico è diretto lungo z, e sappiamo quali sono le energie degli stati stazionari. Supponiamo ora che il campo non sia diretto lungo z. Qual è l’hamiltoniana? Come cambiano gli elementi di matrice quando il campo non è nella direzione z? Adesso faremo l’ipotesi che vi sia una specie di principio di sovrapposizione per i termini dell’hamiltoniana. Per essere più precisi, faremo l’ipotesi che, se si sovrappongono due campi magnetici, i corrispondenti termini dell’hamiltoniana si sommino semplicemente tra loro. Se conosciamo gli Hi j per Bz soltanto e gli Hi j per Bx soltanto, allora gli Hi j quando c’è sia Bz sia Bx sono semplicemente la somma dei precedenti. Questo è certamente vero, quando si considerano solo campi nella direzione z: se raddoppiamo Bz tutti gli Hi j vengono raddoppiati. Perciò, supponiamo che H sia una funzione lineare del campo B. Questo è tutto ciò che ci serve per riuscire a trovare gli Hi j per un campo magnetico qualsiasi. Pensiamo di avere un campo B costante. Se avessimo scelto il nostro asse z nella direzione del campo, avremmo trovato i due stati stazionari con le energie ⌥µB. Ma la scelta di un sistema di assi in un’altra direzione non potrà cambiare le proprietà fisiche del sistema. La nostra descrizione degli stati stazionari sarà differente, ma le energie di tali stati saranno ancora ⌥µB, cioè q EI = µ Bx2 + By2 + Bz2 (10.19) q 2 2 2 EII = +µ Bx + By + Bz
Il resto del gioco è facile. Abbiamo la formula per le energie. Vogliamo un’hamiltoniana che sia lineare in Bx , By e Bz e che dia luogo proprio a quelle energie quando si faccia uso della nostra formula generale, equazione (10.3). Il problema è: trovare l’hamiltoniana. Per prima cosa, notate che le energie sono simmetriche rispetto a un valore medio uguale a zero. Dall’equazione (10.3), vediamo direttamente che questo richiede che sia H22 = H11 (Notate che questo è anche un controllo di ciò che già sappiamo quando Bx e By sono entrambi zero; in tal caso, H11 = µBz e H22 = +µBz .) Se ora si uguagliano le energie date dall’equazione (10.3) e quelle a noi note dall’equazione (10.19), si ha H11
H22 2
!2
⇣ ⌘ + |H12 | 2 = µ2 Bx2 + By2 + Bz2
(10.20)
(4) Prendiamo l’energia a riposo m c 2 come nostro «zero» dell’energia e consideriamo il momento magnetico µ 0 dell’elettrone come un numero negativo, perché diretto in senso opposto allo spin.
10.6 • L’hamiltoniana di una particella a spin un mezzo in un campo magnetico
© 978-8808-22107-0
⇤ , cosicché H H può essere scritto anche come (Si è anche fatto uso del fatto che H21 = H12 12 21 2 |H12 | .) Per il caso particolare di un campo in direzione z, questo dà ancora una volta
µ2 Bz2 + |H12 | 2 = µ2 Bz2 Evidentemente, |H12 | deve essere zero in questo caso particolare e ciò significa che H12 non può avere termini in Bz . (Ricordate che abbiamo detto che tutti i termini devono essere lineari in Bx , By e Bz .) Per ora, quindi, abbiamo scoperto che H11 e H22 hanno termini in Bz , mentre H12 e H21 non li hanno. Possiamo fare un’ipotesi semplice, che soddisfa l’equazione (10.20) dicendo che H11 = µBz (10.21)
H22 = µBz |H12 | 2 = µ2 (Bx2 + By2 )
E risulta poi che questo è l’unico modo in cui si può fare ciò! «Un q momento» – direte voi – «H12 non è lineare in B; l’equazione (10.21) dà H12 =
= µ Bx2 + By2 ». Non necessariamente. Vi è un’altra possibilità, che dà una relazione lineare, cioè H12 = µ (Bx + iBy ) In effetti, vi sono parecchie di queste possibilità, poiché in generale si può scrivere H12 = µ (Bx ± iBy ) ei
dove è una fase arbitraria. Quale fase e quale segno dobbiamo usare? Risulta che si può scegliere quale fase e quale segno si vuole, senza cambiare minimamente i risultati fisici. Perciò, la scelta è una questione di convenzione. Chi se ne è occupato prima di noi ha scelto il segno meno e ha preso ei = 1. Possiamo anche noi seguire l’esempio e scrivere H12 = µ (Bx iBy ) H21 = µ (Bx + iBy ) (Fra l’altro, queste convenzioni sono legate e in accordo con alcune delle altre scelte arbitrarie che abbiamo fatto nel capitolo 6.) L’hamiltoniana completa per un elettrone in un campo magnetico arbitrario è, perciò, H11 = µBz
H12 = µ (Bx
H21 = µ (Bx + iBy )
H22 = +µBz
iBy )
(10.22)
E le equazioni per le ampiezze C1 e C2 sono i~
dC1 = µ [Bz C1 + (Bx dt
dC2 i~ = µ [(Bx + iBy ) C1 dt
iBy ) C2 ] (10.23) Bz C2 ]
Così abbiamo scoperto quali sono le «equazioni di moto per gli stati di spin» di un elettrone in un campo magnetico. Siamo riusciti a indovinarle per mezzo di alcune osservazioni di tipo fisico, ma noi sappiamo che il vero collaudo di un’hamiltoniana consiste nel verificare la sua capacità di fornire previsioni in accordo con l’esperienza. E secondo tutte le prove che sono state fatte, queste equazioni sono giuste. Infatti, per quanto i nostri ragionamenti si riferissero solo a campi costanti, l’hamiltoniana che abbiamo scritto è quella giusta anche per campi magnetici che variano col tempo. Perciò, noi ora possiamo usare le equazioni (10.23) anche per trattare tutti questi tipi interessanti di problemi.
147
148
Capitolo 10 • Altri sistemi a due stati
10.7
z
© 978-8808-22107-0
L’elettrone con spin in un campo magnetico
Esempio numero uno: comincieremo con un campo costante in direzione z. Ci sono soltanto due stati stazionari con energie ⌥µBz . Immaginiamo ora di far agire anche un debole campo in direzione x. Le equazioni allora saranno dello stesso tipo che nel nostro ben noto problema a due stati. Avremo ancora tutta la faccenda dei salti avanti e indietro e i livelli energetici risulteranno leggermente separati. Supponiamo ora che la componente x del campo vari col tempo, per esempio come cos !t. Le equazioni sono le stesse che avremmo avuto se avessimo sottoposto la molecola di ammoniaca del capitolo 9 a un campo elettrico oscillante. Potete studiare per conto vostro i dettagli di questo problema allo stesso modo. Troverete così il risultato che il campo oscillante causa delle transizioni dallo stato +z allo stato z – e viceversa – quando la frequenza di oscillazione del campo orizzontale è vicina alla frequenza di risonanza !0 = 2µBz /~. In questa maniera si costruisce la teoria quantistica dei fenomeni di risonanza magnetica che abbiamo descritto nel cap. 35 del vol. 2 (vedi Appendice). È anche possibile costruire un maser che faccia uso di un sistema a spin un mezzo. Si usa un apparecchio di Stern-Gerlach per produrre un fascio di particelle polarizzate, per esempio, nella direzione +z, e s’inviano poi queste in una cavità che si trova in un campo magnetico. Il campo oscillante della cavità si può accoppiare con il momento magnetico, inducendo così delle transizioni che cedono energia B alla cavità. Consideriamo ora il problema seguente. Supponiamo di avere il campo magnetico B lungo una direzione i cui angoli polare e azimutale siano ✓ e come in FIGURA 10.10. Immaginiamo poi che ci sia un elettrone che sia stato preparato in modo da avere lo spin diretto lungo il campo. Quali sono le ampiezze C1 e C2 per un tale elettrone? In altre parole, indicando con | i lo stato dell’elettrone, noi vogliamo scrivere | i = | 1i C1 + | 2i C2
y
dove C1 e C2 sono x
C1 = h1 | i C2 = h2 | i
10.10
La direzione di B è definita dall’angolo polare ✓ e dall’angolo azimutale . FIGURA
e dove con | 1i e con | 2i abbiamo indicato gli stessi stati che eravamo soliti chiamare | +i e | i (rispetto al nostro asse z prefissato). La risposta a questa domanda si trova anch’essa nelle nostre equazioni generali per i sistemi a due stati. Per prima cosa sappiamo che, poiché l’elettrone ha lo spin parallelo a B, esso si trova in uno stato stazionario con un’energia EI = µB. Perciò, sia C1 sia C2 devono variare come e iEI t/~ , come nella (9.18); e i loro coefficienti a1 e a2 sono dati dalla (10.5), cioè a1 H12 = a2 EI H11
(10.24)
Una condizione supplementare è che a1 e a2 devono essere normalizzati in modo che sia |a1 | 2 + |a2 | 2 = 1. Possiamo ricavare H11 e H12 dalla (10.22) facendo uso di Bz = B cos ✓ Bx = B sen ✓ cos By = B sen ✓ sen Si ottiene così
H11 = µB cos ✓ H12 = µB sen ✓ (cos
i sen )
(10.25)
10.7 • L’elettrone con spin in un campo magnetico
© 978-8808-22107-0
Siccome l’ultimo fattore della seconda equazione non è altro che e semplicemente H12 = µB sen ✓ e i
i
, si può scrivere più (10.26)
Sostituendo questi elementi di matrice nella (10.24), ed eliminando µB dal numeratore e dal denominatore, si trova a1 sen ✓ e i = (10.27) a2 1 cos ✓ Dal valore di questo rapporto e dalla condizione di normalizzazione, possiamo ricavare sia a1 sia a2 . Non è difficile, ma si può prendere una scorciatoia ricorrendo a un trucchetto. Notate che 1
cos ✓ = 2 sen2
e che sen ✓ = 2 sen
✓ 2
✓ ✓ cos 2 2
L’equazione (10.27) è quindi equivalente a ✓ i a1 cos 2 e = ✓ a2 sen 2
(10.28)
Una possibile soluzione, dunque, è la seguente: a1 = cos
✓ e 2
i
a2 = sin
✓ 2
(10.29)
poiché soddisfa la (10.28), e inoltre è tale che |a1 | 2 + |a2 | 2 = 1 Come già sapete, nulla cambia se si moltiplicano sia a1 sia a2 per un arbitrario fattore di fase. Di solito si preferisce rendere le equazioni (10.29) più simmetriche moltiplicando entrambe per ei /2 . Perciò, la forma che viene normalmente usata è a1 = cos
✓ e 2
i /2
a2 = sen
✓ +i e 2
/2
(10.30)
e questa rappresenta la soluzione del nostro problema. I numeri a1 e a2 sono le ampiezze relative a trovare l’elettrone con lo spin su o giù lungo l’asse z quando sappiamo che il suo spin è allineato lungo l’asse ✓ e . (Le ampiezze C1 e C2 sono semplicemente a1 e a2 moltiplicate per e iEI t/~ .) Osservate ora una cosa interessante. L’intensità B del campo magnetico non appare in nessun punto delle (10.30). Il risultato è perciò chiaramente lo stesso anche se B va a zero. Ciò significa che noi abbiamo risposto in generale alla domanda su come rappresentare una particella il cui spin sia diretto lungo un asse arbitrario. Le ampiezze della (10.30) sono le ampiezze di proiezione per le particelle di spin un mezzo e corrispondono alle ampiezze di proiezione per le particelle di spin uno che abbiamo dato nel capitolo 5, equazioni (5.38). Possiamo ora trovare quali sono le ampiezze di probabilità per attraversare un qualsiasi filtro di Stern-Gerlach, per un fascio filtrato di particelle a spin un mezzo. Rappresentiamo con | +zi un stato con lo spin su rispetto all’asse z, e con | zi l’analogo stato di spin giù. Se | +z 0i rappresenta uno stato con lo spin su rispetto a un asse z 0 che rispetto a z forma gli angoli polari ✓ e , allora, nelle notazioni del capitolo 5, abbiamo h+z | +z 0i = cos
✓ e 2
i /2
h z | +z 0i = sen
✓ +i e 2
/2
(10.31)
Questi risultati sono equivalenti a quelli trovati nel capitolo 6, equazione (6.36), per mezzo di ragionamenti puramente geometrici. (Perciò, se avevate deciso di saltare il capitolo 6, avete qui in ogni modo i risultati essenziali.)
149
150
Capitolo 10 • Altri sistemi a due stati
© 978-8808-22107-0
Come esempio finale, consideriamone uno che abbiamo già menzionato un certo numero di volte. Pensiamo di porci il seguente problema. Partiamo con un elettrone il cui spin sia diretto lungo una direzione data, facciamo poi agire un campo magnetico in direzione z per 25 min, e poi togliamolo. Qual è lo stato finale? Ancora una volta, rappresentiamo lo stato con la combinazione lineare | i = | 1i C1 + | 2i C2 Per questo problema, tuttavia, gli stati di energia definita sono proprio i nostri stati di base | 1i e | 2i. Perciò C1 e C2 varieranno solo in fase. Noi sappiamo che C1 (t) = C1 (0) e
iEI t/~
= C1 (0) e+iµBt/~
C2 (t) = C2 (0) e
iEII t/~
= C2 (0) e
iµBt/~
Ma abbiamo detto che inizialmente lo spin dell’elettrone era rivolto in una particolare direzione. Ciò implica che C1 e C2 sono i numeri dati dalle equazioni (10.30). Dopo che è trascorso un periodo di tempo T, i nuovi C1 e C2 sono gli stessi due numeri moltiplicati rispettivamente per eiµBz T /~ ed e iµBz T /~ . Ma che stato è questo? È facile dirlo. È esattamente lo stesso che si avrebbe variando l’angolo sottraendogli la quantità 2µBz T/~ e lasciando inalterato ✓. Ciò significa che alla fine del tempo T, lo stato | i rappresenta un elettrone allineato in una direzione che differisce da quella originale solo per una rotazione intorno all’asse z dell’angolo = 2µBz T/~. Poiché questo angolo è proporzionale a T, possiamo dire che la direzione dello spin precede intorno all’asse z con la velocità angolare 2µBz /~. Questo risultato lo avevamo già discusso in precedenza diverse volte, ma in un modo meno completo e rigoroso. Abbiamo ora ottenuto una descrizione quantistica completa e precisa della precessione dei magneti atomici. È interessante notare che il formalismo matematico, di cui abbiamo fatto ora uso per trattare l’elettrone con spin in un campo magnetico, può essere applicato a un qualsiasi sistema a due stati. Ciò significa che per mezzo di un’analogia matematica con il problema dell’elettrone, ogni problema sui sistemi a due stati può essere risolto in maniera puramente geometrica. Il modo di procedere è questo. Per prima cosa, spostate lo zero delle energie in modo che H11 + H22 sia uguale a zero e di conseguenza H11 = H22 . Fatto ciò, un qualunque sistema a due stati è formalmente uguale a quello dell’elettrone in un campo magnetico. Tutto ciò che bisogna fare è identificare µBz con H11 e µ (Bx iBy ) con H12 . Quale che sia il sistema fisico originale – una molecola d’ammoniaca o che so io – esso si può sempre riportare a un corrispondente problema su un elettrone. Quindi, se sappiamo risolvere il problema dell’elettrone in generale, sappiamo risolvere tutti i problemi per i sistemi a due stati. Ma noi abbiamo la soluzione generale per l’elettrone! Supponete di avere uno stato con lo spin «su» in una certa direzione, e di avere un campo magnetico B rivolto in una direzione differente. Bene, allora ruotate la direzione dello spin intorno all’asse di B in maniera che il vettore velocità angolare !(t) sia pari a una costante moltiplicata per il vettore B (cioè sia ! = 2µB/~ ). Quando B varia con il tempo, muovete anche l’asse di rotazione in modo da mantenerlo parallelo a B e variate anche la velocità di rotazione in modo che sia sempre proporzionale all’intensità di B (FIGURA 10.11). Se farete così, otterrete una certa orientazione finale dell’asse dello spin e le ampiezze C1 e C2 saranno date semplicemente dalle proiezioni sul vostro sistema di coordinate, che si otterranno Rotazione a per mezzo delle (10.30). Come vedete, sapere dove si va a finire con tutte queste rotazioni è semplicemente un problema geometrico. Per quanto sia Spin facile vedere quel che c’è sotto, non è facile risolvere esplicitamente nel caso generale questo problema geometrico (che consiste nel trovare il risultato finale di una rotazione con un vettore velocità angolare variabile). Comunque, abbiamo visto, almeno in linea di principio, qual è la soluzione generale per un qualsiasi problema a due stati. Nel prossimo capitolo esamineremo meglio le tecniche matematiche che consentono di trattare il FIGURA 10.11 La direzione dello spin di un elettrone caso importante di una particella a spin un mezzo, e di conseguenza, un in un campo magnetico variabile B(t) precede alla sistema a due stati in generale. frequenza ω(t) intorno a un asse parallelo a B.
11
Ancora sui sistemi a due stati
11.1
Le matrici di spin di Pauli
Continuiamo la nostra discussione dei sistemi a due stati. Alla fine del capitolo precedente stavamo parlando di una particella a spin un mezzo in un campo magnetico. Lo stato di spin veniva precisato dando l’ampiezza C1 che la componente z del momento angolare di spin fosse +~/2 e l’ampiezza C2 fosse ~/2. Nei capitoli precedenti abbiamo indicato questi stati di base con | +i e | i. Riprenderemo ora questa notazione, anche se in certe occasioni troveremo più conveniente usare indifferentemente | +i o | 1i e | i o | 2i. Abbiamo visto nel capitolo precedente che quando una particella di spin un mezzo con momento magnetico µ viene posta in un campo magnetico B = (Bx, By, Bz ), le ampiezze C+ (= C1 ) e C (= C2 ) sono legate dalle seguenti equazioni differenziali: f g dC+ = µ Bz C+ + (Bx iBy )C i~ dt (11.1) f g dC i~ = µ (Bx + iBy )C+ Bz C dt In altri termini, la matrice hamiltoniana Hi j è H11 = µBz
H12 = µ(Bx
H21 = µ(Bx + iBy )
H22 = +µBz
Inoltre le equazioni (11.1) sono ovviamente equivalenti a dCi X i~ = Hi j C j dt j
iBy )
(11.2)
(11.3)
dove i e j assumono i valori + e (oppure 1 e 2). Il sistema a due stati costituito dallo spin dell’elettrone è così importante che è bene avere un modo più chiaro di scrivere le formule. Faremo perciò una breve digressione matematica per mostrarvi come di solito si scrivono le equazioni relative a un sistema a due stati. Si fa così: per prima cosa, si osserva come ciascun termine dell’hamiltoniana sia proporzionale a µ e a qualche componente di B; da un punto di vista puramente formale, si può allora scrivere che ⇣ ⌘ y Hi j = µ ixj Bx + i j By + izj Bz (11.4) Fino a questo punto non abbiamo aggiunto niente di fisico: questa equazione significa soltanto y che i coefficienti ixj , i j e izj , che sono in tutto 4 · 3 = 12, possono essere calcolati in modo che la (11.4) sia identica alla (11.2). Vediamo come devono essere fatti. Cominciamo con Bz . Poiché Bz compare solo in H11 e H22 , tutto si sistema se z 11 z 21
=1 =0
z 12 z 22
=0 = 1
Ripasso: vol. 1, cap. 33, Polarizzazione
152
Capitolo 11 • Ancora sui sistemi a due stati
© 978-8808-22107-0
La matrice Hi j si scrive spesso sotto forma di una tabellina come: j! i#
H11 Hi j = H21
H12 H22
!
Per l’hamiltoniana di una particella di spin un mezzo in un campo magnetico Bz , si ottiene allora j!
µBz Hi j = * , µ (Bx + iBy )
µ (Bx iBy ) + +µBz -
i#
Allo stesso modo si possono scrivere i coefficienti
z ij
sotto forma di matrice:
j! z ij
1 = 0
0 1
i#
!
Passando ai coefficienti di Bx , si ottiene che i termini di x 11 x 21
x 12 x 22
=0 =1
Oppure, in forma più compatta, x ij
=
0 1
1 0
Infine, considerando By , si ottiene y 11 y 21
=i
ossia y ij
0 = i
x
devono essere
=1 =0
!
y 12 y 22
=0
(11.5)
i 0
(11.6)
= i =0 !
(11.7)
Con queste tre matrici sigma, le equazioni (11.2) e (11.4) sono identiche. Per lasciare posto agli indici i e j, abbiamo indicato quella che corrisponde a una data componente di B, ponendo x, y e z come indici in alto. In generale, però, gli indici i e j si omettono, perché è facile immaginarceli, e x, y e z vengono indicati come indici in basso. L’equazione (11.4) si scrive allora ⇣ ⌘ H = µ x Bx + y By + z Bz (11.8)
TABELLA
11.1
Le matrici
di spin di Pauli.
z
1 = 0
0 1
!
x
0 = 1
1 0
!
y
0 = i
i 0
!
1 1= 0
0 1
!
Dato che le matrici sigma sono così importanti da essere usate di continuo dai fisici professionisti, le abbiamo raccolte insieme nella TABELLA 11.1. (È bene che chiunque intenda lavorare in fisica quantistica le impari a memoria.) Esse vengono dette anche matrici di spin di Pauli dal nome del fisico che le ha inventate. Abbiamo incluso nella tabella un’ulteriore matrice due per due che è necessaria se si vuole essere in grado di trattare un sistema che ha due stati di spin della stessa energia, oppure se si vuole scegliere uno zero diverso per l’energia. In tal caso, bisogna aggiungere E0 C+ alla prima equazione delle (11.1) ed E0 C alla seconda. Possiamo includere anche questo caso nella nuova notazione pur di definire la matrice unità «1» come i j , ! 1 0 1 = ij = (11.9) 0 1 e di riscrivere l’equazione (11.8) come H = E0
ij
µ
⇣
x Bx
+
y By
+
z Bz
⌘
(11.10)
11.1 • Le matrici di spin di Pauli
© 978-8808-22107-0
Di solito si sottintende che ogni costante come E0 vada automaticamente moltiplicata per la matrice unità; perciò si scrive semplicemente ⇣ ⌘ H = E0 µ x Bx + y By + z Bz (11.11)
Una delle ragioni per cui le matrici di spin sono così utili è che una qualsiasi matrice due per due può essere scritta in funzione di queste ultime. Qualsiasi matrice che vi possa venire in mente di scrivere è costituita da quattro numeri; poniamo ! a b M= c d E può essere scritta come combinazione lineare di quattro matrici. Per esempio, ! ! ! ! 1 0 0 1 0 0 0 0 M=a +b +c +d 0 0 0 0 1 0 0 1 Ci sono molti modi di fare questa decomposizione, ma un modo particolarmente importante è quello di dire che M è uguale a un po’ di x , più un po’ di y , e così via, nel modo seguente: M = ↵1 +
x
+
y
+
z
dove le «quantità», ↵, , e sono, in generale, numeri complessi. Poiché ogni matrice due per due può essere rappresentata mediante la matrice unità e le matrici sigma, abbiamo tutto ciò che ci serve per trattare un qualsiasi sistema a due stati. L’equazione hamiltoniana per un qualsiasi sistema a due stati, sia esso la molecola di ammoniaca, o il colorante magenta o altro, può sempre esprimersi tramite le sigma. Per quanto queste ultime sembrino avere un significato geometrico nella situazione fisica in cui si ha un elettrone in un campo magnetico, tuttavia esse possono essere considerate semplicemente come delle utili matrici da usarsi per lo studio di un qualsiasi sistema a due stati. Per esempio, da un certo punto di vista, il protone e il neutrone possono essere considerati come la stessa particella in uno di due possibili stati. Si dice allora che il nucleone (il protone o il neutrone) costituisce un sistema a due stati; in questo caso, due stati distinti dalla carica. In questa prospettiva, lo stato | 1i può rappresentare il protone e lo stato | 2i il neutrone. Si usa dire che il nucleone ha due stati di «spin isotopico». Poiché ci accingiamo a impiegare le matrici sigma per l’«aritmetica» della meccanica quantistica dei sistemi a due stati, sarà bene passare rapidamente in rassegna le convenzioni dell’algebra delle matrici. Per «somma» di due o più matrici s’intende semplicemente quel che risulta ovvio dall’equazione (11.4). In generale, se si «sommano» due matrici A e B, s’intende per «somma» la matrice C i cui elementi di matrice Ci j sono dati da Ci j = Ai j + Bi j Ciascun termine di C è la somma dei termini che appaiono nei posti corrispondenti di A e B. Nel paragrafo 5.6 abbiamo già introdotto la nozione di matrice «prodotto». Questa stessa nozione ci sarà utile nel calcolo con le matrici sigma. In generale, il «prodotto» delle due matrici A e B (in questo ordine) è definito come una matrice C i cui elementi sono X Ci j = Aik Bk j (11.12) k
Si tratta della somma dei prodotti dei termini corrispondenti presi dalla i-esima riga di A e dalla k-esima colonna di B. Se le matrici sono scritte in forma di tabella, come in FIGURA 11.1, si ha un buon «sistema» per ottenere gli elementi della matrice prodotto. Ammettiamo che si voglia calcolare C23 . Si muove l’indice sinistro lungo la seconda riga di A e l’indice destro giù per la terza colonna di B, moltiplicando ciascuna coppia di termini e sommando via via che si procede. Abbiamo provato a indicare come procedere nella figura.
153
154
Capitolo 11 • Ancora sui sistemi a due stati
© 978-8808-22107-0
. .
..
...
....
.. ... ....
FIGURA
11.1
Moltiplicazione di due matrici.
Naturalmente, per matrici due per due, tutto ciò è particolarmente semplice. Per esempio, se moltiplichiamo x per y , otteniamo ! ! ! 0 1 0 1 1 0 2 x = x · x = 1 0 · 1 0 = 0 1 che è proprio la matrice unità 1. Oppure, per fare un altro esempio, calcoliamo ! ! ! 0 1 0 i i 0 = · = x y 1 0 i 0 0 i
11.2 Prodotti delle matrici di spin.
TABELLA
2 x
=1
2 y
=1
2 z
=1
x
y
= y
z
= z
=
= y
=i
z
y
=i
x
z
=i
y
= z
x
x
= x
x
y:
Facendo riferimento alla TABELLA 11.1, si vede che il prodotto è proprio i volte la matrice z .(Si ricordi che moltiplicare un numero per una matrice significa semplicemente moltiplicare ogni elemento della matrice per quel numero.) Poiché i prodotti a due a due delle matrici sigma sono importanti, oltre che abbastanza divertenti, li abbiamo elencati nella TABELLA 11.2. Ve li potete calcolare come abbiamo fatto per 2x e per x y . C’è da notare un altro punto molto notevole e interessante a riguardo di queste matrici . Se vogliamo, possiamo assimilare le tre matrici x , y e z alle tre componenti di un vettore, talvolta indicato come il «vettore sigma» e scritto . Si tratta in effetti di un «vettore matrice» o di una «matrice vettore». Sono tre differenti matrici, ciascuna associata con uno degli assi x, y e z. Con questa notazione si può scrivere l’hamiltoniana del sistema in una forma elegante valida in tutti i sistemi di coordinate: H= µ ·B (11.13) Anche se abbiamo scritto le nostre tre matrici nella rappresentazione in cui «su» e «giù» sono in direzione dell’asse z, di modo che z risulti particolarmente semplice, tuttavia potremmo calcolare la forma di queste matrici in un’altra rappresentazione. Per quanto occorra fare molti conti algebrici, si può tuttavia mostrare che esse si trasformano tra loro come le componenti di un vettore. (Per ora, però, non ci prenderemo la briga di dimostrarlo. Lo potete controllare da voi, se volete.) Si può far uso di in differenti sistemi di coordinate proprio come se fosse un vettore. Si ricorderà che H, in meccanica quantistica, è collegata all’energia. Infatti è proprio uguale all’energia nel caso semplice in cui si ha un solo stato. Ma anche per il particolare sistema a due stati dello spin dell’elettrone, l’hamiltoniana scritta nella forma dell’equazione (11.13) assomiglia moltissimo alla formula classica che esprime l’energia di un piccolo magnete di momento magnetico µ in un campo magnetico B. Secondo la fisica classica, si scriverebbe U = µ·B
(11.14)
dove µ è la suddetta caratteristica dell’oggetto e B è un campo esterno. Possiamo immaginare di trasformare l’equazione (11.14) nella (11.13) sostituendo all’energia classica l’hamiltoniana e al dato classico µ la matrice µ . Poi, dopo questa sostituzione puramente formale, possiamo interpretare il risultato come un’equazione tra matrici. Si dice talvolta che a ogni quantità della
11.2 • Le matrici di spin come operatori
© 978-8808-22107-0
fisica classica corrisponde una matrice in meccanica quantistica. In realtà, sarebbe più corretto dire che la matrice hamiltoniana corrisponde all’energia e che ogni quantità che può essere definita per il tramite dell’energia ha una corrispondente matrice. Per esempio, il momento magnetico può essere definito per il tramite dell’energia dicendo che l’energia in un campo esterno B è µ · B. Questa è la definizione del vettore momento magnetico µ. Si prende poi in considerazione la formula che dà l’hamiltoniana di un oggetto reale (quantistico) in un campo magnetico, e si cerca di identificare quali matrici corrispondano alle varie quantità che appaiono nella espressione classica. Questa è la maniera secondo la quale qualche volta le quantità classiche hanno un corrispondente quantistico. Potete provare, se credete, a capire come un vettore classico venga a essere uguale a una matrice µ , e può darsi che scopriate qualche cosa di interessante, ma non vi ci rompete la testa sopra. Il problema è mal formulato; non sono uguali. La meccanica quantistica è un diverso tipo di teoria per la rappresentazione dell’universo. Per l’appunto, capita che ci siano alcune corrispondenze, che sono poco più che regole mnemoniche, cose cioè da ricordare. Ovvero, si ricorda dallo studio della fisica classica l’equazione (11.14); dopo di che, se si tiene a mente la corrispondenza µ ! µ , si ha un aggancio per ricordarsi l’equazione (11.13). Ovviamente, la natura conosce la meccanica quantistica mentre la meccanica classica è solo un’approssimazione; non c’è perciò alcun mistero nel fatto che nella meccanica classica si trovi una qualche reminiscenza delle leggi quantistiche, che sono quelle che veramente stanno alla base. Non è possibile in alcuna maniera diretta ricostruire l’oggetto originale, ma l’ombra vi aiuta a ricordare l’aspetto dell’oggetto in questione. L’equazione (11.13) è la realtà, e l’equazione (11.14) la sua ombra. Dato che s’impara per prima la meccanica classica, ci piacerebbe poter derivare da questa le formule quantistiche, ma non c’è alcun sistema a prova di bomba per farlo. Bisogna sempre ritornare al mondo reale e scoprire le equazioni quantistiche corrette. E quando viene fuori che queste assomigliano un poco alla fisica classica, ci possiamo dire fortunati. Se vi sembra che io la stia facendo troppo lunga con queste avvertenze e che seguiti a battere su delle ovvie verità sulle relazioni tra fisica classica e quantistica, vi prego di scusare i riflessi condizionati di un professore che è abituato a insegnare la meccanica quantistica a studenti che non avevano mai sentito parlare delle matrici di spin di Pauli prima di arrivare ai corsi superiori. Ed essi hanno sempre l’aria di sperare che, in qualche modo, la meccanica quantistica si possa ottenere come conseguenza logica della meccanica classica, da loro studiata in profondità nel corso degli anni precedenti. (Forse avrebbero voluto evitare di dover studiare qualche cosa di nuovo.) Voi, invece, avete imparato la formula classica, l’equazione (11.14), solo pochi mesi fa, e già allora con le dovute riserve, e quindi dovreste essere nelle migliori disposizioni per accettare la formula quantistica, l’equazione (11.13), come vera a un livello più fondamentale.
11.2
Le matrici di spin come operatori
Visto che stiamo considerando l’argomento delle notazioni matematiche, vogliamo esporre ancora un’altra maniera di scrivere le cose, che è molto usata per la sua compattezza. Essa segue direttamente dalla notazione introdotta nel capitolo 8. Se si ha un sistema nello stato | (t)i, che varia con il tempo, si può, come già abbiamo fatto per l’equazione (8.34), scrivere l’ampiezza che, al tempo t + t, il sistema si trovi nello stato | ii come hi | (t + t)i =
X
hi | U(t + t, t) | ji h j | (t)i
j
L’elemento di matrice hi | U(t + t, t) | ji è l’ampiezza relativa alla transizione, nell’intervallo di tempo t, dallo stato di base | ji allo stato di base | ii. Abbiamo poi definito Hi j mediante la relazione i hi | U(t + t, t) | ji = i j Hi j (t) t ~
155
156
Capitolo 11 • Ancora sui sistemi a due stati
© 978-8808-22107-0
e abbiamo mostrato che le ampiezze Ci (t) = hi | (t)i sono legate dalle equazioni differenziali dCi X i~ = Hi j C j (11.15) dt j Se scriviamo le ampiezze Ci in forma esplicita, la stessa equazione diviene X d i~ hi | i = Hi j h j | i dt j
(11.16)
Ma gli elementi di matrice Hi j sono anch’essi delle ampiezze che possono essere poste nella forma hi | H | ji, di modo che la nostra equazione differenziale si può scrivere come X d i~ hi | i = hi | H | ji h j | i (11.17) dt j Si vede che i/~ hi | H | ji dt è l’ampiezza che, nelle condizioni fisiche specificate da H, uno stato | ji «generi», nell’intervallo di tempo dt, lo stato | ii. (Tutto ciò è implicato dalla discussione fatta al paragrafo 8.4.) A questo punto, secondo quanto detto al paragrafo 8.2, possiamo togliere di mezzo il fattore comune hi | nell’equazione (11.17), in quanto quest’ultima è vera per ogni stato | ii, e scrivere semplicemente X d i~ | i = H | ji h j | i (11.18) dt j O anche, procedendo sulla stessa strada, possiamo rimuovere gli stati j e arrivare alla relazione i~
d | i=H| i dt
(11.19)
Nel capitolo 8 abbiamo fatto rilevare come in un’equazione di questo tipo, l’H che compare in H | ji o in H | i viene detto un operatore. D’ora in poi porremo su ogni operatore un piccolo cappello (ˆ) per ricordarvi che si tratta di un operatore e non di un semplice numero. Scriveremo perciò Hˆ | i. Per quanto le equazioni (11.18) e (11.19) abbiano lo stesso identico significato delle equazioni (11.17) o (11.15), possiamo però vederle ora da un diverso punto di vista. Per esempio, possiamo riformulare l’equazione (11.18) nel modo seguente: «La derivata temporale del vettore di stato | i si trova moltiplicando ciò che si ottiene operando con l’operatore hamiltoniano Hˆ su ciascuno stato di base, per l’ampiezza h j | i che si trovi nello stato j, e sommando poi su tutti i possibili j». Così pure, l’equazione (11.19) si può esprimere nei termini seguenti: «La derivata temporale (per i~) dello stato | i è uguale a ciò che si ottiene operando sul vettore di ˆ Non è che una maniera abbreviata di esprimere il contenuto stato | i con l’hamiltoniana H». dell’equazione (11.17), ma che, come vedrete, può essere di grande utilità. Se si vuole, si può andare oltre nel processo di «astrazione». L’equazione (11.19) è vera per ogni stato | i. Inoltre, al primo membro, anche i~ d/dt è un operatore – si tratta dell’operazione «derivare rispetto a t e moltiplicare per i~». Quindi, l’equazione (11.19) può anche essere considerata come un’equazione tra operatori, cioè come un’equazione operatoriale i~
d = Hˆ dt
L’operatore hamiltoniano conduce (a meno di una costante) allo stesso risultato che si ottiene operando con d/dt su uno stato qualsiasi. Ricordate però che questa equazione, come pure la (11.19), non significa che l’operatore Hˆ operi allo stesso modo di d/dt. Queste equazioni rappresentano le leggi della dinamica, o meglio le leggi del moto, per un sistema quantistico. Tanto per familiarizzarci con questi concetti, vi mostreremo un’altra maniera di giungere all’equazione (11.18). Voi sapete che si può esprimere un qualsiasi stato | i mediante le sue proiezioni su un certo insieme di stati di base (vedi l’equazione (8.8)), X | i= | ii hi | i (11.20) i
11.2 • Le matrici di spin come operatori
© 978-8808-22107-0
Come varia | i con il tempo? Facciamone la derivata: d d X | i= | ii hi | i dt dt i
(11.21)
Ma gli stati di base | ii non variano con il tempo (o, per lo meno, noi li prendiamo sempre come ben definiti stati fissi), mentre le ampiezze hi | i sono numeri che possono variare. Quindi, l’equazione (11.21) diviene X d d | i= | ii hi | i (11.22) dt dt i Poiché conosciamo dhi | i/dt dall’equazione (11.16), si ottiene d | i= dt
i X X | ii Hi j h j | i = ~ i j
i X | ii hi | H | ji h j | i = ~ ij
i X H | ji h j | i ~ j
Questa è nuovamente l’equazione (11.18). Si può quindi considerare l’hamiltoniana da vari punti di vista. Possiamo vedere l’insieme di coefficienti Hi j semplicemente come un mucchietto di numeri, oppure possiamo pensare alle ˆ Sono tutte «ampiezze» hi | H | ji, oppure alla «matrice» Hi j , oppure ancora all’«operatore» H. espressioni diverse della stessa cosa. Ritorniamo ora ai nostri sistemi a due stati. Se scriviamo l’hamiltoniana mediante le matrici sigma (con opportuni coefficienti numerici come Bx , ecc.), possiamo anche naturalmente raffigurarci ixj come un’ampiezza hi | x | ji, oppure, brevemente, come un operatore ˆ x . Se usiamo il concetto di operatore, possiamo scrivere l’equazione del moto di uno stato | i in un campo magnetico come d i~ | i = µ Bx ˆ x + By ˆ y + Bz ˆ z | i (11.23) dt Quando si vuole «usare» questa equazione, bisogna normalmente esprimere | i mediante dei vettori di base (proprio com’è necessario trovare le componenti dei vettori dello spazio quando si vogliono ottenere valori numerici nei vari casi particolari). Quindi, in generale, dovremo porre l’equazione (11.23) in una forma più estesa: i~
X d | i= µ Bx ˆ x + By ˆ y + Bz ˆ z | ii hi | i dt i
(11.24)
Adesso vedrete perché il concetto di operatore è così fine. Per usare l’equazione (11.24) è necessario sapere cosa succede quando gli operatori ˆ agiscono su ciascuno degli stati di base. Cerchiamo di capirlo. Supponiamo di prendere ˆ z | +i; questo è un qualche vettore | ?i. Ma quale? Moltiplicando a sinistra per h+ |; si ottiene h+ | ˆ z | +i =
z 11
=1
(ricorrendo alla TABELLA 11.1). Cioè sappiamo che h+ | ?i = 1
(11.25)
Adesso moltiplichiamo ˆ z | +i a sinistra per h |. Si ha h | ˆ z | +i =
z 21
=0
quindi h | ?i = 0
(11.26)
C’è un solo vettore di stato che soddisfi sia la (11.25) sia la (11.26); questo è | +i. Si è dunque scoperto che ˆ z | +i = | +i (11.27)
157
158
Capitolo 11 • Ancora sui sistemi a due stati
© 978-8808-22107-0
Con ragionamenti di questo tipo potete dimostrare facilmente che tutte le proprietà delle matrici sigma come operatori possono essere riassunte dall’insieme di regole riportate nella TABELLA 11.3. I prodotti di matrici sigma vanno intesi ora come prodotti di operatori. Quando due operatori appaiono insieme in un prodotto, bisogna prima fare agire l’operatore che è più a destra. Per esempio, per ˆ x ˆ y | +i si deve intendere ˆ x ( ˆ y | +i). Dalla TABELLA 11.3, si ottiene ˆ y | +i = i | i e quindi TABELLA 11.3 Proprietà dell’operatore σˆ .
ˆ z | +i = | +i ˆ z| i = | i ˆ x | +i = | i ˆ x | i = | +i ˆ y | +i = i | i ˆ y | i = i | +i
⇣ ⌘ ˆ x ˆ y | +i = ˆ x i | i
(11.28)
Ma un qualsiasi numero, come i, può scavalcare un operatore (poiché gli operatori agiscono solo su vettori di stato); quindi l’equazione (11.28) è equivalente a ˆ x ˆ y | +i = i ˆ x | i = i | +i Se si procede analogamente per ˆ x ˆ y | i, si trova che ˆxˆy| i= i| i Guardando la TABELLA 11.3, si vede che ˆ x ˆ y operando su | +i o | i dà lo stesso risultato che si ottiene operando con ˆ z e poi moltiplicando per i. Se ne ricava, quindi, che l’operazione ˆ x ˆ y è identica all’operazione i ˆ z , e si può mettere questa conclusione sotto forma di un’equazione tra operatori: ˆ xˆ y = iˆ z (11.29) Si noti che questa equazione è identica a una delle nostre relazioni tra matrici che compaiono nella TABELLA 11.2. Vediamo, quindi, una volta di più la corrispondenza che esiste tra il formalismo degli operatori e quello delle matrici. Così ognuna delle equazioni in TABELLA 11.2 può essere considerata anche come un’equazione fra gli operatori sigma. Si può infatti verificare che esse seguono dalla TABELLA 11.3. Quindi la miglior cosa da fare, quando si lavora con queste cose, è di ignorare se una quantità come oppure H sia un operatore oppure una matrice. Tutte le equazioni risultano identiche in ambedue i casi, e quindi, la TABELLA 11.2 riguarda sia gli operatori sigma sia le matrici sigma, a seconda di come preferite.
11.3
La soluzione delle equazioni per i sistemi a due stati
Siamo ora in grado di scrivere le nostre equazioni per i sistemi a due stati in varie forme, per esempio, come dCi X i~ = Hi j C j dt j oppure come
d | i = Hˆ | i (11.30) dt Entrambe hanno lo stesso significato. Per una particella a spin un mezzo in un campo magnetico, l’hamiltoniana H è data dall’equazione (11.8) o dall’equazione (11.13). Se il campo è diretto come l’asse z, allora, come ormai abbiamo visto tante volte, la soluzione è che lo stato | i, qualunque esso sia, precede intorno all’asse z (proprio come se si prendesse l’intero sistema fisico e lo si ruotasse in blocco intorno all’asse z) a una velocità angolare uguale al doppio del campo magnetico per µ/~. Lo stesso risultato si ottiene, chiaramente, quando il campo magnetico è orientato in una qualsiasi altra direzione, in quanto le leggi fisiche non dipendono dal sistema di coordinate. Se siamo in condizioni tali che il campo magnetico vari da istante a istante in modo complicato, possiamo allora analizzare la situazione nel modo seguente. Supponiamo di partire con lo spin in direzione dell’asse +z e il campo magnetico lungo l’asse x. Lo spin comincia a girare. Se allora si spegne il campo lungo l’asse x, lo spin smette di ruotare. Se adesso i~
11.4 • Gli stati di polarizzazione del fotone
© 978-8808-22107-0
si accende un campo lungo l’asse z, lo spin precede intorno a z, e così via. Quindi, a seconda di come il campo varia con il tempo, ci si può immaginare quale sarà lo stato finale, cioè in quale direzione sarà rivolto. A questo punto, si può riportare questo stato di nuovo agli stati originali | +i e | i rispetto all’asse z, facendo ricorso alle formule di proiezione che abbiamo stabilito nel capitolo 10 (o nel capitolo 6). Se lo stato finale ha lo spin in direzione (✓, ), avrà un’ampiezza corrispondente allo stato «su» pari a cos(✓/2)e i /2 e un’ampiezza corrispondente a quello «giù» pari a sen(✓/2)e+i /2 . In questo modo, si risolve un problema qualsiasi. È questa una descrizione a parole della soluzione delle equazioni differenziali. La soluzione suddetta è abbastanza generale da andar bene per ogni sistema a due stati. Riprendiamo il nostro esempio della molecola di ammoniaca, considerando anche l’effetto di un campo elettrico. Se descriviamo il sistema mediante gli stati | Ii e | IIi, le equazioni (9.38) e (9.39) diventano: dCI i~ = +ACI + µECII dt (11.31) dCII i~ = ACII + µECI dt Voi direte: «No, perché mi ricordo che c’era in mezzo un E0 ». Sì, ma abbiamo spostato l’origine dell’energia in modo da rendere zero E0 . (Si può sempre ottenere questo risultato moltiplicando entrambe le ampiezze per il fattore comune di fase eiE0T /~ , liberandosi così da una qualsiasi costante energetica.) Ma se equazioni corrispondenti hanno le stesse soluzioni, allora è veramente inutile fare lo stesso lavoro due volte. Se confrontiamo queste equazioni con le (11.1), possiamo fare le seguenti identificazioni. Chiamiamo con | Ii lo stato | +i e con | IIi lo stato | i. Questo non significa che stiamo mettendo in fila le molecole di ammoniaca, o che | +i o | i abbiano a che fare con l’asse z. È una cosa puramente formale. Possiamo pensare a uno spazio fittizio che potremmo chiamare «spazio rappresentativo della molecola di ammoniaca», o qualcosa del genere, come a un «diagramma» tridimensionale in cui essere «su» corrisponda ad avere la molecola nello stato | Ii ed essere «giù», rispetto a questo fittizio asse z, corrisponda ad avere la molecola nello stato | IIi. Si può allora porre la seguente corrispondenza tra le equazioni. Prima di tutto, si vede che l’hamiltoniana può essere espressa mediante le matrici sigma come H = +A
z
+ µE
x
(11.32)
Oppure, in altri termini, µBz nell’equazione (11.1) corrisponde a A nell’equazione (11.32), e µBx corrisponde a µE. Nel nostro spazio «rappresentativo» si ha dunque un campo costante B diretto lungo l’asse z. Se poi si ha un campo elettrico E che varia con il tempo, questo corrisponde a un campo B diretto lungo l’asse x che varia in proporzione. Quindi, il comportamento di un elettrone in un campo magnetico che ha una componente costante lungo l’asse z e una componente oscillante lungo l’asse x, è matematicamente analogo, e corrisponde esattamente al comportamento di una molecola di ammoniaca in un campo elettrico oscillante. Sfortunatamente, non abbiamo tempo per addentrarci di più nei particolari di questa corrispondenza, o di elaborarne i vari aspetti tecnici. Abbiamo voluto soltanto sottolineare il concetto che tutti i sistemi a due stati possono essere trattati in modo del tutto analogo a un oggetto di spin un mezzo che precede in un campo magnetico.
11.4
Gli stati di polarizzazione del fotone
Ci sono diversi altri sistemi a due stati che è interessante studiare, e il primo del quale vogliamo parlare è il fotone. Per descrivere un fotone, dobbiamo innanzitutto specificarne il vettore impulso. Per un fotone libero, la frequenza è determinata dall’impulso, e quindi non dovremo aggiungere quale sia la frequenza. Ma oltre a ciò, si ha ancora una proprietà detta polarizzazione. Immaginiamo un fotone che arrivi con una ben definita frequenza monocromatica (quest’ultima verrà tenuta fissa durante tutta questa discussione in modo da non avere a che fare con tanti stati di impulso). Si hanno allora due direzioni di polarizzazione. Nella teoria classica, si può considerare
159
160
Capitolo 11 • Ancora sui sistemi a due stati
y'
y x' x
11.2 Sistema di coordinate perpendicolari al vettore impulso del fotone. FIGURA
© 978-8808-22107-0
della luce il cui campo elettrico oscilli orizzontalmente oppure della luce il cui campo elettrico oscilli verticalmente (per esempio); questi due tipi di luce si dicono luce polarizzata secondo x e luce polarizzata secondo y. La luce può essere anche polarizzata in qualche altra direzione che può ottenersi dalla sovrapposizione di un campo nella direzione dell’asse x e di uno nella direzione dell’asse y. Oppure, se si prendono le componenti x e y sfasate di 90°, si ottiene un campo elettrico ruotante e la luce è polarizzata ellitticamente. (Questa non è altro che una breve rassegna della teoria classica della polarizzazione della luce che abbiamo studiato nel cap. 33 del vol. 1.) Ma supponiamo ora d’avere un singolo fotone, proprio uno solo. In questo caso, non c’è un campo elettrico di cui si possa parlare come prima. Tutto ciò che abbiamo è un solo fotone. Ma anche per un solo fotone si deve avere il corrispondente del fenomeno classico della polarizzazione. Ci devono essere almeno due tipi differenti di fotoni. A prima vista, si potrebbe pensare che ce ne debbano essere una varietà infinita: dopotutto, il vettore elettrico può avere una direzione arbitraria. Si può, tuttavia, descrivere la polarizzazione del fotone come un sistema a due stati. Il fotone può trovarsi nello stato | xi oppure nello stato | yi. Con | xi indichiamo lo stato di polarizzazione di ciascuno dei fotoni di un raggio di luce che, classicamente, è polarizzata secondo l’asse x. D’altra parte, indichiamo con | yi lo stato di polarizzazione di ciascuno dei fotoni in un fascio di luce polarizzato secondo l’asse y. Possiamo prendere | xi e | yi come nostri stati di base per un fotone di dato impulso che punta verso di voi, in quella che prendiamo come direzione dell’asse z. Ci sono quindi due stati di base | xi e | yi, e questi sono tutto ciò che serve per descrivere un qualsiasi fotone. Per esempio, se abbiamo un filtro polaroid con l’asse diretto in modo da lasciar passare luce polarizzata in quella che diciamo direzione dell’asse x, e inviamo verso di esso un fotone che sappiamo essere nello stato | yi, il fotone sarà assorbito dal polaroid. Se invece vi inviamo un fotone che sappiamo essere nello stato | xi, esso uscirà ancora nello stato | xi. Se prendiamo un pezzo di calcite che separa un raggio di luce polarizzata in due raggi, uno | xi e l’altro | yi, il pezzo di calcite è l’analogo perfetto di un apparecchio di Stern-Gerlach che separa un fascio di atomi di argento nei due stati | +i e | i. Perciò tutto quel che si è fatto con particelle e apparecchi di Stern-Gerlach, può essere ripetuto con la luce e dei frammenti di calcite. E cosa si potrà dire della luce filtrata attraverso un polaroid posto a un angolo ✓? Si tratta di un altro stato? Sì, certamente, si tratta di un diverso stato. Indichiamo l’asse del polarizzatore con x 0 per distinguerlo dall’asse x dei nostri stati di base (FIGURA 11.2). Un fotone che esce dal polarizzatore sarà nello stato | x 0i. Ma ogni stato può essere rappresentato come una combinazione lineare degli stati di base e la formula che dà la sovrapposizione, in questo caso, è | x 0i = cos ✓ | xi + sen ✓ | yi
(11.33)
Vale a dire, se un fotone passa attraverso un materiale polarizzante posto a un angolo ✓ (rispetto a x), esso può ancora essere analizzato in due raggi, | xi e | yi, per esempio, con un frammento di calcite. Oppure, se preferite, lo si potrà analizzare nelle sue componenti x e y nella vostra immaginazione. In tutti e due i modi, si ottiene un’ampiezza pari a cos ✓ di trovarlo nello stato | xi e un’ampiezza pari a sen ✓ di trovarlo nello stato | yi. Ci poniamo ora questa domanda: supponiamo che un fotone venga polarizzato nella direzione x 0 da un polarizzatore posto a un angolo ✓, e giunga poi a un polarizzatore posto invece in corrispondenza all’angolo zero, come in FIGURA 11.3; che cosa succederà? Qual è la probabilità che lo attraversi? La risposta è la seguente. Dopo avere attraversato il primo polaroid esso si troverà senz’altro nello stato | x 0i. Il secondo polaroid lascerà passare il fotone se esso si trova nello stato | xi (mentre lo assorbirà se si trova nello stato | yi). Quindi, quello che dobbiamo chiederci è con quale probabilità il fotone ci si mostrerà nello stato | xi? Otterremo questa probabilità facendo il modulo quadrato dell’ampiezza hx | x 0i che un fotone nello stato | x 0i si trovi anche nello stato | xi. Che cos’è hx | x 0i? Basta moltiplicare l’equazione (11.33) per hx | per ottenere hx | x 0i = cos ✓ hx | xi + sen ✓ hx | yi Ma hx | yi = 0, per motivi fisici, come deve essere se | xi e | yi sono stati di base, mentre hx | xi = 1. Quindi si ricava hx | x 0i = cos ✓
161
11.4 • Gli stati di polarizzazione del fotone
© 978-8808-22107-0
11.3 Due filtri polaroid i cui piani di polarizzazione formano un angolo ✓ . FIGURA
y
Asse del polarizzatore
y
Luce x
x
z Stato
e la probabilità è cos2 ✓. Per esempio, se il primo polarizzatore è posto a 30°, un fotone attraverserà tutto il dispositivo per 3/4 del tempo, mentre per 1/4 del tempo verrà assorbito dal polarizzatore contribuendo a riscaldarlo. Vediamo ora che cosa succederebbe nelle medesime circostanze secondo la fisica classica. Avremmo un raggio di luce il cui campo elettrico varia in un modo o nell’altro, diciamo che sia «non polarizzato». Dopo aver attraversato il primo polaroid, il campo elettrico oscillerà nella direzione x 0 con una grandezza E; rappresenteremo il campo con un vettore oscillante con valore massimo E0 , o in un diagramma come quello di FIGURA 11.4. Quando la luce arriva al secondo polaroid, solo la componente x, E0 cos ✓, del campo elettrico lo attraversa. Ma l’intensità è proporzionale al quadrato del campo e quindi a E20 cos2 ✓. Quindi l’energia che passa attraverso il dispositivo è cos2 ✓ volte più debole di quella che è entrata nell’ultimo polarizzatore. La rappresentazione classica e quella quantistica danno risultati simili. Se immaginate ora di inviare 10 miliardi di fotoni verso il secondo polarizzatore, e la probabilità media di passare per ciascuno di essi è, per esempio, 3/4, ci aspettiamo che 3/4 di 10 miliardi riusciranno ad attraversarlo. Analogamente, l’energia da essi trasportata sarà 3/4 dell’energia che avete cercato di far passare. La teoria classica non dice nulla dell’aspetto statistico della questione; dice semplicemente che l’energia che passerà sarà esattamente 3/4 dell’energia che avrete mandato dentro. Questo, naturalmente, è impossibile se c’è un solo fotone. Non esiste un qualcosa che corrisponda a 3/4 di un fotone. O c’è tutto intero, oppure non c’è per niente. La meccanica quantistica ci dice che c’è, tutto intero, per 3/4 del tempo. La relazione tra le due teorie è chiara. Cosa possiamo dire circa gli altri possibili tipi di polarizzazione? Per esempio, per la polarizzazione circolare destrogira? Nella teoria classica, la polarizzazione circolare destrogira corrisponde a uguali componenti x e y sfasate tra loro di 90°. Nella teoria quantistica, un fotone con polarizzazione circolare destrogira (CD) ha uguali ampiezze di essere polarizzato | xi o | yi, e le ampiezze sono sfasate di 90°. Indicando con | Di un fotone con polarizzazione CD e con | Li un fotone con polarizzazione circolare levogira (CL), possiamo scrivere (vedi par. 33.1 del vol. 1): ⌘ 1 ⇣ | Di = p | xi + i | yi 2 (11.34) ⌘ 1 ⇣ | Li = p | xi i | yi 2 p (il fattore 1/ 2 è stato introdotto per avere stati normalizzati). Con questi stati potete calcolare qualsiasi effetto di filtraggio o di interferenza usando le leggi della teoria quantistica. Volendo, si possono anche scegliere | Di e | Li come stati di base ed esprimere tutto in funzione di questi ultimi. Basta prima dimostrare che hD | Li = 0, cosa che si può fare prendendo la complessa coniugata della prima equazione scritta sopra [vedi l’equazione (8.13)] e moltiplicandola per la
y
x
11.4 Lo schema classico per il vettore E. FIGURA
162
Capitolo 11 • Ancora sui sistemi a due stati
© 978-8808-22107-0
seconda. Si può analizzare la luce prendendo come stati di base le polarizzazioni x e y, oppure x 0 e y 0, oppure ancora quelle destrogire e levogire. Tanto per fare un esempio, cominciamo a invertire le nostre formule. Possiamo esprimere lo stato | xi come combinazione degli stati di polarizzazione CD e CL? Certo, ecco fatto: ⌘ 1 ⇣ | xi = p | Di + | Li 2 ⌘ i ⇣ | yi = p | Di | Li 2
(11.35)
Dimostrazione: basta sommare e sottrarre le due equazioni (11.34). È facile passare dall’una all’altra base. È bene però notare un fatto curioso. Se un fotone ha una polarizzazione circolare destrogira, esso non ha niente a che vedere con gli assi x e y. Se guardassimo la stessa cosa da un sistema di coordinate ruotato di un dato angolo intorno alla direzione di volo, la luce apparirebbe ancora polarizzata circolarmente in senso destrogiro, e analogamente per la polarizzazione levogira. La luce con polarizzazione circolare destrogira o levogira rimane la stessa per una qualsiasi di tali rotazioni; la definizione è indipendente dalla scelta della direzione x (a parte il fatto che la direzione del fotone è fissata). Non è interessante che non occorra specificare gli assi per definire questi stati di polarizzazione? Quindi, essi sono molto migliori di x e y. D’altra parte non sembra quasi un miracolo che quando si sommano insieme gli stati | Di e | Li, si può di nuovo sapere quale era la direzione x? Se «destrogiro» e «levogiro» non dipendono in nessun modo da x, come succede che poi si possono di nuovo mettere insieme per ottenere x? Possiamo in parte rispondere a questa domanda scrivendo lo stato | D 0i, che rappresenta un fotone con polarizzazione CD nel sistema x 0, y 0. In questo sistema si scriverebbe ⌘ 1 ⇣ | D 0i = p | x 0i + i | y 0i 2
Come si presenta questo stato nel sistema x, y? Basta sostituire | x 0i con ciò che si ricava dall’equazione (11.33) e analogamente per | y 0i – per quest’ultimo non abbiamo scritto l’analoga espressione che è ( sen ✓) | xi + (cos ✓) | yi Quindi
1 | D 0i = p 2 1 =p 2 1 =p 2
f
cos ✓ | xi + sen ✓ | yi
f
(cos ✓
⇣
⌘ | xi + i | yi (cos ✓
g i sen ✓ | xi + i cos ✓ | yi =
i sen ✓) | xi + i(cos ✓
Il primo fattore è proprio | Di; il secondo è e
i✓ ;
| D 0i = e
g i sen ✓) | yi =
i sen ✓) abbiamo perciò trovato che i✓
(11.36)
| Di
Gli stati | D 0i e | Di sono uguali, a parte il fattore di fase e si ottiene che(1) | L 0i = e+i✓ | Li
i✓ .
Rifacendo la stessa cosa per | L 0i, (11.37)
Ora capite quello che succede. Se sommiamo | Di e | Li, otteniamo un risultato diverso da quello che si ha sommando | D 0i e | L 0i. Per esempio, un fotone polarizzato secondo x è dato (1) Questi risultati sono analoghi a quelli trovati (nel capitolo 6) per una particella di spin un mezzo in corrispondenza a una rotazione intorno all’asse z del sistema di riferimento; in quel caso avevamo ottenuto il fattore di fase e±i /2 . Il risultato, infatti, è esattamente uguale a quello scritto nel paragrafo 5.7 per gli stati | +i e | i di una particella a spin uno; e non è una coincidenza. Il fotone è una particella di spin uno, la quale però non ha uno stato «zero».
11.5 • Il mesone K neutro
© 978-8808-22107-0
(equazione (11.35)) dalla somma di | Di e | Li, mentre un fotone polarizzato secondo y è dato dalla somma dell’uno sfasato di 90° in un senso e dell’altro sfasato di 90° nel senso opposto. Questo è precisamente ciò che si ottiene dalla somma di | D 0i e | L 0i per il valore particolare dell’angolo ✓ = 90°, e questo è giusto. Una polarizzazione x nel sistema con gli apici è la stessa cosa che una polarizzazione y nel sistema originale. Quindi non è esattamente vero che un fotone polarizzato circolarmente viene visto allo stesso modo in ogni sistema di assi. La sua fase (cioè la relazione di fase tra gli stati di polarizzazione circolare destrogira e levogira) tiene conto della direzione x.
11.5
Il mesone K neutro
Questo paragrafo può essere omesso in una prima lettura di questo libro. Il livello della trattazione è più elevato rispetto a quello proprio di un corso elementare(2) . Descriveremo ora un sistema a due stati che fa parte del mondo delle particelle strane, un sistema per il quale la meccanica quantistica porta a una notevolissima predizione. Per una discussione completa sarebbe necessario che ci impegnassimo in un sacco di storie sulle particelle strane, e quindi, purtroppo, dovremo prendere qualche scorciatoia. Possiamo solo darvi un’idea schematica del modo con cui si è giunti a una certa scoperta, tanto per farvi capire il tipo di ragionamento necessario. La cosa comincia dalla scoperta di Gell-Mann e Nishijima del concetto di stranezza e della nuova legge della conservazione della stranezza. Fu quando Gell-Mann e Pais stavano studiando le conseguenze di questo nuovo concetto che essi s’imbatterono nella previsione dell’interessantissimo fenomeno che vogliamo ora descrivere. Prima, però, dobbiamo parlarvi un po’ della «stranezza». Dobbiamo cominciare con quelle che si chiamano le interazioni forti delle particelle nucleari. Queste ultime sono le interazioni responsabili delle intense forze nucleari, in contrapposizione, per esempio, alle interazioni elettromagnetiche, relativamente più deboli. Le interazioni sono «forti» nel senso che se due particelle si avvicinano l’una all’altra abbastanza da interagire, esse interagiscono violentemente e danno luogo molto facilmente ad altre particelle. Le particelle nucleari possiedono anche quelle che vengono dette «interazioni deboli» attraverso le quali si svolgono determinati fenomeni, quali il decadimento beta, ma sempre molto lentamente rispetto alla scala nucleare dei tempi; le interazioni deboli sono molti e molti ordini di grandezza più deboli delle interazioni forti, e anche molto più deboli di quelle elettromagnetiche. Nel corso dello studio delle interazioni forti mediante i grandi acceleratori, si constatò con sorpresa che certe cose che «sarebbero» dovute accadere, cioè che ci si aspettava accadessero, in realtà non avevano luogo. Per esempio, in alcune interazioni una particella di un dato tipo non veniva prodotta quando uno se lo aspettava. Gell-Mann e Nishijima notarono che molti di questi fatti singolari potevano essere spiegati immediatamente inventando una nuova legge di conservazione: la conservazione della stranezza. Essi proposero che un nuovo attributo dovesse essere associato a ciascuna particella, che essi chiamarono il suo numero quantico di «stranezza», e che in ogni interazione forte venisse conservata la «quantità di stranezza». Supponiamo, per esempio, che un mesone K negativo ad alta energia, diciamo con un’energia di molti GeV, si urti con un protone. Dall’interazione possono uscire molte altre particelle: mesoni ⇡, mesoni K, particelle lambda, particelle sigma, insomma qualsiasi mesone o barione tra quelli elencati nella tab. 2.2 del vol. 1. Si osserva, tuttavia, che solo determinate combinazioni di queste particelle si producono, mentre certe altre non compaiono mai. Alcune regole di conservazione erano allora già note. Prima di tutto, l’energia e l’impulso sono sempre conservati. L’energia (2) Ci sembra che il materiale di questo paragrafo sia più lungo e difficile di quanto sarebbe opportuno a questo punto della nostra esposizione. Vi suggeriamo di saltarlo e di continuare dal paragrafo 11.6. Se siete ambiziosi e ne avete il tempo potrete ritornarvi più tardi. Lo abbiamo lasciato qui perché è uno splendido esempio, preso dagli sviluppi recenti della fisica ad alta energia, di ciò che si può ottenere dalla nostra formulazione della meccanica quantistica dei sistemi a due stati.
163
164
Capitolo 11 • Ancora sui sistemi a due stati
© 978-8808-22107-0
e l’impulso totali alla fine di un dato evento devono essere uguali ai valori precedenti l’evento stesso. Poi, c’è la conservazione della carica elettrica che stabilisce che la carica totale delle particelle uscenti deve essere uguale alla carica totale portata dalle particelle di partenza. Nel nostro esempio della reazione tra un mesone K e un protone, viene effettivamente prodotto il seguente stato finale:
oppure
K + p ! p + K + ⇡+ + ⇡ + ⇡0
(11.38)
K +p!⌃ +⇡
+
Invece, non si ottiene mai
oppure
K + p ! p + K + ⇡+
(11.39)
K + p ! ⇤0 + ⇡ + per la conservazione della carica. Si sa anche che il numero dei barioni si conserva. Il numero dei barioni dopo è uguale al numero dei barioni prima. Per applicare questa legge, l’antiparticella di un barione va contata come meno un barione. Questo comporta che si possono osservare, e si osservano, i processi
oppure
K + p ! ⇤0 + ⇡0
(11.40)
K +p!p+K +p+p (in cui p è un antiprotone, che ha carica negativa). Ma non si vede mai
oppure
K + p ! K + ⇡+ + ⇡ 0
(11.41)
K +p!p+K +n (anche se c’è un’energia più che sufficiente), perché i barioni non sarebbero conservati. Queste leggi, tuttavia, non bastano a spiegare il fatto strano che le seguenti reazioni, che pure non sembrano immediatamente differire in modo speciale da alcune delle (11.38) o (11.40), non si osservano mai:
oppure oppure
K + p ! p + K + K0 K +p!p+⇡
(11.42)
K + p ! ⇤0 + K0 La spiegazione sta nella conservazione della stranezza. A ogni particella è associato un numero, la sua stranezza S, e vale la legge che in ogni interazione forte, la stranezza totale dopo deve essere uguale alla stranezza totale prima. Il protone e l’antiprotone (p, p), il neutrone e l’antineutrone (n, n) e i mesoni ⇡ (⇡+, ⇡0, ⇡ ) hanno tutti stranezza zero; i mesoni K+ e K0 hanno stranezza +1; il K e il K0 (3) (l’anti-K0 ), la ⇤0 e le particelle ⌃(+, 0, ) hanno stranezza 1. C’è anche una particella di stranezza 2, la particella ⌅ («csi» maiuscolo), e forse altre ancora sconosciute. Abbiamo elencato questi valori della stranezza nella TABELLA 11.4. Vediamo come funziona la conservazione della stranezza per alcune delle reazioni che abbiamo scritto. Se partiamo con un K e un protone, abbiamo una stranezza totale: 1 + 0 = 1. (3)
Si legge «K-zero-barra».
165
11.5 • Il mesone K neutro
© 978-8808-22107-0
La conservazione della stranezza impone che le stranezze dei prodotti dopo la reazione si sommino anch’esse a dare 1. Vedete che ciò è vero per le reazioni (11.38) e (11.40). Invece, per le reazioni (11.42), la stranezza al secondo membro è uguale a zero in ogni caso. Queste reazioni non conservano la stranezza e non avvengono. Perché? Nessuno lo sa. Nessuno sa più di quanto vi abbiamo detto sull’argomento. La natura funziona così. Consideriamo ora la seguente reazione: un ⇡ colpisce un protone. Si possono per esempio ottenere una particella ⇤0 più una particella K neutra, cioè, in tutto, due particelle neutre. Ma quali dei K neutri si ottiene? Poiché la particella ⇤ ha stranezza 1 e il ⇡ e il p+ hanno stranezza 0, e poiché si tratta di una reazione che ha luogo rapidamente, la stranezza non deve cambiare. La particella K deve avere stranezza +1, e quindi deve trattarsi del K0 . La reazione è ⇡ + p ! ⇤0 + K0 con S = 0 + 0 = 1 + 1 (conservata)
11.4 Valori delle stranezze delle particelle che interagiscono fortemente. TABELLA
S –2
Barioni
–1
0
Σ+
p
Ξ0
Λ0 Σ0
n
Ξ–
Σ–
Mesoni
n + n ! n + p + K0 + K+
1+1
oppure K + p ! n + K0
S = 1+0=0
π+
K+
K0
π0
K0
K–
π–
Nota: Il π– è l’antiparticella del π+ (o viceversa).
Se si fosse trattato del K0 invece che del K0 , la stranezza al secondo membro sarebbe stata 2, il che è vietato dalla natura, perché la stranezza al primo membro è zero. D’altra parte, un K0 può essere prodotto in altre reazioni, come
S =0+0=0+0
+1
1
Forse state pensando: «Queste sono tutti discorsi perché, come si fa a sapere se si tratta di K0 oppure di K0 ? Sono esattamente uguali. Sono l’una l’antiparticella dell’altra, e quindi hanno esattamente la stessa massa, e tutte e due hanno carica elettrica nulla. Come si fa a distinguerli?». Mediante le reazioni che essi producono. Per esempio, un K0 può interagire con la materia, per produrre una particella ⇤, nel modo seguente: K0 + p ! ⇤0 + ⇡ + mentre un K0 non può farlo. Non c’è nessun modo di far produrre a K0 una particella ⇤ quando interagisce con la materia comune (protoni e neutroni)(4) . Quindi K0 e K0 si distinguono sperimentalmente guardando quale dei due dà luogo o meno alla produzione di ⇤. Una delle previsioni della teoria della stranezza è quindi che, se in un esperimento con pioni di alta energia viene prodotta una particella ⇤ insieme a un mesone K neutro, allora questo mesone K neutro, finendo contro altri pezzi di materia, non produrrà mai una ⇤. L’esperienza può essere condotta press’a poco così. S’invia un fascio di mesoni ⇡ dentro una grossa camera a bolle di idrogeno. Una traiettoria di ⇡ sparisce, ma da qualche altra parte appare una coppia di traiettorie (un protone e un ⇡ ) indicando che la particella ⇤ si è disintegrata (5) (FIGURA 11.5). Si sa allora che c’è da qualche parte un K0 che non si può vedere. Si può, però, ricostruire dov’è, usando la conservazione dell’impulso e dell’energia. (Potrebbe rivelarsi da sé un po’ più tardi disintegrandosi in due particelle cariche, come si vede in FIGU0 RA 11.5a.) Mentre il K procede in volo, può interagire con uno dei nuclei di idrogeno (protoni), (4) A meno che, naturalmente, non produca anche due K+ o altre particelle con stranezza totale +2. Ci riferiamo qui a reazioni in cui l’energia non sia sufficiente a produrre queste particelle strane. (5) La particella ⇤ libera decade lentamente mediante le interazioni deboli (di modo che la stranezza non deve essere necessariamente conservata). I prodotti di decadimento sono o un p e un ⇡ , oppure un n e un ⇡0 . La vita media è uguale a 2,2 · 10 10 s.
166
Capitolo 11 • Ancora sui sistemi a due stati
© 978-8808-22107-0
p Interazione nucleare Decadimento di
p
K0
Interazione nucleare
Decadimento di K0 Idrogeno liquido
Idrogeno liquido
11.5 Processi ad alta energia visti in una camera a bolle di idrogeno. (a) Un mesone π– interagisce con un nucleo di idrogeno (protone) producendo una particella Λ0 e un mesone K0 . Entrambe queste particelle decadono nella camera stessa. (b) Un mesone K0 interagisce con un protone producendo un mesone π+ e una particella Λ0 che poi decade. (Le particelle neutre non lasciano traccia. La ricostruzione delle loro traiettorie viene qui indicata con linee tratteggiate.) FIGURA
producendo forse qualche altra particella. La previsione della teoria della stranezza è che non produrrà mai una particella in una semplice reazione come, per esempio, K0 + p ! ⇤0 + ⇡+ sebbene un K0 possa farlo. Cioè, in una camera a bolle, un K0 può produrre l’evento schematizzato in FIGURA 11.5b, in cui la ⇤0 è osservata perché decade, mentre un K0 non può. Questa è la prima parte della storia. Cioè, la conservazione della stranezza. Ma la conservazione della stranezza non è perfetta. Si hanno delle disintegrazioni lentissime delle particelle strane, decadimenti che impiegano un tempo lungo(6) come 10 10 s, in cui la stranezza non è conservata. Questi vengono detti decadimenti «deboli». Per esempio, il K0 si disintegra in una coppia di mesoni ⇡ (+ e ) con una vita media di 10 10 s. Questo fu, infatti, il modo con cui le particelle K furono originariamente scoperte. Si noti che il decadimento K0 ! ⇡+ + ⇡ non conserva la stranezza, e quindi non può procedere «velocemente» tramite le interazioni forti; e può solo aver luogo attraverso un processo di decadimento debole. Ma anche il K0 si disintegra allo stesso modo in un ⇡+ e un ⇡ , e con la stessa vita media K0 ! ⇡ + ⇡+ Ancora una volta si tratta di un decadimento debole perché non conserva la stranezza. Vale il principio che per ogni reazione esiste la reazione corrispondente nella quale la «materia» viene sostituita dall’«antimateria» e viceversa. Poiché K0 è l’antiparticella di K0 , esso decadrà nelle antiparticelle ⇡+ e ⇡ ; ma l’antiparticella di ⇡+ è ⇡ . (Oppure, se preferite, è il contrario. Si trova che per i mesoni non conta quale si chiami «materia».) Quindi, in conseguenza ai decadimenti deboli, K0 e K0 possono dar luogo agli stessi prodotti finali. Quando vengono «visti» grazie ai loro decadimenti, come nella camera a bolle, essi appaiono come la stessa particella. Solo le loro interazioni forti sono differenti. Finalmente, siamo in grado di raccontare il lavoro di Gell-Mann e Pais. Essi notarono per primi che, poiché K0 e K0 possono tutt’e due finire in stati di due mesoni ⇡, si deve avere una certa ampiezza che un K0 possa divenire un K0 , e anche che un K0 possa divenire un K0 . Scrivendo le reazioni come si fa in chimica, si otterrebbe K0 ⌦ ⇡ + ⇡+ ⌦ K0
(11.43)
Queste reazioni implicano che c’è una certa ampiezza per unità di tempo, diciamo i/~ per hK0 | W | K0 i, che un K0 si trasformi in K0 , attraverso le interazioni deboli responsabili del (6)
Un tempo caratteristico delle interazioni forti è 10
23
s.
11.5 • Il mesone K neutro
© 978-8808-22107-0
decadimento in due mesoni ⇡. E c’è l’ampiezza corrispondente hK0 | W | K0 i relativa al processo inverso. Poiché la materia e l’antimateria si comportano esattamente allo stesso modo, queste due ampiezze sono numericamente uguali; le indicheremo entrambe con A: hK0 | W | K0 i = hK0 | W | K0 i = A
(11.44)
Qui, notarono Gell-Mann e Pais, si ha una situazione interessante. Quelli che generalmente venivano considerati come due stati distinti in natura, il K0 e il K0 , in realtà andavano considerati come un sistema a due stati, poiché c’è un’ampiezza di transizione da uno stato all’altro. Per una trattazione completa bisognerebbe, chiaramente, considerare più di due stati, perché ci sono anche gli stati di due ⇡, e così via; ma, poiché essi si interessavano principalmente alle relazioni tra il K0 e il K0 , non avevano la necessità di complicare le cose e potevano mettersi nell’approssimazione di un sistema a due stati. Gli altri stati venivano presi in considerazione per quel tanto che i loro effetti erano impliciti nelle ampiezze dell’equazione (11.44). Secondo quanto detto, Gell-Mann e Pais analizzarono la particella neutra come un sistema a due stati. Cominciarono con lo scegliere come loro stati di base gli stati | K0 i e | K0 i. (Da ora in poi, la trattazione procede molto similmente a quella per la molecola di ammoniaca.) Ogni stato | i della particella K neutra può essere caratterizzato mediante le ampiezze di probabilità di trovarsi in ciascuno dei due stati di base. Indicheremo queste ampiezze con C+ = hK0 | i C = hK0 | i
(11.45)
Il successivo passo consiste nello scrivere le equazioni hamiltoniane per questo sistema a due stati. In assenza di accoppiamento tra il K0 e il K0 , le equazioni sarebbero state semplicemente i~
dC+ = E0 C+ dt
dC i~ = E0 C dt
(11.46)
Ma, poiché c’è un’ampiezza hK0 | W | K0 i per la transizione da un K0 a un K0 , ci deve essere un termine addizionale hK0 | W | K0 i C = AC aggiunto al secondo membro della prima equazione. E, analogamente, il termine AC+ va inserito nell’equazione che dà la variazione di C . Ma non è tutto. Quando si tiene conto dell’effetto dei due pioni, c’è un’ampiezza addizionale che il K0 vada in se stesso tramite il processo K0 ! ⇡ + ⇡+ ! K0
Questa nuova ampiezza, che indicheremo come hK0 | W | K0 i, è proprio uguale all’ampiezza hK0 | W | K0 i, perché le ampiezze da e verso una coppia di mesoni ⇡ sono uguali per il K0 e il K0 . Se volete, il ragionamento può essere così esposto in dettaglio. Anzitutto si scrive(7) hK0 | W | K0 i = hK0 | W | 2⇡i h2⇡ | W | K0 i e hK0 | W | K0 i = hK0 | W | 2⇡i h2⇡ | W | K0 i Per la simmetria tra materia e antimateria h2⇡ | W | K0 i = h2⇡ | W | K0 i e anche (7)
Stiamo facendo una semplificazione in questo caso. Il sistema di 2⇡ può esistere in molti stati corrispondenti a vari impulsi dei mesoni ⇡ e dovremmo quindi scrivere il secondo membro di questa equazione come una somma sui vari stati di base dei ⇡. La trattazione completa conduce ancora agli stessi risultati.
167
168
Capitolo 11 • Ancora sui sistemi a due stati
© 978-8808-22107-0
hK0 | W | 2⇡i = hK0 | W | 2⇡i Ne consegue quindi che e anche che
hK0 | W | K0 i = hK0 | W | K0 i hK0 | W | K0 i = hK0 | W | K0 i
come si è detto prima. Inoltre, ci sono anche le due ampiezze ulteriori hK0 | W | K0 i e hK0 | W | K0 i, entrambe uguali ad A, che devono essere incluse nelle equazioni hamiltoniane. La prima dà un termine AC+ al secondo membro dell’equazione per dC+ /dt, mentre la seconda dà un nuovo termine AC nell’equazione relativa a dC /dt. Ragionando cosi Gell-Mann e Pais conclusero che le equazioni hamiltoniane per il sistema K0 K0 dovevano essere i~
dC+ = E0 C+ + AC + AC+ dt
dC i~ = E0 C + AC+ + AC dt
(11.47)
Dobbiamo ora portare una correzione a qualche cosa che abbiamo detto nei capitoli precedenti: due ampiezze come hK0 | W | K0 i e hK0 | W | K0 i, che si riferiscono a transizioni inverse, sono sempre complesse coniugate. Questo era vero quando si parlava di particelle che non decadevano. Ma se le particelle possono decadere, e quindi possono essere «perdute», le due ampiezze non sono necessariamente complesse coniugate. Quindi, l’uguaglianza (11.44) non comporta che le ampiezze siano numeri reali; esse sono infatti numeri complessi. Il coefficiente A è perciò complesso, e lo possiamo incorporare semplicemente nell’energia E0 . I nostri eroi, avendo spesso trafficato con spin di elettroni e cose del genere, sapevano che le equazioni hamiltoniane (11.47) comportano l’esistenza di un’altra coppia di stati di base, i quali pure possono essere usati per rappresentare il sistema della particella K e che hanno proprietà particolarmente semplici. Essi dissero: «Prendiamo la somma e la differenza di queste due equazioni. Inoltre, misuriamo tutte le nostre energie a partire da E0 , e usiamo unità di energia e di tempo tali da rendere ~ = 1». (I fisici teorici di oggi lo fanno sempre. È una posizione che non cambia la fisica ma fa sì che le equazioni acquistino una forma semplice.) Il risultato da loro ottenuto è d i (C+ + C ) = 2A(C+ + C ) dt (11.48) d i (C+ C ) = 0 dt È chiaro che le combinazioni di ampiezze C+ + C e C+ C evolvono indipendentemente l’una dall’altra (e corrispondono, naturalmente, ai due stati stazionari che abbiamo studiato in precedenza). Quindi conclusero che sarebbe stato più conveniente usare una differente rappresentazione per la particella K. Essi introdussero i due stati ⌘ 1 ⇣ | K1 i = p | K0 i + | K0 i 2 1 ⇣ | K2 i = p | K0 i 2
0
|K i
⌘
(11.49)
e affermarono che invece di ragionare riferendosi agli stati dei mesoni K0 e K0 , si poteva altrettanto bene riferirsi alle «particelle» (cioè, agli «stati») K1 e K2 . (Com’è chiaro, questi corrispondono agli stati che generalmente abbiamo indicato con | Ii e | IIi. Non seguiamo la nostra vecchia notazione perché vogliamo ora essere fedeli alla notazione originale degli autori, che poi è quella che vedrete usata ai seminari di fisica). Ma Gell-Mann e Pais non hanno fatto tutto questo solo per chiamare in modo diverso le particelle; in tutto ciò, c’è anche un nuovo fatto fisico piuttosto strano. Supponiamo che C1 e C2
11.5 • Il mesone K neutro
© 978-8808-22107-0
siano le ampiezze che un certo stato | i ha con un mesone K1 e K2 : C1 = hK1 | i C2 = hK2 | i Dalle equazioni (11.49) si ha: 1 C1 = p (C+ + C ) 2 1 C2 = p (C+ 2
(11.50)
C )
Allora le equazioni (11.48) diventano i
dC1 = 2AC1 dt
dC2 i =0 dt
(11.51)
Le soluzioni sono C1 (t) = C1 (0) e
i2At
C2 (t) = C2 (0)
(11.52)
dove, com’è ovvio, C1 (0) e C2 (0) sono le ampiezze a t = 0. Queste equazioni implicano che se si parte con un mesone K neutro nello stato | K1 i a t = 0 (quindi, C1 (0) = 1 e C2 (0) = 0), le ampiezze al tempo t sono C1 (t) = e
i2At
C2 (t) = 0 Ricordando che A è un numero complesso, è conveniente porre A = ↵ i . (Poiché si trova che la parte immaginaria di 2A è negativa, la scriviamo come meno i .) Con questa sostituzione, C1 (t) diventa C1 (t) = C1 (0) e t e i↵t (11.53) La probabilità di trovare al tempo t una particella K1 è il modulo quadrato di questa ampiezza, che è e 2 t . Dalle equazioni (11.52), si ha inoltre che la probabilità a un tempo qualunque di trovare lo stato K2 è zero. Ciò significa che se producete una particella K nello stato | K1 i, la probabilità di trovarla nello stesso stato decresce esponenzialmente nel tempo, ma non la troverete mai nello stato | K2 i. Dove va a finire? Si disintegra in due mesoni ⇡ con vita media ⌧ = 1/2 , che è sperimentalmente uguale a 10 10 s. Ci eravamo preparati a questo quando abbiamo detto che A era complesso. D’altra parte, l’equazione (11.52) dice che se produciamo una particella K completamente nello stato K2 , rimarrà in questa situazione per sempre. Ebbene, questo non è del tutto vero in realtà. Si osserva sperimentalmente che essa decade in tre mesoni ⇡, ma tale decadimento è 600 volte più lento di quello in due pioni che abbiamo discusso prima. Quindi, ci sono degli altri piccoli termini che abbiamo lasciato fuori nella nostra approssimazione. Ma finché consideriamo solo il decadimento in due mesoni ⇡, il K2 rimane tale «per sempre». Concludiamo la storia di Gell-Mann e Pais. Essi proseguirono considerando cosa succede quando una particella K è prodotta insieme a una particella ⇤0 o in un’interazione forte. Poiché deve avere una stranezza uguale a +1, deve essere prodotta nello stato K0 . Quindi a t = 0, non è né un K1 né un K2 , ma una miscela. Le condizioni iniziali sono C+ (0) = 1 C (0) = 0
169
170
Capitolo 11 • Ancora sui sistemi a due stati
© 978-8808-22107-0
Ma ciò significa, per l’equazione (11.50), che 1 C1 (0) = p 2 1 C2 (0) = p 2 e, dalle equazioni (11.52) e (11.53), che 1 C1 (t) = p e 2
t
e
i↵t
(11.54)
1 C2 (t) = p 2
Ricordate ora che sia K0 sia K0 sono ciascuno una combinazione lineare di K1 e K2 . Nelle equazioni (11.54), le ampiezze sono state scelte in modo che a t = 0, le parti di K0 si eliminano l’un l’altra per interferenza, lasciando un puro stato di K0 . Ma lo stato | K1 i varia con il tempo e lo stato | K2 i non varia. A un tempo successivo a t = 0, l’interferenza tra C1 e C2 darà un’ampiezza finita sia per K0 sia per K0 . Che significa tutto ciò? Ritorniamo indietro e consideriamo l’esperienza schematizzata in 0 0 FIGURA 11.5. Un mesone ⇡ ha prodotto una particella ⇤ e un mesone K che va strombazzando attraverso l’idrogeno della camera. Mentre si muove, c’è una piccola probabilità costante che urti un nucleo di idrogeno. Al principio, pensavamo che la conservazione della stranezza avrebbe impedito alla particella K di produrre una ⇤0 in un’interazione come questa. Vediamo ora che questo non è giusto. Infatti, benché la nostra particella K sia in partenza un K0 , il quale non può produrre una ⇤0 , tuttavia esso non rimane tale. Dopo un certo tempo, esiste una certa ampiezza finita che sia passato allo stato K0 . Ci aspettiamo perciò qualche volta di vedere una ⇤0 prodotta lungo la traiettoria della particella K. La probabilità di questo evento è determinata dall’ampiezza C , che (usando l’equazione (11.50) al contrario) possiamo correlare a C1 e C2 . La relazione è 1 C = p (C1 2
C2 ) =
1⇣ e 2
t
e
i↵t
1
⌘
(11.55)
Mentre la nostra particella K cammina, la probabilità che essa «si comporti come» un K0 è uguale a |C | 2 , che vale ⌘ 1⇣ |C | 2 = 1 + e 2 t 2e t cos ↵t (11.56) 4 Un risultato complicato e strano! Questa è dunque la notevole previsione di Gell-Mann e Pais: quando viene prodotto un K0 , la probabilità che esso si trasformi in un K0 , cosa che si manifesta con la capacità di produrre una ⇤0 , varia con il tempo secondo l’equazione (11.56). Questa predizione è stata ottenuta usando solo la pura logica e i principi fondamentali della meccanica quantistica, senza nessuna conoscenza dei meccanismi interni della particella K. Poiché nessuno sa niente di questi meccanismi interni, Gell-Mann e Pais non poterono procedere oltre. Non furono in grado di fornire nessun valore teorico per ↵ e e nessuno è riuscito a farlo fino a oggi. Poterono solo dare un valore di ottenuto dalla velocità di decadimento in due ⇡ (2 = 1010 s 1 ), osservata sperimentalmente, ma non furono in grado di dire niente su ↵. Abbiamo riportato in un grafico la funzione dell’equazione (11.56) per due valori di ↵ in FIGURA 11.6. Potete constatare che la forma dipende moltissimo dal rapporto tra ↵ e . Non c’è nessuna probabilità per K0 all’inizio; poi cresce. Se ↵ è grande, la probabilità avrà delle forti oscillazioni. Se ↵ è piccolo, ci saranno poche o nessuna oscillazione e la probabilità si limiterà a crescere con continuità fino a 1/4. Nel caso tipico, la particella K si muoverà con una velocità costante vicina a quella della luce. Le curve in FIGURA 11.6 rappresentano quindi anche la probabilità lungo la traiettoria di osservare un K0 , con distanze caratteristiche di alcuni centimetri. Voi capite perché questa previsione è
171
11.6 • Generalizzazione ai sistemi a N stati
© 978-8808-22107-0
(a)
(b)
1,00
0,75
0,75
0,50
0,50
0,25
0,25
0
0 0
FIGURA
0,5
11.6
1
1,5
2,0
0
2
4
La funzione dell’equazione (11.56): (a) per α = 4πβ, (b) per α = πβ (con 2β = 1010 s–1 ).
così particolarmente singolare. Voi producete una particella e questa, invece di disintegrarsi semplicemente, fa qualche cos’altro. Qualche volta si disintegra e qualche altra volta si tramuta in una diversa specie di particella. La probabilità tipica di dare luogo a un effetto, varia in modo strano mentre la particella procede. Non c’è nessun altro fenomeno simile in natura. E questa previsione interessantissima è stata fatta usando solamente dei ragionamenti basati sull’interferenza delle ampiezze. Se c’è una situazione in cui si ha la possibilità di sottoporre a controllo sperimentale i principi basilari della meccanica quantistica nel modo più pulito (funziona o no il principio di sovrapposizione per le ampiezze?), non può che essere questa. Per quanto questo effetto sia ormai stato predetto da alcuni anni, non c’è ancora alcuna determinazione sperimentale veramente chiara. Si ha qualche risultato che indica che ↵ è compreso tra 2 e 4 . Questo è tutto quanto si sa dell’esperienza. Sarebbe molto bello poter controllare esattamente l’andamento della curva per vedere se il principio di sovrapposizione funziona ancora nel mondo così misterioso delle particelle strane, per le quali non si conoscono le cause dei decadimenti, e le ragioni dell’esistenza della stranezza. L’analisi che abbiamo appena descritto è molto caratteristica della maniera con cui la meccanica quantistica viene impiegata al giorno d’oggi nella ricerca volta alla comprensione delle particelle strane. Tutte le complicate teorie che vi può capitare di sentire in giro non sono niente di più di quest’abracadabra elementare che si basa sul principio di sovrapposizione o altri principi di meccanica quantistica dello stesso livello. Alcuni affermano di avere fatto delle teorie con le quali è possibile calcolare i e gli ↵, o almeno ↵ una volta noto , ma queste teorie sono del tutto inutili. Per esempio la teoria che permette di calcolare ↵ da , ci dice che il valore di ↵ dovrebbe essere infinito. Il sistema di equazioni, da cui questa gente parte, contiene inizialmente i due mesoni ⇡ e ripassa in seguito dai due ⇡ al K0 , e così via. Alla fine dei calcoli, si ottiene effettivamente una coppia di equazioni come quelle che abbiamo qui; ma poiché c’è un numero infinito di stati di due ⇡, al variare del loro impulso, dall’integrazione su tutte queste possibilità, si ottiene un valore infinito per ↵. Ma in natura, ↵ non è infinito. Perciò le teorie dinamiche sono sbagliate. È veramente notevole il fatto che gli unici fenomeni che possono essere spiegati nel mondo delle particelle strane sono quelli che derivano dai principi della meccanica quantistica al livello al quale ora li state imparando.
11.6
Generalizzazione ai sistemi a N stati
Abbiamo finito di parlare di tutti i sistemi a due stati di cui volevamo occuparci. Nei capitoli seguenti passeremo a studiare sistemi con un numero maggiore di stati. L’estensione ai sistemi a
6
8
172
Capitolo 11 • Ancora sui sistemi a due stati
© 978-8808-22107-0
N stati dei concetti che abbiamo sviluppato nel caso di due stati è del tutto elementare. Si procede nel modo seguente. Se un sistema ha N stati distinti, possiamo rappresentare un qualsiasi stato | (t)i come una combinazione lineare di un insieme qualsiasi di stati di base | ii, dove i = 1, 2, 3, . . . , N; X | (t)i = | ii Ci (t) (11.57) tutti gli i
I coefficienti Ci (t) sono le ampiezze hi | (t)i. Il comportamento nel tempo delle ampiezze Ci è governato dalle equazioni dCi (t) X i~ = Hi j C j (11.58) dt j
dove la matrice dell’energia Hi j descrive le circostanze fisiche del problema. Essa ha la stessa struttura che nel caso di due stati. Solo che ora sia i che j corrono su tutti gli N stati di base, e la matrice dell’energia Hi j , o, se preferite l’hamiltoniana, è una matrice N per N costituita da N 2 numeri. Come prima, Hi⇤j = H ji , finché le particelle si conservano, e gli elementi diagonali Hii sono numeri reali. Abbiamo trovato una soluzione generale per le C di un sistema a due stati quando la matrice dell’energia è costante (cioè, non dipende da t). È ancora facile risolvere le equazioni (11.58) per un sistema a N stati quando H non dipende dal tempo. Di nuovo, si comincia con il cercare una possibile soluzione in cui le ampiezze hanno tutte la stessa dipendenza dal tempo. Proviamo con Ci = ai e
(i/~)Et
(11.59)
Sostituendo queste espressioni per le Ci nella (11.58), le derivate dCi (t)/dt diventano semplicemente uguali a ( i/~)ECi . Cancellando il fattore esponenziale comune da tutti i termini, si ottiene X Eai = Hi j a j (11.60) j
Questo è un sistema di N equazioni algebriche nelle N incognite a1, a2, . . . , a N , ed esiste una soluzione solo se siete fortunati, cioè solo se il determinante dei coefficienti di tutte le a è zero. Ma non è necessario essere così sofisticati; potete cominciare a risolvere le equazioni nel modo che vi pare, e troverete che possono essere risolte solo per alcuni valori di E. (Ricordate che E è il solo parametro variabile che avete nelle equazioni). Se volete procedere formalmente, però, potete scrivere l’equazione (11.60) nella forma X Hi j (11.61) ij E aj = 0 j
Poi potete usare la regola, se la conoscete, che queste equazioni hanno soluzioni solo in corrispondenza a quei valori di E per i quali Det Hi j
ij E
=0
(11.62)
Ciascun termine del determinante è proprio uguale a Hi j , tranne il fatto che E va sottratto da ogni elemento diagonale. Quindi, la (11.62) significa che H E *. 11 . H21 Det .. .. H31 , ...
H12 H22 E H32 ...
H13 H23 H33 E ...
... + . . .// // = 0 . . .// . . .-
(11.63)
Questo, naturalmente, non è altro che un modo particolare di scrivere un’equazione algebrica per E che è la somma di un mucchio di prodotti di tutti i termini presi in un certo modo. Questi prodotti conterranno tutte le potenze da E fino a E N .
11.6 • Generalizzazione ai sistemi a N stati
© 978-8808-22107-0
Abbiamo quindi un polinomio di ordine N uguagliato a zero, e ci sono, in generale, N radici. (Dobbiamo, però, ricordare che alcune di esse possono essere radici multiple, corrispondenti a due o più radici uguali.) Indichiamo le N radici con EI, EII, EIII, . . . , En, . . . , EN
(11.64)
(Useremo il simbolo n per indicare l’n-esimo numero romano di modo che n prenda i valori I, II, . . . , N.) Può essere che alcune di queste energie siano uguali, per esempio, EII = EIII , ma preferiamo sempre indicarle con nomi differenti. Le equazioni (11.60), oppure (11.61), hanno una soluzione per ogni valore di E. Se mettete nella (11.60) una qualsiasi delle E, diciamo En , e risolvete nelle ai , ottenete un insieme di valori che corrisponde all’energia En . Indicheremo questo insieme con ai (n). Ponendo questi ai (n) nell’equazione (11.59), si ottengono le ampiezze Ci (n) tra gli stati a energia definita e gli stati di base | ii. Indicando con | ni il vettore di stato dello stato di energia definita a t = 0, possiamo scrivere Ci (n) = hi | nie
(i/~)En t
con hi | ni = ai (n) Lo stato completo a energia definita |
(11.65)
può quindi essere scritto come X | n (t)i = | ii ai (n) e (i/~)En t n (t)i
i
ovvero
|
n (t)i
= | ni e
(i/~)En t
(11.66)
I vettori di stato | ni descrivono la configurazione degli stati di energia definita, ma senza il fattore che contiene la dipendenza dal tempo. Essi sono dunque vettori costanti che, se si vuole, possono essere usati come nuovi vettori di base. Ciascuno degli stati | ni ha la proprietà, come si può mostrare facilmente, che, operando su di ˆ si ottiene semplicemente En per lo stesso stato: loro con l’operatore hamiltoniano H, Hˆ | ni = En | ni
(11.67)
ˆ Come Quindi, En è un numero che rappresenta una caratteristica dell’operatore hamiltoniano H. abbiamo visto, un’hamiltoniana, in generale, possiederà diverse energie caratteristiche. Nel mondo dei matematici queste sarebbero indicate come «i valori caratteristici» della matrice Hi j . I fisici ˆ (Il corrispondente in inglese è «eigenvalues», che deriva li indicano come gli «autovalori» di H. ˆ dalla parola tedesca «eigen» che sta per «caratteristico» o «proprio».) A ogni autovalore di H, ovvero, in altri termini, a ogni energia, è associato uno stato a energia definita, che abbiamo ˆ Ciascun chiamato «stato stazionario». I fisici chiamano di solito gli stati | ni «gli autostati di H». autostato corrisponde a un autovalore particolare En . In generale, gli stati | ni, che sono in tutto N, possono anche essere usati come stati di base. Perché ciò sia possibile occorre che siano tutti tra loro ortogonali, cioè che, per ciascuna coppia di assi, per esempio | ni e | mi, si abbia hn | mi = 0
(11.68)
Questo sarà vero automaticamente se tutte le energie sono differenti. Inoltre, possiamo moltiplicare tutte le ai (n) per un opportuno fattore, in modo che tutti gli stati risultino normalizzati, con il che s’intende che hn | ni = 1 (11.69) per tutti gli n. Quando accidentalmente succede che l’equazione (11.63) ha due (o più) radici corrispondenti alla stessa energia, si ha qualche complicazione di poco conto. Anzitutto ci sono ancora due
173
174
Capitolo 11 • Ancora sui sistemi a due stati
© 978-8808-22107-0
insiemi diversi di ai che corrispondono alle due energie uguali, ma gli stati da essi definiti possono benissimo non essere ortogonali. Supponiamo di compiere la normale trafila e di arrivare a due stati stazionari di uguale energia; li indicheremo con | µi e | i. In tal caso, essi non saranno più necessariamente ortogonali, e, se si è sfortunati, accadrà che hµ | i , 0 Tuttavia è sempre vero che si possono confezionare due nuovi stati, che indicheremo con | µ0i e | 0i, che, oltre ad avere la stessa energia, sono anche ortogonali, cosicché hµ0 |
0
i=0
(11.70)
Si ottiene questo costruendo | µ0i e | 0i come un’opportuna combinazione lineare di | µi e | i con i coefficienti scelti in modo che valga l’equazione (11.70). È sempre conveniente farlo. Ammetteremo quindi, in generale, che questo sia stato fatto, in modo che potremo sempre supporre che i nostri stati a energia definita | ni siano ortogonali. Per divertimento, vogliamo dimostrare che quando due stati stazionari hanno diverse energie, essi sono veramente ortogonali. Per lo stato | ni di energia En , si ha che Hˆ | ni = En | ni
(11.71)
Questa equazione tra operatori comporta in effetti una corrispondente equazione tra numeri. Ricostituendo le parti mancanti, essa è equivalente a X hi | Hˆ | ji h j | ni = En hi | ni (11.72) j
Se si prende la complessa coniugata di questa equazione, si ottiene X hi | Hˆ | ji⇤ h j | ni⇤ = En⇤ hi | ni⇤
(11.73)
j
Si ricordi ora che la complessa coniugata di un’ampiezza è l’ampiezza rovesciata, di modo che la (11.73) può essere riscritta come X hn | ji h j | Hˆ | ii = En⇤ hn | ii (11.74) j
Poiché questa relazione vale per ogni i, la sua «forma abbreviata» è hn | Hˆ = En⇤ hn |
(11.75)
che viene detta l’aggiunta dell’equazione (11.71). Si può mostrare facilmente che En è un numero reale. Moltiplichiamo l’equazione (11.71) per hn | in modo da ottenere hn | Hˆ | ni = En (11.76) poiché hn | ni = 1. Moltiplichiamo poi l’equazione (11.75) a sinistra per | ni; si ha hn | Hˆ | ni = En⇤
(11.77)
Paragonando la (11.76) con la (11.77), risulta chiaro che En = En⇤
(11.78)
il che significa che En è reale. Possiamo cancellare l’asterisco su En nell’ equazione (11.75). Finalmente siamo pronti per dimostrare che stati di differente energia sono ortogonali. Siano | ni e | mi due qualsiasi stati di base a energia definita. Usando l’equazione (11.75) per lo stato m, e moltiplicandola per | ni, si ottiene che hm | Hˆ | ni = Em hm | ni
11.6 • Generalizzazione ai sistemi a N stati
© 978-8808-22107-0
Mentre, se moltiplichiamo la (11.71) per hm |, si ha hm | Hˆ | ni = En hm | ni Poiché i primi membri di queste due equazioni sono uguali, lo sono anche i secondi membri: Em hm | ni = En hm | ni
(11.79)
Se Em = En questa equazione non ci dice niente. Ma se le energie dei due stati | mi e | ni sono differenti (Em , En ), l’equazione (11.79) ci dice che hm | ni deve essere zero, come volevamo dimostrare. I due stati sono necessariamente ortogonali quando En e Em sono numericamente diversi.
175
12
La struttura iperfine dell’idrogeno
12.1
Stati di base per un sistema di due particelle a spin un mezzo
In questo capitolo affrontiamo il problema della «struttura iperfine» dell’idrogeno, perché esso costituisce un esempio fisicamente interessante di quanto siamo già in grado di fare con la meccanica quantistica. Si tratta di un esempio con più di due stati, e costituisce un’illustrazione dell’applicazione dei metodi della meccanica quantistica a problemi un po’ più complicati. È sufficientemente più complicato che chi sa come trattarlo è poi in grado di ottenere immediatamente la generalizzazione a qualsiasi altro problema. Come sapete, l’atomo di idrogeno è costituito da un elettrone che se ne sta nelle vicinanze di un protone, dove può esistere in uno qualsiasi di tanti stati discreti d’energia, in ciascuno dei quali la configurazione di moto dell’elettrone è differente. Il primo stato eccitato, per esempio, si trova a 3/4 di rydberg, cioè circa 10 eV, sopra lo stato fondamentale. Ma anche il cosiddetto stato fondamentale dell’idrogeno non è in realtà un singolo stato a energia definita e ciò a causa degli spin dell’elettrone e del protone. Questi spin sono responsabili della «struttura iperfine» nei livelli di energia, che risolve tutti i livelli energetici in diversi livelli di energia quasi uguale. L’elettrone può avere lo spin sia «su» sia «giù», e così pure il protone. Si hanno, quindi, quattro stati possibili di spin per ogni condizione dinamica dell’atomo. Pertanto, quando si parla di «stato fondamentale», si intendono in realtà i «quattro stati fondamentali», e non solamente lo stato più basso di tutti. I quattro stati di spin non hanno esattamente la stessa energia; ci sono delle leggere deviazioni dalle energie che si prevedono, facendo astrazione dallo spin. Queste deviazioni sono, tuttavia, molto ma molto minori dei 10 eV circa che separano lo stato fondamentale da quello successivo. Come conseguenza, ciascuno stato dinamico ha il suo livello suddiviso in un insieme di livelli energetici molto vicini, e questa appunto è la cosiddetta struttura iperfine. In questo capitolo vogliamo calcolare le differenze di energia tra questi quattro stati di spin. La struttura iperfine è dovuta all’interazione dei momenti magnetici dell’elettrone e del protone, che produce un’energia magnetica leggermente diversa per i vari stati di spin. Queste differenze d’energia sono solo un diecimilionesimo circa di elettronvolt, cioè veramente molto piccole rispetto a 10 eV! È proprio perché c’è questo grosso salto che possiamo considerare lo stato fondamentale dell’atomo di idrogeno come un sistema «a quattro stati», senza doverci preoccupare dell’esistenza di tantissimi altri stati a energie più alte. Ci limitiamo qui a studiare la struttura iperfine dello stato fondamentale dell’atomo di idrogeno. Per quello che vogliamo fare, non ci interessano i particolari sulle posizioni dell’elettrone e del protone, in quanto, per così dire, a questo ha già provveduto l’atomo – vi ha provveduto portandosi nello stato fondamentale. Ci basta semplicemente sapere che abbiamo un elettrone e un protone, uno vicino all’altro, con una certa definita relazione spaziale. In più, essi possono avere differenti orientazioni relative dei loro spin. Ci vogliamo appunto interessare solamente degli effetti dovuti agli spin. Il primo problema che dobbiamo affrontare è quello di trovare gli stati di base del sistema. Veramente, in questa forma, il problema non è enunciato correttamente. Infatti non ha senso parlare «degli» stati di base, perché, naturalmente, l’insieme degli stati di base che si può scegliere non
177
12.1 • Stati di base per un sistema di due particelle a spin un mezzo
© 978-8808-22107-0
è univocamente determinato. Nuovi insiemi possono sempre essere costruiti come combinazioni lineari dei vecchi. Gli stati di base possono sempre essere scelti in tanti modi, e ognuna di queste scelte è ugualmente legittima. Quindi, il problema non è quello di quali siano gli stati di base, ma di quali potrebbero essere. Possiamo scegliere quello che più ci fa comodo. In genere, conviene sempre partire dal sistema di base che ha il significato fisico più evidente. Quest’ultimo può non essere la soluzione di un dato problema, può non essere quello più direttamente importante, ma, in genere, rende più facilmente comprensibile il procedimento. Scegliamo questi quattro stati di base:
Protone Elettrone
Stato 1: l’elettrone e il protone hanno ambedue lo spin «su».
�+ +�, �1�
Stato 2: l’elettrone è «su» e il protone è «giù». Stato 3: l’elettrone è «giù» e il protone è «su». Stato 4: l’elettrone e il protone sono tutti e due «giù». Ci serve una notazione maneggevole per questi quattro stati e li rappresenteremo allora nel modo seguente: Stato 1: | + +i; elettrone su, protone su. Stato 2: | + i; elettrone su, protone giù. Stato 3: | +i; elettrone giù, protone su. Stato 4: |
�+ –�, �2�
(12.1)
i; elettrone giù, protone giù.
Vi dovete ricordare che il primo più o meno si riferisce all’elettrone, e il secondo al protone. Per permettere una rapida consultazione, abbiamo riassunto la notazione nella FIGURA 12.1. In qualche caso, ci farà comodo indicare questi stati con | 1i, | 2i, | 3i e | 4i. Voi potreste dire: «Ma le particelle interagiscono, e potrebbe accadere che questi non siano gli stati di base giusti. Sembrerebbe che si stiano considerando le due particelle come indipendenti». Proprio così! L’interazione fa sorgere il problema di quale sia l’hamiltoniana del sistema, ma non può riguardare la questione di come descrivere il sistema. Cosa scegliamo come stati di base non ha niente a che vedere con cosa avverrà poi. Può benissimo accadere che l’atomo non possa rimanere in uno di questi stati di base anche se ci si trova inizialmente. Questo è un altro problema. Precisamente, il problema di come le ampiezze variano con il tempo in un particolare (fissato) sistema di base. Scegliendo il sistema di base, non facciamo altro che scegliere i «versori» della nostra rappresentazione. Mentre siamo in argomento, consideriamo il problema generale di trovare un insieme di stati di base quando si ha a che fare con più di una particella. Gli stati di base per una singola particella sono ben noti. Per esempio, un elettrone è completamente descritto nella realtà (non nei nostri modelli semplificati, ma proprio nella realtà) dalle ampiezze relative a ciascuno dei due seguenti stati: | elettrone «su» con impulso pi oppure | elettrone «giù» con impulso pi Questi sono in effetti due sistemi infiniti di stati, uno per ogni valore di p. Ciò è quanto dire che uno stato | i dell’elettrone è completamente specificato se si conoscono le ampiezze h+, p | i
e
h ,p| i
dove + e rappresentano le componenti del momento angolare lungo un dato asse, in genere l’asse z, e p è il vettore impulso. Quindi, ci sono due ampiezze per ogni possibile impulso (un insieme di stati di base pluri-infinito). Ciò è tutto quanto occorre per descrivere una particella singola. Quando c’è più di una particella, gli stati di base possono essere scritti in una forma simile. Per esempio, se si ha a che fare con un elettrone e un protone in una situazione più complicata di
�– +�, �3�
�– –�, �4�
12.1 Un insieme di stati di base per lo stato fondamentale dell’atomo di idrogeno. FIGURA
178
Capitolo 12 • La struttura iperfine dell’idrogeno
© 978-8808-22107-0
quella che stiamo considerando, gli stati di base potrebbero essere del tipo seguente: | un elettrone con spin «su», che si muove con impulso p1 e un protone con spin «giù», che si muove con impulso p2 i E così via per altre combinazioni di spin. Se ci sono più di due particelle, stessa cosa. Vedete quindi che è effettivamente molto facile scrivere i possibili stati di base. L’unico problema è quello di trovare l’hamiltoniana? Per il nostro studio dello stato fondamentale dell’atomo di idrogeno, non è necessario usare l’insieme completo degli stati di base per tutti i vari impulsi. Quando diciamo «lo stato fondamentale», stiamo già specificando dei particolari stati di impulso per il protone e l’elettrone. I particolari della configurazione, cioè le ampiezze relative a tutti gli stati di base dell’impulso, possono essere calcolati, ma questo è un altro problema. Per ora ci interessano solo gli effetti dello spin e, quindi, possiamo limitarci solo ai quattro stati di base della (12.1). Il problema che dobbiamo ora affrontare è: qual è l’hamiltoniana per questo insieme di stati?
12.2
L’hamiltoniana per lo stato fondamentale dell’atomo di idrogeno
Ve ne parleremo tra un istante. Ma prima vi dobbiamo ricordare una cosa: ogni stato può essere sempre scritto come combinazione lineare degli stati di base. Per ogni stato | i, possiamo scrivere | i = | + +i h+ + | i + | + i h+ | i + | +i h + | i + |
ih
| i
(12.2)
Ricordatevi che le parentesi complete sono dei numeri complessi, che quindi possiamo indicare come al solito con Ci , dove i = 1, 2, 3, 4, e possiamo allora scrivere l’equazione (12.2) nella forma | i = | + +i C1 + | + i C2 + | +i C3 + |
TABELLA 12.1 Proprietà degli operatori σ .
| +i = + | +i | i z| i= x | +i = + | i x | i = + | +i y | +i = +i | i y | i = i | +i z
i C4
(12.3)
Specificando le quattro ampiezze Ci descriviamo completamente lo stato di spin | i. Se queste quattro ampiezze variano con il tempo, come infatti fanno, la velocità di variazione nel tempo è ˆ Il problema che si pone è quello di trovare H. ˆ data dall’operatore H. Non esiste una regola generale per scrivere l’hamiltoniana di un sistema atomico, e ricavare la formula giusta richiede inoltre più abilità che non trovare un insieme di stati di base. Mentre siamo stati in grado di darvi un procedimento generale per scrivere un insieme di stati di base per un problema qualsiasi con un protone e un elettrone, è invece troppo difficile a questo livello fare una trattazione generale dell’hamiltoniana di questo sistema. Invece, arriveremo a un’hamiltoniana con ragionamenti di tipo euristico, e voi la prenderete per buona, in quanto i risultati sono in accordo con le osservazioni sperimentali. Vi ricorderete che nel capitolo precedente siamo riusciti a descrivere l’hamiltoniana di una singola particella a spin un mezzo usando le matrici sigma, ovvero, ciò che è esattamente equivalente, gli operatori sigma. Le proprietà di questi operatori sono riassunte nella TABELLA 12.1. Questi operatori, che sono semplicemente un mezzo conveniente e abbreviato di prendere in considerazione gli elementi di matrice del tipo h+ | z | +i, si sono rivelati utili per rappresentare il comportamento di una singola particella di spin un mezzo. Il problema che si pone ora è quello di vedere se si può trovare un metodo analogo per descrivere un sistema con due spin. La risposta è sì; e in un modo molto semplice, come segue. Inventiamo un oggetto che chiamiamo «sigma dell’elettrone», che rappresentiamo con l’operatore vettoriale e , e che ha le componenti x, y e z uguali a ex , ye e ze . Facciamo poi la convenzione che quando uno di questi oggetti opera su di uno qualsiasi dei quattro stati di base dell’atomo d’idrogeno, esso agisca solo sullo spin dell’elettrone, ed esattamente allo stesso modo come se l’elettrone se ne stesse per conto suo. Esempio: che cos’è ye | +i? Poiché y su un elettrone «giù» è uguale a i volte lo stato corrispondente con l’elettrone «su», e y
| +i = i | + +i
12.2 • L’hamiltoniana per lo stato fondamentale dell’atomo di idrogeno
© 978-8808-22107-0
(Quando ye opera su di uno stato composto, fa girare lo spin dell’elettrone, ma non fa niente al protone e moltiplica il risultato per i ). Operando sugli altri stati ye darebbe e y
| + +i = i | +i
e y
|+ i = i|
e y
|
i
i = i|+ i
Basta ricordare che gli operatori e agiscono sul primo simbolo di spin, cioè sullo spin dell’elettrone. Poi definiamo il corrispondente operatore «sigma del protone», relativo allo spin del protone. p p p Le sue tre componenti x , y e z agiscono nello stesso modo di e , ma solo sullo spin del p protone. Per esempio, se facciamo operare x su ognuno degli stati di base, si ottiene, sempre usando la TABELLA 12.1, p x
| + +i = | + i
p x
| + i = | + +i
p x
| +i = |
p x
|
i
i = | +i
Come vedete, non è molto difficile. Nel caso più generale, potremmo avere cose più complicate. Potrebbero, per esempio, comp parire dei prodotti dei due operatori, come ye z . Quando si ha un tale prodotto, facciamo prima quello che dice l’operatore a destra, e poi quello che dice l’altro(1) . Per esempio si avrà che ⇣ p ⌘ e p e z |+ i = x z |+ i = x =
e x
⇣
⌘ |+ i =
e x
|+ i = |
i
Si noti che questi operatori lasciano inalterati i semplici numeri; abbiamo tenuto conto di questo fatto quando abbiamo scritto ex ( 1) = ( 1) ex . Diciamo che gli operatori «commutano» con i semplici numeri, oppure che un numero «può essere portato fuori» dal segno di operatore. Potete p fare pratica mostrando che il prodotto ye z dà i sequenti risultati per i soliti quattro stati: e x
p z
| + +i = + | +i
e x
p z
|+ i =
e x
p z
| +i = + | + +i
e x
p z
|
i=
|
i
|+ i
Se consideriamo tutti i possibili operatori, prendendo ciascun tipo di operatore solo una volta, ˆ otteniamo in tutto sedici possibilità. Sì, sedici, purché s’includa anche l’«operatore unità» 1. p p p e e e Innanzitutto, abbiamo i tre: x , y e z . Poi gli altri tre x , y , z ; che fa sei. Poi ancora ci sono p i nove possibili prodotti della forma ex y , che portano il totale a quindici. Infine c’è l’operatore unità che lascia semplicemente inalterato lo stato. In tutto sedici. Si osservi ora che l’hamiltoniana di un sistema a quattro stati deve essere una matrice quattro per quattro di coefficienti, e quindi avrà sedici elementi. Si dimostra facilmente che ogni matrice quattro per quattro, e quindi in particolare la matrice hamiltoniana, può essere espressa come combinazione lineare delle sedici matrici doppie di spin corrispondenti all’insieme di operatori (1)
Per questi particolari operatori, noterete che l’ordine di successione non ha importanza.
179
180
Capitolo 12 • La struttura iperfine dell’idrogeno
© 978-8808-22107-0
che abbiamo appena costruito. Ci aspettiamo, quindi, che l’operatore hamiltoniano che descrive l’interazione tra un protone e un elettrone, considerando solamente i loro spin, possa essere scritto come combinazione lineare di questi stessi sedici operatori. Il solo problema è: come? Ebbene, per prima cosa, sappiamo che l’interazione non dipende dalla nostra scelta del sistema di assi coordinati. Se non ci sono influenze esterne, come un campo magnetico, che determinino una definita direzione nello spazio, l’hamiltoniana non può dipendere dalla nostra scelta della direzione degli assi x, y e z. Ciò comporta che l’hamiltoniana non può contenere un termine come ex da solo. Sarebbe ridicolo, perché altrimenti, si otterrebbero risultati diversi usando un differente sistema di assi. Le uniche possibilità sono un termine con la matrice unità, diciamo una costante a (per 1ˆ ), e qualche combinazione delle sigma che non dipenda dalle coordinate, cioè qualche combinazione «invariante». La sola combinazione invariante scalare di due vettori, è appunto il prodotto scalare, che per le nostre è e
·
p
=
e x
p x
+
p y
e y
+
e z
p z
(12.4)
Questo operatore è invariante rispetto a ogni rotazione del sistema di coordinate. Quindi, l’unica possibile hamiltoniana con la corretta simmetria nello spazio, è data da una costante per la matrice unità più una costante per questo prodotto scalare, ovvero, Hˆ = E0 + A
e
·
p
(12.5)
Questa è la nostra hamiltoniana. È la sola cosa possibile, data la simmetria nello spazio, finché non c’è un campo esterno. Il termine costante non ci dice molto; esso dipende semplicemente dall’origine che si sceglie per misurare le energie. Possiamo benissimo prendere E0 = 0. Il secondo termine ci dice tutto quello che occorre sapere per calcolare la differenza di energia tra i livelli dell’idrogeno. Se volete, potete vedere questa hamiltoniana da un diverso punto di vista. Se si hanno due magneti di momenti magnetici µe e µp , l’uno vicino all’altro, l’energia mutua dipenderà, tra l’altro, da µe · µ p . Inoltre, ricorderete che abbiamo trovato che la quantità classica che chiamiamo µ e riappare in meccanica quantistica sotto la forma µe e . Analogamente, quel che appare classicamente come µ p si ritrova di solito in meccanica quantistica come µp p (dove µp è il momento magnetico del protone, che è circa mille volte più piccolo di µe , e ha segno opposto). Quindi l’equazione (12.5) ci dice che l’energia di interazione ha la stessa forma dell’interazione tra due magneti, ma non del tutto, perché l’interazione tra due magneti dipende dalla distanza radiale che c’è tra di loro. Ma l’equazione (12.5) potrebbe essere, e infatti lo è, una sorta d’interazione media. L’elettrone circola dappertutto nell’interno dell’atomo, e la nostra hamiltoniana rappresenta solo l’energia media di interazione. Tutto quello che ci dice è che per una data configurazione spaziale dell’elettrone e del protone, si ha, in termini classici, un’energia proporzionale al coseno dell’angolo tra i due momenti magnetici. Una tale rappresentazione classica qualitativa può aiutarvi a comprendere da dove venga fuori, ma ciò che importa è che l’equazione (12.5) è la formula quantistica giusta. L’ordine di grandezza dell’interazione classica tra due magneti è uguale al prodotto dei due momenti magnetici diviso per il cubo della distanza che li separa. La distanza tra l’elettrone e il protone nell’atomo di idrogeno è uguale, grossolanamente, a metà del raggio atomico, cioè 0,5 Å. È perciò possibile stimare in prima approssimazione che la costante A debba essere circa uguale al prodotto dei due momenti magnetici µe e µp diviso per il cubo di 0,5 Å. Una tale stima porta a un numero abbastanza corretto. Si trova che A può essere calcolato esattamente una volta capita la teoria quantistica completa dell’atomo d’idrogeno, ciò che per ora non è. In effetti, è stato calcolato con una precisione di circa 30 parti su un milione. Quindi, al contrario della costante A legata al moto di va e vieni della molecola di ammoniaca, che non si poteva calcolare per niente con una teoria, la nostra costante A per l’idrogeno può essere calcolata da una teoria più dettagliata. Ma lasciamo perdere; per i nostri fini attuali, è sufficiente considerare A come un numero che si può determinare in base all’esperienza, e passiamo ad analizzare i lati fisicamente rilevanti del problema.
12.2 • L’hamiltoniana per lo stato fondamentale dell’atomo di idrogeno
© 978-8808-22107-0
Ammessa l’hamiltoniana dell’equazione (12.5), possiamo usarla insieme all’equazione X i~C˙i = Hi j C j (12.6) j
per calcolare gli effetti sui livelli dell’interazione degli spin. Per fare ciò, occorre ricavare i sedici elementi di matrice Hi j = hi | H | ji corrispondenti a ciascuna coppia dei quattro stati di base nella (12.1). Cominciamo a calcolare cosa dà Hˆ | ji per ciascuno dei quattro stati di base. Per esempio, ⇣ ⌘ p p p Hˆ | + +i = A e · p | + +i = A ex x + ye y + ze z | + +i (12.7) Usando il metodo descritto poco fa, che è semplice se avete imparato a memoria la TABELLA 12.1, troviamo l’effetto di ciascuna coppia di su | + +i. Il risultato è e x
p x
| + +i = + |
i
e y
p y
| + +i =
i
e z
p z
| + +i = + | + +i
|
(12.8)
Quindi, la (12.7) diviene ⇣ Hˆ | + +i = A |
i
⌘ i + | + +i = A | + +i
|
(12.9)
Poiché i nostri stati di base sono tutti ortogonali, questo ci dà subito che h+ + | H | + +i = A h+ + | + +i = A h+ | H | + +i = A h+ | + +i = 0 h + | H | + +i = A h + | + +i = 0 h
| + +i = 0
| H | + +i = A h
Ricordando che
(12.10)
h j | H | ii = hi | H | ji⇤
possiamo già scrivere l’equazione differenziale per le ampiezze C1 : i~C˙1 = H11 C1 + H12 C2 + H13 C3 + H14 C4 ossia
i~C˙1 = AC1
(12.11)
Questo è tutto! Si ottiene un solo termine. Per ottenere il resto delle equazioni hamiltoniane, basta rigirare lo stesso procedimento operando con Hˆ sugli altri stati. Anzitutto vi faremo fare un po’ di esercizio controllando tutti prodotti di sigma che abbiamo riportato nella TABELLA 12.2. Poi possiamo usare questi risultati per ricavare: ( ) Hˆ | + i = A 2 | +i | + i ( Hˆ | +i = A 2 | + i Hˆ |
i = A|
| +i
)
(12.12)
i
Quindi, moltiplicando a sinistra ciascuna di queste equazioni successivamente per tutti gli altri vettori di stato, otteniamo la seguente hamiltoniana, Hi j : j!
A *. .0 Hi j = .. .. 0 ,0 i#
0 A 2A 0
0 2A A 0
0 + 0 // // 0 //
A-
(12.13)
181
182 TABELLA
Capitolo 12 • La struttura iperfine dell’idrogeno
12.2
Operatori di spin per l’atomo
di idrogeno.
e x e x e x e x
p x p x p x p x
e y e y e y e y
p y p y p y p y
e z e z e z e z
p z p z p z p z
| + +i = + |
© 978-8808-22107-0
Ciò, naturalmente, non significa altro che le nostre equazioni differenziali per le quattro ampiezze Ci sono i~C˙1 = AC1
i
| + i = + | +i
i~C˙2 = AC2 + 2AC3
| +i = + | + i
i~C˙3 = 2AC2
|
i~C˙4 = AC4
i = + | + +i
| + +i =
|
i
| + i = + | +i | +i = + | + i |
i=
| + +i
Prima di risolvere queste equazioni, non possiamo resistere alla tentazione di raccontarvi una brillante trovata dovuta a Dirac, che vi farà sentire molto avanti, anche se non ci serve per il nostro calcolo. Dalle equazioni (12.9) e (12.12) si ha che e · p | + +i = | + +i e
| + +i = + | + +i |+ i =
|+ i
| +i =
| +i
|
i = +|
i
(12.14) AC3
e e
· · ·
p
| + i = 2 | +i
|+ i
p
| +i = 2 | + i
| +i
p
|
i=|
(12.15)
i
Osservate, disse Dirac, che io posso scrivere la prima e l’ultima di queste equazioni come e · p | + +i = 2 | + +i | + +i e
p
·
|
i = 2|
i
|
i
e in questo modo si assomigliano tutte. Adesso invento un nuovo operatore, che chiamo Psc spin che, per definizione, ha le seguenti proprietà(2) : Psc spin | + +i = | + +i Psc spin | + i = | +i Psc spin | +i = | + i Psc spin |
i=|
i
Questo operatore non fa che scambiare le componenti dello spin delle due particelle. Allora posso riscrivere l’intero sistema di equazioni (12.15) come una semplice equazione tra operatori: e
·
p
= 2Psc spin
1
(12.16)
Questa è la formula di Dirac. Il suo «operatore di scambio spin» fornisce una comoda regola per calcolare e · p . (Come vedete, adesso potete fare tutto. La strada è sgombra.)
12.3
I livelli di energia
Siamo ora pronti a calcolare i livelli di energia dello stato fondamentale dell’atomo di idrogeno risolvendo le equazioni hamiltoniane (12.14). Vogliamo determinare le energie degli stati stazionari. Questo significa che vogliamo trovare quegli stati particolari | i per i quali ogni ampiezza Ci = hi | i dell’insieme relativo a | i ha la stessa dipendenza dal tempo, cioè e i!t . Lo stato avrà allora l’energia E = ~!. Vogliamo quindi un insieme per il quale Ci = ai e (2)
(i/~)Et
Questo operatore si chiama ora «operatore di Pauli di scambio spin».
(12.17)
12.3 • I livelli di energia
© 978-8808-22107-0
dove i quattro coefficienti ai sono indipendenti dal tempo. Per vedere se si possono ottenere simili ampiezze, sostituiamo la (12.17) nell’equazione (12.14) e vediamo che cosa succede. Ciascun i~ dC/dt nell’equazione (12.14) diventa EC, e, dopo aver cancellato il fattore esponenziale comune, ciascuna C diventa una a; si ottiene dunque Ea1 = Aa1 Ea2 = Aa2 + 2Aa3 Ea3 = 2Aa2
(12.18)
Aa3
Ea4 = Aa4 che dobbiamo risolvere in a1 , a2 , a3 e a4 . È una buona cosa che la prima equazione sia indipendente dal resto, il che significa che si ha subito una soluzione. Se scegliamo E = A, a1 = 1
a2 = a3 = a4 = 0
costituisce una soluzione. (Naturalmente, anche mettendo tutte le a uguali a zero, si ottiene una soluzione, ma questa non corrisponde a nessuno stato!) Chiamiamo stato | Ii quello corrispondente alla prima soluzione(3) | Ii = | 1i = | + +i (12.19) La sua energia è EI = A Premesso ciò, si vede subito un’altra soluzione partendo dall’ultima delle equazioni (12.18): a1 = a2 = a3 = 0
a4 = 1
E=A Chiameremo questa soluzione stato | IIi: | IIi = | 4i = |
(12.20)
i
EII = A Ora la cosa diventa un po’ più difficile; le due rimanenti equazioni delle (12.18) sono accoppiate. Ma abbiamo già avuto a che fare con un caso simile. Sommandole, si ottiene E(a2 + a3 ) = A(a2 + a3 )
(12.21)
Sottraendole, si ha E(a2
a3 ) = 3A(a2
a3 )
(12.22)
A vista, e ricordandosi dell’ammoniaca, si riconoscono due soluzioni: a2 = a3 a2 = a3
E=A E = 3A
(12.23)
Si tratta di p combinazioni di | 2i e | 3i. Chiamando | IIIi e | IVi questi stati, e introducendo un fattore 1/ 2 per renderli propriamente normalizzati, si ha ⌘ ⌘ 1 ⇣ 1 ⇣ | IIIi = p | 2i + | 3i = p | + i + | +i 2 2
(12.24)
EIII = A (3) Lo stato è, in realtà, | I i e (i/~)EI t , ma, come al solito, identificheremo gli stati con dei vettori costanti che sono uguali ai vettori di stato completi a t = 0.
183
184
Capitolo 12 • La struttura iperfine dell’idrogeno
e
1 ⇣ | IVi = p | 2i 2 EIV = 3A
© 978-8808-22107-0
⌘ 1 ⇣ | 3i = p | + i 2
| +i
⌘
(12.25)
Abbiamo quindi trovato quattro stati stazionari e le loro energie. Si noti, per inciso, che i nostri quattro stati sono ortogonali e possono quindi anche essere usati come stati di base, se si vuole. Il nostro problema è completamente risolto. Tre degli stati hanno energia A, mentre il quarto ha energia 3A. La media è zero, in modo che l’avere scelto E0 = 0 nell’equazione (12.5), signiI, II, III fica semplicemente che misuriamo le energie a partire dall’energia media. E0 + A Possiamo disegnare il diagramma dei livelli di energia corrispondenti allo stato fondamentale dell’idrogeno, che appare come in FIGURA 12.2. E0 La differenza di energia tra lo stato | IVi e uno qualsiasi degli altri è 4A. Un atomo che si viene a trovare nello stato | Ii può cadere di qui allo stato |∆E | = !ω | IV i ed emettere luce; non luce nella zona del visibile, perché l’energia è molto piccola, bensì un quanto nella zona delle microonde. Oppure, se s’irradia con delle microonde il gas d’idrogeno, si constaterà un assorbimento d’energia, perché gli atomi nello stato | IV i prendono energia e vanno in IV E0 – 3A uno degli stati superiori, ma questo avverrà solo in corrispondenza della frequenza ! = 4A/~. Questa frequenza è stata misurata sperimentalmente; il risultato migliore, ottenuto molto recentemente(4) , è FIGURA 12.2 Diagramma dei livelli energetici dello stato fondamentale dell’idrogeno atomico.
f =
! = (1 420 405 751,800 ± 0,028) cicli/s 2⇡
(12.26)
L’errore è solo di due parti su 100 miliardi! Probabilmente, nessuna altra quantità fisica fondamentale è stata misurata meglio di così; si tratta di una delle misure più precise della fisica. I teorici erano molto felici di essere stati in grado di calcolare questa energia con la precisione di 3 parti su 105 , ma, nel frattempo, è stata misurata a meno di 2 parti su 1011 , una precisione milioni di volte superiore a quella della teoria. Quindi gli sperimentali sono molto più avanti dei teorici. Per quanto riguarda la teoria dello stato fondamentale dell’atomo di idrogeno, voi siete allo stesso livello di chiunque altro. Voi pure, infatti, ricavate il valore di A dall’esperienza; ciò che, appunto, alla fin fine ognuno è costretto a fare. Probabilmente, avete già sentito parlare della «riga a 21 centimetri» dell’idrogeno. Si tratta della lunghezza d’onda della riga spettrale a 1420 megacicli tra gli stati iperfini. La radiazione di questa lunghezza d’onda è emessa o assorbita dal gas di idrogeno atomico nelle galassie. Quindi, con un radiotelescopio sintonizzato su onde di 21 centimetri (o 1420 megacicli, approssimativamente), si possono osservare le velocità e le posizioni di concentrazioni di gas di idrogeno atomico. Misurando le intensità, si possono valutare le quantità di idrogeno. Misurando lo spostamento di frequenze dovuto all’effetto Doppler, si ottengono informazioni sul movimento del gas nella galassia. Questo è uno dei grandi progetti della radioastronomia. Quindi stiamo parlando ora di qualcosa che è molto realistico; non si tratta di un problema artificioso.
12.4
L’effetto Zeeman
Anche se abbiamo finito il calcolo dei livelli di energia dello stato fondamentale dell’idrogeno, vorremmo studiare ancora un po’ questo interessante sistema. Per poter dire qualche cosa di più in proposito, per esempio per calcolare l’intensità con cui l’atomo di idrogeno assorbe o emette onde radio a 21 centimetri, dobbiamo sapere ciò che accade quando l’atomo viene perturbato. Dobbiamo procedere come per la molecola di ammoniaca, nel quale caso, dopo aver trovato (4)
Crarnpton, Kleppner e Ramsey; Physical Review Letters, Vol. 11, pag. 338 (1963).
12.4 • L’effetto Zeeman
© 978-8808-22107-0
i livelli di energia, eravamo passati a studiare cosa succede quando la molecola si trova in un campo elettrico. Eravamo riusciti allora a valutare gli effetti dovuti a un campo elettrico di un’onda radio. Per l’atomo di idrogeno, il campo elettrico non fa niente ai livelli, tranne che spostarli tutti di una qualche quantità costante proporzionale al quadrato del campo, e questo non ha alcun interesse perché non viene a mutare le differenze di energia. Ora è invece il campo magnetico a essere importante. Il prossimo passo sarà quindi quello di scrivere l’hamiltoniana nel caso più complicato in cui l’atomo si trova in un campo magnetico esterno. Qual è l’hamiltoniana? Vi diremo semplicemente qual è la risposta, perché non ve ne possiamo dare nessuna «dimostrazione» tranne che affermare che è così che funziona l’atomo. L’hamiltoniana è Hˆ = A e · p µe e · B µp p · B (12.27) Essa consiste di tre parti. Il primo termine A ( e · p ) rappresenta l’interazione magnetica tra l’elettrone e il protone, ed è la stessa che ci sarebbe in assenza del campo magnetico. Questo è il termine che già avevamo prima; l’influenza del campo magnetico sulla costante A è trascurabile. Gli effetti del campo magnetico esterno si fanno sentire con gli ultimi due termini. Il secondo termine, µe e · B, è l’energia che avrebbe l’elettrone nel campo magnetico se fosse là da solo(5) . Allo stesso modo, l’ultimo termine, µp p · B, sarebbe l’energia del protone da solo. Dal punto di vista classico, l’energia complessiva dei due sarebbe la somma delle due energie, e questo vale anche quantisticamente. In presenza di un campo magnetico, l’energia d’interazione dovuta al campo è semplicemente la somma dell’energia di interazione dell’elettrone e di quella del protone con il campo esterno, tutte e due espresse mediante gli operatori sigma. In realtà, in meccanica quantistica, questi termini non sono proprio le energie, ma pensare alle formule classiche per l’energia è un modo di ricordare le regole per scrivere l’hamiltoniana. A ogni modo, l’hamiltoniana esatta è l’equazione (12.27). Dobbiamo ora ricominciare dal principio e risolvere da capo tutto il problema. Molto del lavoro è però già fatto, e si tratta solo di aggiungere gli effetti dei nuovi termini. Prendiamo un campo magnetico B costante nella direzione z. Dobbiamo allora aggiungere al nostro operatore hamiltoniano Hˆ i due nuovi pezzi, che indichiamo con Hˆ 0: ⇣ ⌘ p Hˆ 0 = µe ze + µp z B Usando la TABELLA 12.1, otteniamo immediatamente che
Hˆ 0 | + +i = (µe + µp ) B | + +i Hˆ 0 | + i = (µe
µp ) B | + i
Hˆ 0 | +i = ( µe + µp ) B | +i Hˆ 0 |
i = (µe + µp ) B |
(12.28)
i
Che comodità! Hˆ 0, agendo su di uno stato, ci dà semplicemente un numero per quello stato. La matrice hi | H 0 | ji ha, perciò, solo elementi diagonali, e possiamo semplicemente sommare i coefficienti che appaiono nella (12.28) ai corrispondenti termini diagonali della (12.13), e le equazioni hamiltoniane (12.14) diventano ) dC1 ( = A (µe + µp ) B C1 dt ( ) dC2 i~ = A + (µe µp ) B C2 + 2AC3 dt ( ) dC3 i~ = 2AC2 A (µe µp ) B C3 dt i~
(5)
(12.29a) (12.29b) (12.29c)
Si ricordi che, secondo le leggi classiche, U = µ · B, di modo che l’energia è minima quando il momento è lungo il campo. Per le particelle positive, il momento magnetico è parallelo allo spin, mentre per le particelle negative è opposto. Quindi, nell’equazione (12.27), µp è un numero positivo, mentre µe è un numero negativo.
185
186
Capitolo 12 • La struttura iperfine dell’idrogeno
i~
© 978-8808-22107-0
) dC4 ( = A + (µe + µp ) B C4 dt
(12.29d)
La forma delle equazioni non è differente, solo i coefficienti lo sono. Purché B non vari nel tempo, possiamo procedere come prima. Sostituendo Ci = ai e (i/~)Et , otteniamo, come modifica della (12.18), le espressioni ( ) Ea1 = A (µe + µp )B a1 ( ) Ea2 = A + (µe µp )B a2 + 2Aa3 (12.30) ( ) Ea3 = 2Aa2 A (µe µp )B a3 ( ) Ea4 = A + (µe + µp )B a4
Per fortuna, la prima e la quarta equazione sono ancora indipendenti dal resto, e quindi funziona ancora la stessa tecnica. Una soluzione è costituita dallo stato | Ii per il quale a1 = 1 e a2 = a3 = a4 = 0, ovvero | Ii = | 1i = | + +i con
(12.31) EI = A
(µe + µp ) B
Un’altra soluzione è | IIi = | 4i = |
i
con
(12.32) EII = A + (µe + µp ) B
Un po’ più di lavoro è necessario per le ultime due equazioni, perché i coefficienti di a2 e di a3 non sono più uguali. Ma esse si presentano proprio come le due equazioni che avevamo per la molecola di ammoniaca. Riguardando l’equazione (9.20), constatiamo la seguente analogia (ricordando che gli indici 1 e 2 di allora corrispondono a 2 e 3 di adesso): H11 ! A
(µe
µp ) B
H12 ! 2A
(12.33)
H21 ! 2A H22 ! A + (µe
µp ) B
Le energie sono quindi date dalla (9.25), che era r H11 + H22 (H11 H22 )2 ± + H12 H21 E= 2 4 Facendo le sostituzioni delle (12.33), la formula dell’energia diviene q E = A ± (µe µp )2 B 2 + 4A2
(12.34)
Mentre nel capitolo 9 chiamavamo queste energie EI ed EII , in questo problema le indicheremo con EIII ed EIV : s 8 9 > > > (µe µp )2 B2 > > > < = EIII = A > 1 + 2 1 + 2 > > > 4A > > : ; (12.35) s 8 9 > > > (µe µp )2 B2 > > > = 1 + EIV = A < 1 + 2 2 > > > > 4A > > : ;
12.4 • L’effetto Zeeman
© 978-8808-22107-0
Abbiamo così trovato le energie dei quattro stati stazionari di un atomo di idrogeno in un campo magnetico costante. Facciamo un controllo dei nostri risultati facendo andare B a zero, e guardando se si ottengono le stesse energie che avevamo trovato al paragrafo precedente. Si vede che è così. Per B = 0, le energie EI , EII ed EIII vanno a +A, ed EIV va a 3A. Anche la nostra notazione degli stati coincide con quella di prima. Quando, tuttavia, si accende il campo magnetico, tutte le energie cambiano in modo diverso. Vediamo dove vanno a finire. Prima di tutto, dobbiamo ricordarci che nel caso dell’elettrone, µe è negativo, e circa 1000 volte più grande di µp , che è positivo. Quindi, µe + µp e µe µp sono entrambi numeri negativi, e quasi uguali. Indichiamoli con µ e µ0: µ = (µe + µp ) µ0 = (µe
µp )
(12.36)
(Sia µ sia µ0 sono numeri positivi, quasi uguali in modulo a µe , che è circa un magnetone di Bohr.) Le nostre quattro energie sono perciò EI = A + µB EII = A EIII
EIV
µB
r 8 > > = A< 1+2 1+ > > : r 8 > > = A< 1+2 1+ > > :
9 > µ02 B2 > = 2 > 4A > ; 9 > µ02 B2 > = 2 > 4A > ;
(12.37)
L’energia EI parte da A e cresce linearmente con B, con pendenza µ. L’energia EII parte anch’essa da A ma decresce linearmente al crescere di B, con pendenza µ. Questi due livelli variano con B, com’è mostrato in FIGURA 12.3. Mostriamo nella figura anche le energie EIII ed EIV . Esse hanno una differente dipendenza da B. Per B piccolo, la dipendenza da B è quadratica, e quindi partono con pendenze orizzontali. Poi cominciano a incurvarsi, e per grandi B, si avvicinano a rette di inclinazione ±µ0, che hanno quasi le stesse pendenze di EI e di EII . Lo spostamento dei livelli di energia di un atomo causato da un campo magnetico si chiama effetto Zeeman. Diciamo, quindi, che le curve in FIGURA 12.3 mostrano la risoluzione per effetto Zeeman dello stato fondamentale dell’idrogeno. Quando non c’è campo magnetico, otteniamo solo una riga dalla struttura iperfine dell’idrogeno. La transizione tra lo stato | IVi e uno qualsiasi degli altri si verifica con l’assorbimento o l’emissione di un fotone, la cui frequenza di 1420 megacicli è uguale a 1/h volte la differenza di energia 4A. Ma quando l’atomo si trova in un campo magnetico B, si hanno molte più righe. Si possono avere transizioni tra due qualsiasi dei quattro stati. Se, quindi, abbiamo atomi in tutti e quattro gli stati, l’energia può essere assorbita – o emessa – in una qualsiasi delle sei transizioni indicate con le frecce verticali in FIGURA 12.4. Molte di queste transizioni possono essere osservate con la tecnica di Rabi dei fasci molecolari che abbiamo descritto nel paragrafo 35.3 del vol. 2 (vedi Appendice). Che cosa fa avvenire le transizioni? La transizione avverrà se si applica un piccolo campo magnetico di perturbazione che varia con il tempo (in aggiunta al forte campo magnetico stazionario B). È proprio come abbiamo visto per un campo elettrico variabile agente sulla molecola di ammoniaca. L’unica differenza è che, in questo caso, è il campo magnetico che si accoppia ai momenti magnetici e fa il gioco. Ma la teoria procede lungo le stesse linee che abbiamo seguito per la molecola di ammoniaca. La teoria è la più semplice possibile se si prende un campo magnetico orizzontale oscillante. Quando s’introduce questo campo di perturbazione come un termine aggiuntivo nell’hamiltoniana, si ottengono delle soluzioni in cui le ampiezze variano con il tempo, come abbiamo trovato per la molecola di ammoniaca. Quindi, potete calcolare con facilità e precisione la probabilità di una transizione da uno stato a un altro. E troverete che i risultati sono in accordo con l’esperienza.
187
188
Capitolo 12 • La struttura iperfine dell’idrogeno
© 978-8808-22107-0
E I 4 III 3 2 1 0 1
2
3
B
4
–1 –2
II
–3 –4 IV
–5
12.3 I livelli energetici dello stato fondamentale dell’idrogeno in un campo magnetico B. FIGURA
12.5
12.4 Transizioni tra i livelli energetici appartenenti allo stato fondamentale dell’idrogeno, per un particolare valore del campo magnetico B.
FIGURA
Gli stati in un campo magnetico
Vogliamo ora discutere la forma delle curve in FIGURA 12.3. In primo luogo, le energie per campi forti sono facilmente comprensibili e piuttosto interessanti. Per B abbastanza grande (cioè per µB/A 1 ), possiamo trascurare gli 1 nelle formule (12.37). Le quattro energie diventano EI EII EIII EIV
= = = =
A + µB A µB A + µ0 B A µ0 B
(12.38)
Queste sono le equazioni delle quattro rette in FIGURA 12.3. Possiamo capire fisicamente queste energie nel modo seguente. La natura degli stati stazionari in un campo nullo è determinata completamente dall’interazione dei due momenti magnetici. Le miscele di stati di base | + i e | +i che appaiono negli stati stazionari | IIIi e | IVi sono dovute a questa interazione. Invece, in presenza di forti campi esterni, il protone e l’elettrone saranno leggermente influenzati l’uno dal campo dell’altro; ciascuno si comporterà come se fosse solo nel campo esterno. Quindi, come abbiamo già visto molte volte, lo spin dell’elettrone sarà o parallelo o opposto al campo magnetico esterno. Supponiamo che lo spin dell’elettrone sia «su», cioè nella direzione del campo; la sua energia sarà allora µe B. Il protone può ancora trovarsi nelle due possibili condizioni. Se anche lo spin del protone è «su», la sua energia è µp B. La somma delle due è (µe + µp ) B = µB Questo è proprio quanto troviamo per EI , il che va bene perché stiamo descrivendo lo stato | + +i = | Ii. C’è ancora il piccolo termine addizionale A (ora µB A ) che rappresenta l’energia
12.5 • Gli stati in un campo magnetico
© 978-8808-22107-0
di interazione tra il protone e l’elettrone quando i loro spin sono paralleli. (Abbiamo fin dal principio preso A come positivo, perché la teoria di cui parliamo dice che così deve essere, e sperimentalmente è proprio così.) D’altra parte, lo spin del protone può anche essere «giù». Allora la sua energia nel campo magnetico sarà +µp B, e insieme all’elettrone si avrà in tutto l’energia (µe
µp ) B = µ 0 B
E l’energia di interazione diventa A. La somma è appunto uguale all’energia EIII nella (12.38). Quindi lo stato | IIIi per campi intensi deve tendere allo stato | + i. Supponiamo ora che lo spin dell’elettrone sia «giù». La sua energia nel campo esterno è µe B. Se anche il protone è «giù», i due messi insieme hanno l’energia (µe + µp ) B = µB più l’energia d’interazione A, poiché i loro spin sono paralleli. Questo dà proprio l’energia EII nella (12.38) e corrisponde allo stato | i = | IIi, il che va bene. Infine se l’elettrone è «giù» e il protone è «su», si ha l’energia (µe µp ) B A (meno A per l’interazione perché gli spin sono opposti) che è proprio EIV . E lo stato corrisponde a | +i. «Ma un momento!», voi starete dicendo, «Gli stati | IIIi e | IVi non sono gli stati | + i e | +i; essi sono miscugli dei due». Sì, ma solo in minima parte. Essi sono in effetti miscugli per B = 0, ma non abbiamo ancora valutato quello che sono per grandi B. Quando abbiamo fatto ricorso alle analogie espresse dalle (12.33) nelle nostre formule nel capitolo 9 per ottenere le energie degli stati stazionari, avremmo anche potuto prendere le ampiezze che a essi corrispondono. Esse derivano dall’equazione (9.24), che è E H22 a2 = a3 H21 Il rapporto a2 /a3 , naturalmente, non è altro che C2 /C3 . Infilando dentro le grandezze analoghe ottenute dalle (12.33), ricaviamo E+A C2 = C3 oppure
(µe 2A
µp ) B
C2 E + A + µ0 B = C3 2A
(12.39)
dove, per E, dobbiamo usare l’energia appropriata, o EIII o EIV . Per esempio, per lo stato | IIIi si ha ! C2 µ0 B ⇡ (12.40) C3 III A
Quindi, per B grande, si ha C2 C3 per lo stato | IIIi: lo stato diventa allora quasi completamente lo stato | 2i = | + i. Analogamente, se si mette EIV nella (12.39), si ottiene ! C2 ⌧1 C3 IV e, per campi grandi, lo stato | IVi diventa proprio lo stato | 3i = | +i. Vedete che i coefficienti delle combinazioni lineari dei nostri stati di base che costituiscono gli stati stazionari dipendono da B. Lo stato che noi chiamiamo | IIIi è una sovrapposizione 50-50 di | + i e di | +i per campi molto deboli, ma si porta completamente verso | + i per campi forti. Analogamente, lo stato | IVi, che per campi deboli è anch’esso una sovrapposizione 50-50 (con segni opposti) di | + i e di | +i, finisce nello stato | +i quando gli spin sono disaccoppiati da un forte campo magnetico esterno.
189
190
Capitolo 12 • La struttura iperfine dell’idrogeno
© 978-8808-22107-0
Vorremmo anche richiamare la vostra attenzione su ciò che accade per campi magnetici molto deboli. C’è un livello energetico, posto a 3A, che non varia quando si introduce un piccolo campo magnetico. C’è poi un altro livello, situato in +A, che si scinde in tre differenti livelli di energia quando si accende un piccolo campo magnetico. Per campi deboli, le energie variano j m con B come si vede nella FIGURA 12.5. Supponiamo di avere in qualche I 1 +1 modo selezionato un gruppo di atomi di idrogeno tutti di energia 3A. Se III 1 0 +A li facciamo passare attraverso un dispositivo di Stern-Gerlach, con campi II 1 –1 non troppo forti, troviamo che essi lo attraversano semplicemente senza 0 deviare dalla linea retta. (Poiché la loro energia non dipende da B, per il B principio dei lavori virtuali, nessuna forza agisce su di essi, in presenza di un gradiente del campo magnetico.) Ma supponiamo, invece, di selezionare un gruppo di atomi con energia +A, e di inviarli dentro un apparecchio di Stern-Gerlach, diciamo un apparecchio S. (Ancora una volta, i campi dentro l’apparecchio non devono IV 0 0 –3A essere così grandi da scombinare l’interno dell’atomo, e con ciò intendiamo un campo abbastanza piccolo da far sì che le energie varino linearmente con B.) Troviamo tre fasci. Gli stati | Ii e | IIi subiscono forze opposte, in quanto le loro energie variano linearmente con B con le pendenze ±µ, FIGURA 12.5 Stati dell’atomo di idrogeno per campi magnetici deboli. di modo che le forze siano come quelle che agiscono su un dipolo con µz = ±µ, mentre lo stato | IIIi passa senza essere deflesso. Quindi, siamo ricondotti al capitolo 5. Un atomo di idrogeno con energia +A è una particella a spin uno. Questo stato di energia è una «particella» per la quale j = 1, e può essere rappresentata, rispetto a un certo sistema d’assi nello spazio, in funzione degli stati di base | +Si, | 0 Si e | Si che abbiamo usato nel capitolo 5. D’altra parte, un atomo di idrogeno con energia 3A è una particella di spin zero. (Ricordatevi che ciò che andiamo dicendo è vero rigorosamente solo per campi magnetici infinitesimi.) Possiamo perciò raggruppare gli stati dell’idrogeno in un campo magnetico nullo nel modo seguente: E
9 > > > > > > | + i + | +i > > = spin 1 | IIIi = p > > 2 > > > > > > | IIi = | i ; | + i | +i | IVi = spin 0 p 2 | Ii = | + +i
8 > | +Si > > > > > > > < | 0 Si > > > > > > > > | Si :
(12.41)
(12.42)
Abbiamo detto nel capitolo 35 del vol. 2 (vedi Appendice) che le componenti del momento angolare di una qualsiasi particella lungo un qualsiasi asse possono assumere solo certi valori sempre spaziati di ~. La componente z del momento angolare Jz può essere j~, ( j
1) ~, ( j
2) ~, . . . , ( j) ~
dove j è lo spin della particella (che può essere intero o semintero). Anche se abbiamo tralasciato a suo tempo di dirlo, si scrive generalmente Jz = m~
(12.43)
dove m sta per uno dei numeri j, j 1, j 2, ..., j. Vedrete, quindi, che nei libri i quattro stati fondamentali dell’atomo di idrogeno sono indicati mediante i cosiddetti numeri quantici j e m (spesso detti «numero quantico momento angolare totale» ( j) e «numero quantico magnetico» (m)). Quindi, invece dei nostri simboli per gli stati | Ii, | IIi e così via, si specifica un dato stato come | j, mi. Quindi, la nostra piccola tabella di stati per campi nulli nelle (12.41) e nelle (12.42) prende la forma che si legge nella TABELLA 12.3. Dal punto di vista fisico, non c’è niente di nuovo, è solo questione di notazione.
12.6 • La matrice di proiezione per lo spin uno
© 978-8808-22107-0
TABELLA
12.3
12.6
Stati dell’atomo di idrogeno in assenza di campo.
Stato | j, mi
j
m
Nostra notazione
| 1, +1i
1
+1
| Ii = | +Si
| 1, 0i
1
0
| IIIi = | 0 Si
| 1, 1i
1
| 0, 0i
0
1 0
| IIi = | Si | IVi
La matrice di proiezione per lo spin uno
Quelli che hanno deciso di saltare il capitolo 6 dovrebbero saltare anche questo paragrafo. Vogliamo ora usare la nostra conoscenza dell’atomo di idrogeno per fare qualche cosa di speciale. Abbiamo discusso nel capitolo 5 il fatto che una particella di spin uno che si trovi in uno degli stati di base (+, 0 o ) rispetto a un apparecchio di Stern-Gerlach con una data orientazione, diciamo un apparecchio S, ha una certa ampiezza di essere in ognuno dei tre stati relativi a un apparecchio T con una differente orientazione nello spazio. Ci sono nove di queste ampiezze h jT | iSi che costituiscono la matrice di proiezione. Nel paragrafo 5.7, abbiamo elencato senza dimostrazione gli elementi di questa matrice per varie orientazioni di T rispetto a S. Vi mostreremo ora un modo con cui questi possono essere ricavati. Nel caso dell’atomo di idrogeno abbiamo trovato un sistema di spin uno costituito da due particelle di spin un mezzo. Abbiamo già ricavato, nel capitolo 6, come si trasformano le ampiezze di uno spin un mezzo. Possiamo ora sfruttare questa informazione per calcolare la trasformazione dello spin uno. Si fa così: abbiamo un sistema, un atomo di idrogeno con energia +A, che ha spin uno. Supponiamo di farlo passare attraverso un filtro di Stern-Gerlach S, in modo da sapere che esso si trova in uno degli stati di base rispetto a S, per esempio | +Si. Con quale ampiezza esso si troverà anche in uno degli stati di base relativi a un apparecchio T, per esempio | +Ti? Se x, y, z è il sistema di coordinate dell’apparecchio S, lo stato | +Si è quello che abbiamo chiamato | + +i. Ma supponiamo che un altro tizio assuma come asse z quello nella direzione di T. Egli riferirà i suoi stati a quello che chiameremo sistema x 0, y 0, z 0. I suoi stati «su» e «giù» per l’elettrone e il protone saranno differenti dai nostri. Il suo stato «più-più», che scriveremo | +0 +0i riferendoci al sistema «con gli apici», è lo stato | +Ti della particella di spin uno. Quello che cerchiamo è h+T | +Si che è solo una maniera diversa di scrivere l’ampiezza h+0 +0 | + +i. Possiamo trovare l’ampiezza h+0 +0 | + +i come segue. Nel nostro riferimento, l’elettrone nello stato | + +i ha lo spin «su». Questo significa che ha un’ampiezza h+0 | +ie di essere «su» nel suo sistema, e un’ampiezza h 0 | +ie di essere «giù» in quel sistema. Analogamente, il protone nello stato | + +i ha lo spin «su» nel nostro riferimento, e le ampiezze h+0 | +ip e h 0 | +ip di avere lo spin «su» o «giù» nel sistema «con gli apici». Poiché si tratta di due particelle distinte, l’ampiezza che ambedue siano insieme «su», nel suo riferimento, è il prodotto delle due ampiezze h+0 +0 | + +i = h+0 | +ie h+0 | +ip
(12.44)
Abbiamo messo gli indici e e p in basso nelle ampiezze h+0 | +i per rendere chiaro quello che stiamo facendo. Ma tutte e due queste ampiezze non sono altro che le ampiezze di trasformazione per una particella di spin un mezzo, e quindi, in realtà, sono due numeri identici. Sono, infatti, proprio le ampiezze che abbiamo chiamato h+T | +Si nel capitolo 6, e che abbiamo elencato nelle tabelle alla fine di quel capitolo. Ma ora stiamo per incappare in un guaio con la notazione. Dobbiamo poter distinguere tra l’ampiezza h+T | +Si per una particella a spin un mezzo e l’altra, che pure abbiamo indicato con h+T | +Si, per una particella a spin uno; sono completamente differenti! Speriamo che non si
191
192
Capitolo 12 • La struttura iperfine dell’idrogeno
TABELLA
12.4
Ampiezze per lo spin un mezzo.
Questo capitolo
Capitolo 6
a = h+0 | +i
h+T | +Si
b=h
0
| +i
h T | +Si
c = h+0 | i
h+T | Si
d=h
0
| i
h T | Si
© 978-8808-22107-0
faccia troppa confusione, ma, almeno per il momento, dovremo usare qualche simbolo diverso per le ampiezze relative allo spin un mezzo. Per aiutarvi a seguire bene i vari ragionamenti, vi riassumiamo la nuova notazione nella TABELLA 12.4. Continueremo a usare la notazione | +Si, | 0 Si e | Si per gli stati di una particella di spin uno. Con la nostra nuova notazione, l’equazione (12.44) diviene semplicemente h+0 +0 | + +i = a2
e questa è proprio l’ampiezza h+T | +Si per lo spin uno. Supponiamo ora, per esempio, che il sistema di coordinate dell’altro tizio, cioè l’apparecchio T, quello «con gli apici», sia ruotato rispetto al nostro asse z di un angolo ; allora, dalla TABELLA 6.2, si ha a = h+0 | +i = ei /2 Quindi, dalla (12.44), otteniamo che l’ampiezza per lo spin uno è h+T | +Si = h+0 +0 | + +i = (ei
/2 2
) = ei
(12.45)
Vedete quindi come vanno le cose. Passeremo ora a trattare il caso generale per tutti gli stati. Se il protone e l’elettrone sono tutti e due «su» nel nostro sistema, quello S, le ampiezze perché si trovi in ognuno dei quattro possibili stati sono, nel riferimento di quell’altro, il sistema T, h+0 +0 | + +i = h+0 | +ie h+0 | +ip = a2 h+0 h
0
h
0
0
| + +i = h+0 | +ie h
+0 | + +i = h 0
| + +i = h
0
| +ip = ab
0
| +ie h+0 | +ip = ba
0
| +ie h
0
(12.46)
| +ip = b2
Possiamo, allora, scrivere lo stato | + +i come la seguente combinazione lineare: ( ) | + +i = a2 | +0 +0i + ab | +0 0i + | 0 +0i + b2 | 0 0i
(12.47)
p Si noti ora che | +0 +0i è lo stato | +Ti, che | +0 0i + | 0 +0i altro non è che 2 per lo stato | 0 Ti, vedi la (12.41), e che | 0 0i = | Ti. In altri termini, l’equazione (12.47) può essere riscritta nella forma p | +Si = a2 | +Ti + 2 ab | 0 Ti + b2 | Ti (12.48) In maniera analoga, si può facilmente dimostrare che p | Si = c2 | +Ti + 2 cd | 0 Ti + d 2 | Ti
(12.49)
Il caso di | 0 Si è un po’ più complicato, poiché
) 1 ( | 0 Si = p | + i + | +i 2
Ma possiamo esprimere ciascuno degli stati | + i e | +i come sovrapposizione degli stati «con gli apici» e sommarli. Ovvero, | + i = ac | +0 +0i + ad | +0
0
i + bc |
0
+0i + bd |
0
0
i
(12.50)
| +i = ac | +0 +0i + bc | +0 p Moltiplicando la somma per 1/ 2, si ottiene
0
i + ad |
0
+0i + bd |
0
0
i
(12.51)
e
2 ad + bc ( 0 | 0 Si = p ac | +0 +0i + p |+ 2 2
0
i+|
0
) 2 +0i + p bd | 2
0
0
i
12.6 • La matrice di proiezione per lo spin uno
© 978-8808-22107-0
Ne segue che
p p | 0 Si = 2 ac | +Ti + (ad + bc) | 0 Ti + 2 bd | Ti
(12.52)
Abbiamo adesso tutte le ampiezze che volevamo. I coefficienti delle equazioni (12.48), (12.49) e (12.52) sono gli elementi di matrice h jT | iSi. Mettiamoli tutti insieme: iS! jT # a2
*. p h jT | iSi = ... 2 ab . 2 , b
p
2 ac
ad + bc p 2 bd
c2 + // p 2 cd // / d2 -
(12.53)
Abbiamo così espresso le trasformazioni per lo spin uno mediante le ampiezze a, b, c e d relative allo spin un mezzo. Per esempio, se il riferimento T è ruotato rispetto a S di un angolo intorno all’asse y, come in FIGURA 5.6, le ampiezze nella TABELLA 12.4 non sono altro che gli elementi di matrice di Ry (↵) della TABELLA 6.2. ↵ a = cos 2 ↵ b = sen 2 (12.54) ↵ c = sen 2 ↵ d = cos 2 Usando queste relazioni nella (12.53), otteniamo le formule della (5.38), che allora avevamo dato senza dimostrazione. Cosa mai ne è stato dello stato | IV i?! Ebbene, poiché si tratta di un sistema a spin zero, esso ha un solo stato, ed è lo stesso in tutti i sistemi di coordinate. Possiamo controllare che tutto torni facendo la differenza fra l’equazione (12.50) e l’equazione (12.51); si ottiene ( ) | + i | +i = (ad bc) | +0 0i | 0 +0i
Ma (ad bc) è il determinante della matrice relativa allo spin un mezzo, ed è quindi uguale a 1. Si ha che | IV 0i = | IVi per ogni orientazione relativa dei due sistemi di coordinate.
193
13
Propagazione in un reticolo cristallino
13.1
Stati di un elettrone in un reticolo unidimensionale
A prima vista, si potrebbe pensare che un elettrone di bassa energia abbia grandi difficoltà ad attraversare un solido cristallino. Gli atomi sono strettamente uniti tra loro, i loro centri sono distanziati solo di pochi angstrom e il diametro effettivo di un atomo per quanto riguarda la diffusione degli elettroni è un angstrom o giù di lì. Gli atomi, cioè, sono grandi rispetto alla distanza che li separa, cosicché ci si aspetta che il cammino libero medio tra due urti sia dell’ordine di pochi angstrom, cioè praticamente nullo. Ci si aspetta che un elettrone urti contro un atomo o un altro quasi immediatamente. Invece è un fenomeno comunissimo in natura il fatto che, se il reticolo è perfetto, gli elettroni riescono a viaggiare attraverso il cristallo, dolcemente e facilmente, quasi come se fossero nel vuoto. È questa strana circostanza che fa sì che i metalli conducano l’elettricità così facilmente, ed è anche ciò che ha permesso lo sviluppo di tante applicazioni pratiche. È questo, per esempio, che rende possibile che i transistor possano sostituire le valvole della radio. In una valvola gli elettroni si muovono liberamente nel vuoto, mentre nei transistor si muovono liberamente in un reticolo cristallino. Il meccanismo che si nasconde dietro il comportamento di un transistor sarà descritto in questo capitolo; nel prossimo descriveremo le applicazioni di questi principi a vari dispositivi pratici. La conduzione degli elettroni in un cristallo è un esempio di un fenomeno assai comune. Non sono solo gli elettroni che possono attraversare i cristalli, ma possono farlo, in modo simile, anche altre «cose», come le eccitazioni atomiche. Cosicché, il fenomeno che ci apprestiamo a discutere si presenta sotto varie forme nello studio della fisica dello stato solido. Come ricorderete, abbiamo discusso molti esempi di sistemi a due stati. Consideriamo ora un elettrone che possa trovarsi in una di due possibili posizioni, in ciascuna delle quali la situazione circostante è dello stesso tipo. Supponiamo anche che ci sia una certa ampiezza corrispondente alla transizione da una posizione all’altra e, naturalmente, la stessa ampiezza per la transizione inversa, proprio come nel caso già discusso dello ione di idrogeno molecolare (paragrafo 10.1). Le leggi della meccanica quantistica ci danno allora i seguenti risultati. Vi sono due possibili stati di energia definita per l’elettrone. Ogni stato può essere descritto per mezzo della corrispondente ampiezza di probabilità di trovare l’elettrone in ognuna delle due posizioni base. In ciascuno degli stati a energia definita, i moduli di tali ampiezze sono costanti nel tempo e le fasi variano nel tempo con la stessa frequenza. D’altra parte, se all’inizio l’elettrone si trovava in una delle due posizioni, in seguito si sposterà sull’altra per poi ripassare sulla prima. L’ampiezza si comporta in modo analogo al movimento di due pendoli accoppiati. Consideriamo ora un reticolo cristallino perfetto e immaginiamo che un elettrone sia situato in una specie di «buca» in corrispondenza di un particolare atomo con una particolare energia. Supponiamo anche che all’elettrone competa una certa ampiezza di probabilità di trasferirsi in un’altra buca nelle vicinanze di uno degli atomi contigui. La cosa assomiglia a un sistema a due stati, ma con una complicazione in più. Quando l’elettrone arriva all’atomo vicino, può andare avanti in un’altra posizione ancora, ma può anche ritornare al suo punto di partenza. La nostra situazione ora non è analoga a quella di due pendoli accoppiati, ma a quella di un numero infinito di pendoli, tutti accoppiati tra loro. La cosa è simile a quel che si osserva in uno di quei congegni
© 978-8808-22107-0
13.1 • Stati di un elettrone in un reticolo unidimensionale
195
fatti di una lunga serie di sbarre montate su di un filo di torsione, che vengono usati nelle lezioni di fisica del primo anno per dimostrare la propagazione ondosa. Se si ha un oscillatore armonico accoppiato a un altro oscillatore armonico, e questo a un altro ancora, e così via..., e se si produce un’alterazione da qualche parte, questa si propagherà come un’onda lungo tutta la catena. La stessa situazione si presenta quando si attacca un elettrone a un atomo facente parte di una lunga catena di atomi. Di solito, la maniera più semplice di analizzare questo problema non è quella di vedere cosa succede se si dà un colpo in un certo punto, ma piuttosto quella di cercare delle soluzioni in forma di onde stazionarie. Esistono certe configurazioni di spostamenti che si propagano attraverso il cristallo come un’onda di un’unica, ben definita frequenza. Esattamente la stessa cosa avviene con l’elettrone, proprio per la stessa ragione, cioè perché è descritto in meccanica quantistica da equazioni simili. Dovete tener ben presente una cosa, tuttavia; l’ampiezza di probabilità per un elettrone di trovarsi in un certo posto è un’ampiezza, non una probabilità. Se l’elettrone stesse semplicemente trasferendosi da un posto a un altro, come fa l’acqua che scorre attraverso un foro, il suo comportamento sarebbe completamente differente. Se, per esempio, avessimo due recipienti con dell’acqua, connessi da un tubo che ne permettesse il passaggio dall’uno all’altro, i livelli tenderebbero esponenzialmente a divenire uguali. Ma per l’elettrone quel che succede è un travaso di ampiezza e non un semplice passaggio di probabilità. E la caratteristica del termine immaginario, la i delle equazioni differenziali della meccanica quantistica, cambia la soluzione esponenziale in una soluzione oscillatoria. Perciò, quel che succede è completamente differente dal travaso tra due recipienti comunicanti. Passiamo ora a esaminare quantitativamente la situazione quantistica. Immaginiamo un sistema unidimensionale composto da una lunga linea di atomi, come mostrato nella FIGURA 13.1a. (Naturalmente, un cristallo è tridimensionale, ma la fisica è essenzialmente la stessa; una volta capito il cab so unidimensionale, riuscirete a capire anche quel che Atomo succede in tre dimensioni.) Cerchiamo ora di vedere (a) cosa succede se poniamo un unico elettrone su questa ... n–3 n–2 n–1 n n+1 n+2 n+3 ... fila di atomi. In un cristallo reale, naturalmente, ci sono già milioni di elettroni. Ma la maggior parte di essi Elettrone (quasi tutti per un cristallo di un materiale isolante) si è fissata in una certa configurazione di moto intorno (b) al proprio atomo e la situazione è completamente sta�n – 1� zionaria. Supponiamo, tuttavia, di voler pensare a quel che succede se aggiungiamo un elettrone in più. Non ci occuperemo di quello che stanno facendo gli altri, (c) perché supporremo che il cambiamento del loro moto �n� richieda una certa energia di eccitazione. Aggiungeremo un elettrone come se volessimo produrre uno ione negativo debolmente legato. Nel considerare esclusi(d) vamente quel che fa il solo elettrone in più, facciamo �n + 1� un’approssimazione che trascura la meccanica interna degli atomi. Naturalmente l’elettrone si può muovere da un ato- FIGURA 13.1 Gli stati di base di un elettrone in un cristallo unidimensionale. mo a un altro, spostando così lo ione negativo da un posto all’altro. Proprio come nel caso di un elettrone che possa saltare tra due protoni, supporremo che l’elettrone possa saltare da un atomo a quello vicino, nei due sensi, con una certa ampiezza. Come fare a descrivere un tale sistema? Quali potrebbero essere degli stati di base ragionevoli? Se ricordate quel che abbiamo fatto quando avevamo a disposizione due sole possibili ampiezze, potete immaginare quel che faremo ora. Supponete che nella nostra catena, le distanze tra gli atomi siano tutte uguali, e che essi siano numerati come mostrato nella FIGURA 13.1a. Uno degli stati di base corrisponde ad avere l’elettrone presso l’atomo numero 6, un altro stato di base corrisponde ad avere l’elettrone presso l’atomo numero 7, o presso il numero 8, e così via. Possiamo descrivere l’n-esimo stato di base dicendo che l’elettrone si trova presso l’atomo numero n. Questo stato lo
196
Capitolo 13 • Propagazione in un reticolo cristallino
© 978-8808-22107-0
indicheremo con | ni. La FIGURA 13.1 mostra ciò che s’intende con i tre stati di base: 1i
|n
| n + 1i
| ni
Usando questi stati di base, ogni stato | i dell’elettrone nel nostro cristallo unidimensionale può essere descritto mediante tutte le ampiezze di probabilità hn | i che lo stato | i ha di trovarsi in uno degli stati di base, cioè di essere situato presso un particolare atomo. Potremo allora scrivere lo stato | i come una sovrapposizione di stati di base X | i= | ni hn | i (13.1) n
Supponiamo ora che, quando un elettrone si trova presso un atomo, si abbia una certa ampiezza di sfuggire verso un altro atomo in una direzione o nell’altra. Ci limiteremo al caso più semplice, cioè che possa passare solo all’atomo più vicino; per andare da quello successivo deve fare due passi. L’ampiezza di probabilità (per unità di tempo) di saltare da un atomo al prossimo sia i A/~. Per il momento scriveremo l’ampiezza hn | i corrispondente alla posizione dell’elettrone presso l’atomo n-esimo come Cn . L’equazione (13.1) si scriverà allora X | i= | ni Cn (13.2) n
Se, a un dato istante, conoscessimo tutte le ampiezze Cn , ne potremmo fare i moduli quadrati e ottenere così le probabilità di trovare l’elettrone presso l’atomo n in quel momento. Quale sarebbe la situazione in un tempo successivo? In analogia ai sistemi a due stati che abbiamo studiato, possiamo proporre che le equazioni hamiltoniane per questo sistema siano costituite da equazioni del tipo: i~
dCn (t) = E0 Cn (t) dt
ACn+1 (t)
ACn 1 (t)
(13.3)
Il primo coefficiente a secondo membro, E0 , è, fisicamente, l’energia che l’elettrone avrebbe se fosse legato a un atomo senza poterlo abbandonare. (Non ha importanza quel che chiamiamo E0 ; come abbiamo già visto molte volte, esso non rappresenta nient’altro che una scelta dello zero nella scala delle energie.) Il termine successivo rappresenta l’ampiezza per unità di tempo che compete al trasferimento dell’elettrone nell’n-esima buca a partire dall’(n + 1)-esima; e l’ultimo termine è l’ampiezza relativa al trasferimento dall’(n 1)-esima. Come sempre, supporremo che A sia una costante (indipendente da t). Per avere una descrizione completa di tutti gli stati | i, bisognerebbe avere un’equazione come la (13.3) per ciascuna delle ampiezze Cn . Siccome poi vogliamo considerare un cristallo con un grandissimo numero di atomi, supporremo che ci sia un numero di stati indefinitamente grande, cioè che la fila di atomi si estenda all’infinito in entrambe le direzioni. (Per trattare il caso finito, si dovrà stare particolarmente attenti a ciò che succede alle estremità.) Se il numero N dei nostri stati di base è indefinitamente grande, anche le equazioni hamiltoniane complete sono in numero infinito! Ne possiamo scrivere soltanto un campione: .. . dCn i~ dt i~ i~
dCn dt
.. . 1
= E0 Cn
1
= E0 Cn
dCn+1 = E0 Cn+1 dt .. .
ACn ACn
2
ACn,
1
ACn+1
ACn
ACn+2
.. .
(13.4)
13.2 • Stati di energia definita
© 978-8808-22107-0
13.2
Stati di energia definita
Si potrebbero studiare molte cose sugli elettroni nei reticoli, ma cominciamo col trovare gli stati di energia definita. Come si è visto in capitoli precedenti, ciò significa che dobbiamo trovare delle situazioni in cui le ampiezze, quando cambiano in qualche modo nel tempo, cambiano tutte con la stessa frequenza. Cerchiamo cioè soluzioni della forma Cn = an e
iEt/~
(13.5)
Il numero complesso an ci descrive la parte indipendente dal tempo dell’ampiezza corrispondente a trovare l’elettrone presso l’atomo n-esimo. Inserendo questa soluzione di prova nelle equazioni (13.4) per saggiarle un po’, si ottiene il risultato Ean = E0 an
Aan+1
Aan
(13.6)
1
Veniamo così ad avere un numero infinito di tali equazioni per le infinite incognite an , una cosa da far cadere le braccia. Tutto quel che c’è da fare è di prendere il determinante... ma, un momento! I determinanti vanno bene quando ci sono 2, 3 o 4 equazioni. Ma se ce n’è un numero grandissimo – o un numero infinito – i determinanti non sono molto convenienti. È meglio cercare di risolvere direttamente le equazioni. Prima di tutto, cominciamo con l’individuare gli atomi con le loro posizioni; diremo che l’atomo n-esimo si trova in x n e che l’atomo (n + 1)-esimo è in x n+1 . Se la distanza fra gli atomi è b – come in FIGURA 13.1 – avremo x n+1 = x n + b Scegliendo l’origine coincidente con l’atomo zero, potremo anche dire che x n = nb Possiamo riscrivere l’equazione (13.5) nella forma Cn = a(x n ) e
iEt/~
(13.7)
e l’equazione (13.6) diviene Ea(x n ) = E0 a(x n )
Aa(x n+1 )
Aa(x n 1 )
(13.8)
O anche, usando il fatto che x n+1 = x n + b, potremmo scrivere Ea(x n ) = E0 a(x n )
Aa(x n + b)
Aa(x n
b)
(13.9)
Questa equazione è in qualche modo simile a un’equazione differenziale. Ci dice che la quantità a(x), in un certo punto x n , è connessa alla stessa quantità fisica in punti vicini, x n ± b. (Un’equazione differenziale collega i valore di una funzione in un punto ai valori nei punti infinitamente vicini.) Potrebbe darsi che i metodi che normalmente si usano per risolvere le equazioni differenziali funzionino anche qui; proviamo. Le equazioni differenziali lineari a coefficienti costanti possono essere sempre risolte in termini di funzioni esponenziali. Cerchiamo di fare altrettanto qui; prendiamo come funzione di prova a(x n ) = eik xn (13.10) Allora, l’equazione (13.9) diventa Eeik xn = E0 eik xn
Aeik(xn +b)
Aeik(xn
b)
(13.11)
Dividendo per il fattore comune eik xn , otteniamo E = E0
Aeikb
Ae
ikb
(13.12)
197
198
13.2 Variazione della parte reale di Cn in funzione di x n .
Capitolo 13 • Propagazione in un reticolo cristallino
© 978-8808-22107-0
FIGURA
Re Cn
xn x
Gli ultimi due termini sono proprio 2A cos kb, quindi E = E0
2A cos kb
(13.13)
Abbiamo così trovato che per qualsiasi scelta arbitraria della costante k, c’è una soluzione la cui energia è data da questa equazione. Ci sono varie possibili energie a seconda di k, e a ciascun k corrisponde una differente soluzione. Vi è un numero infinito di soluzioni, ciò non è sorprendente visto che siamo partiti da un numero infinito di stati di base. Vediamo ora cosa significano queste soluzioni. Per ogni k, le a sono date dall’equazione (13.10). Le ampiezze Cn sono allora Cn = eik xn e
(i/~)Et
(13.14)
dove bisogna ricordare che anche l’energia E dipende da k, come si vede dall’equazione (13.13). La dipendenza spaziale delle ampiezze è eik xn . Le ampiezze oscillano passando da un atomo al successivo. Con questo intendiamo dire che l’ampiezza compie un’oscillazione complessa; il modulo è lo stesso in ciascun atomo, ma la fase a un certo istante aumenta di ikb da un atomo al seguente. Possiamo visualizzare quel che succede disegnando una linea verticale per indicare la parte reale in corrispondenza a ciascun atomo come abbiamo fatto in FIGURA 13.2. L’inviluppo di queste linee verticali (mostrato dalla linea tratteggiata) è, naturalmente, una curva tipo coseno. Anche la parte immaginaria di Cn è una funzione oscillante, ma spostata in fase di 90°, di modo che il modulo quadrato (che è la somma dei quadrati delle parti reale e immaginaria) è lo stesso per tutti i C. Perciò, se scegliamo un certo k, otteniamo uno stato stazionario con una certa energia E. E per ciascuno di questi stati, la probabilità di trovare l’elettrone presso ogni atomo è la stessa per tutti gli atomi, cioè non vi sono atomi privilegiati rispetto ad altri. Solo la fase è diversa da un atomo all’altro. Inoltre, al passare del tempo, la fase varia. Dall’equazione (13.14), le parti reale e immaginaria si propagano lungo il cristallo come onde, precisamente come le parti reale e immaginaria di ei[k xn (E/~)t] (13.15) L’onda può muoversi nella direzione positiva o negativa di x, a seconda del segno che si sceglie per k. Notate che si è supposto che il numero k che abbiamo inserito nella nostra soluzione di prova, equazione (13.10), fosse un numero reale. Possiamo ora vedere perché deve essere tale nel caso che si abbia una fila indefinita di atomi. Supponete infatti che k sia un numero immaginario, per 0 esempio ik 0. Le ampiezze an allora si comporterebbero come ek xn , cioè l’ampiezza diverrebbe sempre più grande via via che x cresce, oppure che x diventa sempre più negativo se k 0 è un numero negativo. Questo tipo di soluzione non avrebbe difetti se avessimo a che fare con una fila di atomi limitata, ma non può essere fisicamente accettabile per una catena infinita di atomi. Infatti, essa darebbe luogo ad ampiezze infinite, e quindi a probabilità infinite, che non possono rappresentare una situazione reale. Incontreremo più avanti un esempio in cui ha senso considerare anche k immaginari. La relazione tra l’energia E e il numero d’onde k espressa dall’equazione (13.13) è riportata in FIGURA 13.3. Come si vede dalla figura, l’energia può variare da E0 2A per k = 0 a E0 + 2A per k = ±⇡/b. Il grafico è disegnato per valori positivi di A; se A fosse negativo, la curva risulterebbe semplicemente invertita, ma l’intervallo di variazione dell’energia sarebbe lo stesso. Il risultato
199
13.2 • Stati di energia definita
© 978-8808-22107-0
più importante di quanto precede è che sono permesse tutte le energie all’interno di un certo intervallo o «banda», ma non altre. In accordo con le nostre ipotesi, se un elettrone in un cristallo si trova in uno stato stazionario, non può avere un’energia diversa da quelle comprese in questa banda. Secondo l’equazione (13.13), ai più piccoli valori di k corrispondono stati di bassa energia, E ⇡ E0 2A. All’aumentare in modulo di k (per valori sia positivi sia negativi), l’energia dapprima aumenta, poi raggiunge un massimo per k = ±⇡/b, come mostrato in FIGURA 13.3. Per valori di k maggiori di ⇡/b, l’energia comincia a ridiscendere. Tuttavia, non c’è bisogno di prendere in considerazione questi valori di k, poiché non danno luogo a nuovi stati, ma ripetono semplicemente quelli che si erano già ottenuti per valori minori di k. Possiamo rendercene conto nel modo seguente. Consideriamo lo stato di energia minima per il quale k = 0. Il coefficiente a(x n ) è lo stesso per tutti gli x n . Perciò si avrebbe la stessa energia per k = 2⇡/b. Ma allora, usando l’equazione (13.10), abbiamo che
E E0 + 2A
E0
E0 – 2A k –π/b
0
π/b
13.3 L’energia degli stati stazionari in funzione del parametro k. FIGURA
a(x n ) = ei(2⇡/b)xn Prendendo ora l’origine coincidente con x 0 , possiamo porre x n = nb; allora a(x n ) diviene a(x n ) = ei2⇡n = 1 Lo stato descritto da queste a(x n ) è fisicamente lo stesso stato che avevamo ottenuto per k = 0. Non rappresenta una soluzione diversa. Per fare un altro esempio, supponete che k sia ⇡/4b. La parte reale di a(x n ) varierebbe come mostrato dalla curva 1 di FIGURA 13.4. Se k fosse sette volte maggiore, k = 7⇡/4, la parte reale di a(x n ) varierebbe come mostrato dalla curva 2 della figura. (Le curve complete, tipo coseno, non hanno naturalmente alcun significato; tutto quel che conta sono i loro valori nei punti x n . Le curve servono solo ad aiutarvi a capire come vanno le cose.) Come vedete, si ottengono le stesse ampiezze per tutti gli x n con entrambi i valori di k. Il risultato finale è che si possono avere tutte le possibili soluzioni, variando k soltanto all’interno di un intervallo limitato. Noi sceglieremo l’intervallo tra ⇡/b e +⇡/b, cioè quello mostrato in FIGURA 13.3. In questo intervallo l’energia degli stati stazionari aumenta uniformemente all’aumentare del modulo di k. Ancora un’osservazione marginale su un problema con cui potete divertirvi per conto vostro. Immaginate che l’elettrone possa non solo saltare sull’atomo più vicino con un’ampiezza i A/~, ma abbia anche la possibilità di passare con un unico balzo a quello che viene subito dopo con una certa altra ampiezza iB/~. Troverete che la soluzione può nuovamente essere scritta nella forma an = eik xn cioè che questo tipo di soluzione è universale. Troverete anche che gli stati stazionari con numero d’onda k hanno un’energia uguale a E0
Re a(xn)
2A cos kb
2B cos 2kb
2
1
13.4 Due valori di k che rappresentano la stessa situazione fisica; la curva 1 è tracciata per k = π/4b, la curva 2 per k = 7π/4b. FIGURA
x
200
Capitolo 13 • Propagazione in un reticolo cristallino
© 978-8808-22107-0
Questo dimostra che la forma di E in funzione di k non è universale, ma dipende dalle particolari ipotesi che si fanno sul problema. Non è sempre un’onda tipo coseno, non è neppure necessariamente simmetrica rispetto a una qualche linea orizzontale. Quel che comunque resta vero è che la curva si ripete sempre al di fuori dell’intervallo da ⇡/b a ⇡/b, cosicché non ci si deve mai preoccupare di differenti valori di k. Vediamo un po’ più da vicino cosa succede per piccoli k, cioè quando le variazioni dell’ampiezza da un certo x n al vicino sono assai lente. Supponiamo di scegliere lo zero dell’energia definendo E0 = 2A; allora il minimo della curva di FIGURA 13.3 corrisponde all’energia zero. Per k sufficientemente piccolo, si può scrivere che cos kb ⇡ 1
k 2 b2 2
e l’energia dell’equazione (13.13) diviene E = Ak 2 b2
(13.16)
Si trova quindi che l’energia dello stato è proporzionale al quadrato del numero d’onda che descrive le variazioni spaziali delle ampiezze Cn .
13.3
Stati che dipendono dal tempo
In questo paragrafo discuteremo in maggior dettaglio il comportamento degli stati in un reticolo unidimensionale. Se l’ampiezza di trovare un elettrone in x n è Cn , la rispettiva probabilità è |Cn | 2 . Per gli stati stazionari descritti dall’equazione (13.14), tale probabilità è la stessa per tutti gli x n e non cambia al passare del tempo. Come si può fare a rappresentare una situazione che può essere approssimativamente descritta dicendo che un elettrone di una certa energia è localizzato in una certa regione, cosicché è più probabile trovarlo in certi posti che non in altri? Possiamo riuscirci facendo una sovrapposizione di diverse soluzioni del tipo dell’equazione (13.14) con valori leggermente differenti di k, corrispondenti cioè a energie leggermente differenti. Così, almeno per t = 0, le ampiezze varieranno con la posizione a causa dell’interferenza fra i vari termini, proprio come quando si ottengono dei battimenti mescolando onde di differente lunghezza d’onda (come è stato discusso nel cap. 48 del vol. 1). Possiamo così costruire un «pacchetto d’onde» con un numero d’onda predominante k0 , ma anche con vari altri numeri d’onda vicini a k0 (1) . Nella nostra sovrapposizione di stati stazionari, le ampiezze con k differenti rappresenteranno stati d’energia leggermente differenti e avranno perciò frequenze leggermente diverse; anche la figura d’interferenza di Cn totale varierà col tempo; si avranno cioè dei «battimenti». Come abbiamo visto nel cap. 48 del vol. 1, i picchi dei battimenti (cioè i posti dove |C(x n )| 2 è grande) si muovono lungo x al passare del tempo; si muovono con la velocità che abbiamo chiamato «velocità di gruppo». Avevamo trovato che questa velocità di gruppo era legata alla variazione di k con la frequenza da d! vgruppo = (13.17) dk La stessa dimostrazione si applica ugualmente bene anche in questo caso. Uno stato di elettrone che sia un «pacchetto», cioè uno stato i cui Cn varino spazialmente come il pacchetto d’onde di FIGURA 13.5, si muoverà, nel nostro «cristallo» unidimensionale, con velocità v uguale a d!/dk, dove ! = E/~. Facendo uso dell’equazione (13.16) per E, si ottiene che v=
2Ab2 k ~
(13.18)
In altre parole, gli elettroni si muovono con una velocità proporzionale al valore caratteristico di k. L’equazione (13.16) ci dice che l’energia di un tale elettrone è proporzionale al quadrato della (1)
Purché non si cerchi di fare il pacchetto troppo stretto.
sua velocità, cioè l’elettrone si comporta come una particella classica. Fino a quando andiamo a considerare quel che succede su una scala abbastanza grossolana da non vedere la struttura fine, la nostra descrizione quantistica produce risultati simili alla fisica classica. Infatti, risolvendo l’equazione (13.18) per k, e sostituendo nella (13.16), si può scrivere E=
1 meff v 2 2
meff =
Re C(xn)
v
x
(13.19)
dove meff è una costante. L’«energia di moto» in più che un elettrone possiede in un pacchetto dipende dalla velocità, proprio come nel caso di una particella classica. La costante meff , detta «massa efficace», è data da ~2 2Ab2
(13.20)
13.5 La parte reale di C(x n ) in funzione di x per una sovrapposizione di parecchi stati con energie vicine. (La spaziatura b è molto piccola rispetto alla scala scelta per x.) FIGURA
Notate anche che si può scrivere meff v = ~k
(13.21)
Se decidiamo di chiamare «impulso» il prodotto meff v, questo è legato al numero d’onda k nel modo precedentemente descritto per una particella libera. Non dimenticate che meff non ha nulla a che fare con la reale massa dell’elettrone. Può essere completamente differente, anche se nei cristalli reali succede spesso che risulti essere praticamente dello stesso ordine di grandezza, da 2 a 20 volte la massa dell’elettrone nello spazio vuoto. Abbiamo così spiegato un notevole mistero, cioè come un elettrone in un cristallo (per esempio, un elettrone in più messo in un cristallo di germanio) possa andarsene tranquillamente attraverso il cristallo e fluire del tutto liberamente anche se deve urtare contro tutti gli atomi. Si comporta così perché tutte le sue ampiezze se ne vanno ta-ta-ta da un atomo all’altro, aprendogli in tal modo la strada attraverso il cristallo. È questo il modo con cui i solidi conducono l’elettricità.
13.4
201
13.4 • L’elettrone in un reticolo tridimensionale
© 978-8808-22107-0
L’elettrone in un reticolo tridimensionale
Consideriamo un momento come le stesse idee possano essere applicate per vedere ciò che accade a un elettrone nello spazio a tre dimensioni. I risultati sono assai simili. Supponiamo d’avere un reticolo rettangolare di atomi con spaziature di a, b e c nelle tre direzioni. (Se volete avere un reticolo cubico, prendete uguali le tre spaziature.) Supponiamo anche che l’ampiezza per un salto sull’atomo vicino nella direzione x sia i Ax /~, quella nella direzione y sia i Ay /~ e quella nella direzione z sia i Az /~. Come descriveremo ora gli stati di base? Come nel caso unidimensionale, un possibile stato di base è quello in cui un elettrone si trova presso un atomo situato in x, y, z, dove (x, y, z) è uno dei punti del reticolo. Scegliendo l’origine presso uno degli atomi, questi punti sono tutti a x = nx a y = ny b z = nz c dove n x , ny e nz sono tre interi qualsiasi. Invece di usare gli indici per indicare tali punti, seguiteremo a usare x, y e z, sottintendendo che queste variabili assumono solo i loro valori corrispondenti ai punti del reticolo. Perciò lo stato di base è rappresentato dal simbolo | elettrone in x, y, zi e l’ampiezza di probabilità per un elettrone in un certo stato | i di trovarsi in questo stato di base è C(x, y, z) = helettrone in x, y, z | i
202
Capitolo 13 • Propagazione in un reticolo cristallino
© 978-8808-22107-0
Come prima, le ampiezze C(x, y, z) possono variare col tempo. Nelle nostre ipotesi, le equazioni hamiltoniane sono le seguenti: i~
dC(x, y, z) = E0 C(x, y, z) dt
Ax C(x + a, y, z)
Ax C(x
a, y, z) +
Ay C(x, y + b, z)
Ay C(x, y
Az C(x, y, z + c)
Az C(x, y, z
b, z) +
(13.22)
c)
Si presentano piuttosto lunghe, ma si può vedere facilmente da dove proviene ciascun termine. Cerchiamo ancora una volta di trovare uno stato stazionario in cui tutte le C varino col tempo allo stesso modo. Ancora una volta la soluzione è di tipo esponenziale: C(x, y, z) = e
iEt/~ i(k x x+k y y+k z z)
e
(13.23)
Sostituendo questa espressione nella (13.22) si vede che può andare bene, purché l’energia E sia legata a k x , k y e k z nel modo seguente: E = E0
2Ax cos k x a
2Ay cos k y b
2Az cos k z c
(13.24)
L’energia dipende ora da tre numeri d’onda k x , k y , k z , che, incidentalmente, sono le componenti del vettore tridimensionale k. Infatti si può scrivere l’equazione (13.23) in notazione vettoriale nella forma C(x, y, z) = e
iEt/~ ik · r
e
(13.25)
L’ampiezza varia come un’onda piana complessa in tre dimensioni, che si muove nella direzione di k, con il numero d’onda q k = k x2 + k y2 + k z2
L’energia associata a questi stati stazionari dipende dalle tre componenti di k nella maniera complicata data dall’equazione (13.24). La natura della variazione di E con k dipende dai segni relativi e dai moduli di Ax , Ay e Az . Se tutti e tre questi numeri sono positivi, e se ci interessano piccoli valori di k, la dipendenza è relativamente semplice. Sviluppando i coseni, come si era fatto per ottenere l’equazione (13.16), si ricava ora che E = Emin + Ax a2 k x2 + Ay b2 k y2 + Az c2 k z2
(13.26)
Per un semplice reticolo cubico, con spaziatura reticolare a, ci si aspetta che Ax , Ay e Az siano uguali, diciamo tutti uguali ad A, e si ottiene semplicemente
oppure
⇣ ⌘ E = Emin + Aa2 k x2 + k y2 + k z2 E = Emin + Aa2 k 2
(13.27)
Questa equazione è simile alla (13.16). Ripetendo i ragionamenti che si erano fatti allora, si conclude che un pacchetto elettronico in tre dimensioni (costituito sovrapponendo molti stati con energie quasi uguali) si muove anch’esso come una particella classica con una certa massa effettiva. In un cristallo con minor simmetria di quella cubica (o anche in un cristallo cubico in cui lo stato dell’elettrone in corrispondenza a ciascuno degli atomi non sia simmetrico), i tre coefficienti Ax , Ay e Az sono diversi tra loro. Allora, la «massa effettiva» di un elettrone, localizzato in una piccola regione, dipende dalla sua direzione di moto. Esso può, per esempio, presentare un’inerzia differente per il moto nella direzione x e per quello nella direzione y. (I dettagli di una tale situazione sono talvolta descritti mediante un «tensore di massa effettiva».)
13.5 • Altri possibili stati in un reticolo
© 978-8808-22107-0
13.5
Altri possibili stati in un reticolo
Secondo l’equazione (13.24), gli stati elettronici di cui abbiamo parlato possono avere soltanto delle energie comprese in una certa «banda» che copre l’intervallo dall’energia minima E0
2 (Ax + Ay + Az )
a quella massima E0 + 2 (Ax + Ay + Az ) Sono possibili anche altre energie, ma esse appartengono a una differente classe di stati elettronici. Per gli stati che abbiamo considerato finora, abbiamo immaginato che gli stati di base fossero quelli in cui un elettrone è localizzato presso un atomo del cristallo in un certo particolare stato, per esempio quello d’energia minima. Se si ha un atomo nello spazio vuoto e gli si attacca un elettrone per costituire uno ione, questo ione può essere formato in molti modi. L’elettrone può attaccarsi in modo tale da dar luogo allo stato di minima energia, ma può anche formare uno o l’altro dei molti possibili «stati eccitati» dello ione, ciascuno con una ben definita energia al di sopra di quella minima. La stessa cosa può succedere in un cristallo. Supponiamo che l’energia E0 che abbiamo scelto prima corrisponda a stati di base in cui gli ioni abbiano la minima energia possibile. Possiamo anche immaginare un nuovo insieme di stati di base in cui l’elettrone se ne stia accanto all’n-esimo atomo in uno stato diverso, in uno degli stati eccitati dello ione, di modo che l’energia E0 sia ora un po’ più alta. Come prima, c’è una certa ampiezza A (diversa da prima) che corrisponde a un salto dell’elettrone dal suo stato eccitato in un atomo allo stesso stato eccitato nell’atomo vicino. Tutta quanta l’analisi si fa allo stesso modo; troveremo una banda di possibili energie centrate intorno a un’energia un po’ più alta della precedente. In generale, ci possono essere diverse bande di questo genere, ciascuna delle quali corrisponde a un diverso livello di eccitazione. Ma ci sono anche altre possibilità. Vi può essere un’ampiezza che corrisponde al salto dell’elettrone da uno stato eccitato in un atomo a uno stato non eccitato in quello vicino. (Questa viene chiamata interazione tra bande.) La teoria matematica diventa sempre più complicata, via via che si tien conto di un numero maggiore di bande e che si aggiungono nuovi coefficienti per il passaggio fra i possibili stati. Tuttavia non vengono introdotte nuove idee; e le equazioni sono costruite in modo assai simile a quello che si è visto nel nostro semplice esempio. Vogliamo anche far presente che non c’è più molto da dire sui vari coefficienti, come ad esempio l’ampiezza A, che compaiono nella teoria. Di norma sono assai difficili da calcolare, cosicché in pratica poco si conosce dal punto di vista teorico su tali parametri, e per ogni particolare situazione reale se ne possono soltanto prendere i valori determinati sperimentalmente. Vi sono poi altre situazioni in cui l’aspetto fisico e quello matematico sono quasi esattamente uguali a quelli che si sono incontrati nel caso di un elettrone che si muove in un cristallo, ma in cui l’«oggetto» che si muove è assai differente. Supponiamo, per esempio, che il nostro originario cristallo, o meglio il nostro reticolo lineare, fosse una fila di atomi neutri, ciascuno con un elettrone esterno debolmente legato. E supponiamo d’aver rimosso un elettrone. Qual è l’atomo che lo ha perduto? Cn rappresenti ora l’ampiezza che l’elettrone manchi all’atomo in x n . In generale, ci sarà un’ampiezza i A/~ relativa al passaggio di un elettrone da un atomo vicino, per esempio l’(n 1)-esimo atomo, all’n-esimo, in modo tale da lasciare l’(n 1)-esimo atomo privo del suo elettrone. Ma questo è equivalente a dire che esiste una certa ampiezza A relativa al salto dell’«elettrone mancante» dell’n-esimo atomo, all’(n 1)-esimo. Si può vedere che le equazioni sono esattamente le stesse di prima anche se, naturalmente, l’ampiezza A non ha necessariamente il valore di prima. Ancora una volta, si possono ricavare le stesse formule per i livelli energetici, per le «onde» di probabilità che si muovono attraverso il cristallo con la velocità di gruppo data dall’equazione (13.18), per la massa effettiva e via dicendo. Semplicemente ora le onde descrivono il comportamento dell’elettrone mancante, o «lacuna», come viene chiamato. Così una «lacuna» si comporta esattamente come una particella con una certa massa meff . Si può vedere che questa particella presenta una carica positiva. Ritorneremo più a lungo su tali lacune nel prossimo capitolo.
203
204
Capitolo 13 • Propagazione in un reticolo cristallino
© 978-8808-22107-0
Come altro esempio, si potrebbe considerare una fila di atomi neutri identici, uno dei quali si trovi in uno stato eccitato, cioè con un’energia maggiore di quella normale del suo stato fondamentale. Sia Cn l’ampiezza che l’n-esimo atomo sia quello eccitato. Quest’atomo può interagire con un suo vicino cedendo a questo l’energia in più e ritornando nello stato fondamentale. Indichiamo con i A/~ l’ampiezza relativa a questo processo. E ancora una volta l’aspetto matematico della cosa è lo stesso. In questo caso, l’oggetto che si muove è chiamato un eccitone. Si comporta come una «particella» neutra che si muove attraverso il cristallo, trasportando con sé l’energia di eccitazione. Moti di questo tipo potrebbero presentarsi in certi processi biologici come la visione o la fotosintesi. È stato suggerito che l’assorbimento della luce nella retina produca un «eccitone» che si muove poi attraverso una qualche struttura periodica (del tipo delle fibre nelle sbarre che sono state descritte nel cap. 36 del vol. 1, FIGURA 36.5) per essere infine accumulato in qualche speciale stazione di raccolta dove l’energia viene usata per produrre una reazione chimica.
13.6
Diffusione da parte delle imperfezioni di un reticolo
Consideriamo ora il caso di un singolo elettrone in un cristallo che non sia perfetto. La nostra precedente analisi ci dice che i cristalli perfetti hanno una perfetta conducibilità, cioè che gli elettroni possono scivolar via lungo il cristallo come nel vuoto, senza alcun attrito. Una delle cause più importanti che può impedire a un elettrone di seguitare ad andarsene per sempre è la presenza di imperfezioni o di irregolarità nel cristallo. Per esempio, supponiamo che in qualche punto del cristallo manchi un atomo; o supponiamo che qualcuno metta un atomo sbagliato in una delle locazioni atomiche del cristallo, cosicché, in tal punto, le cose vadano diversamente che nelle altre locazioni. Cioè che l’energia E0 o l’ampiezza A siano diverse. Come si potrebbe descrivere quel che avviene in tal caso? Per entrare nello specifico, torniamo al caso unidimensionale e supponiamo che l’atomo numero «zero» sia un’«impurità» e che abbia un valore di E0 diverso da quello di tutti gli altri atomi. Chiamiamo questa energia E0 + F. Che succede? Quando un elettrone arriva all’atomo «zero», vi è una certa probabilità che l’elettrone sia respinto all’indietro. Se un pacchetto d’onde si sta muovendo e raggiunge una zona in cui le cose sono un po’ differenti dal resto, una parte di esso continuerà ad andare avanti e una parte rimbalzerà indietro. È molto difficile analizzare una situazione come questa con pacchetti d’onde perché tutto varia col tempo. È assai più semplice lavorare con le soluzioni stazionarie; quindi faremo così, e vedremo quali stati stazionari possono essere costruiti a partire da onde continue che hanno una parte trasmessa e una riflessa. In tre dimensioni, la parte riflessa si può chiamare onda diffusa, visto che appunto si diffonde in varie direzioni. Cominciamo da un insieme di equazioni, che sono del tipo (13.6), salvo che l’equazione per n = 0 è diversa da tutte le altre. Le cinque equazioni per n = 2, 1, 0, +1, +2 risultano essere le seguenti: .. .. . . Ea 2 = E0 a 2 Aa 1 Aa 3 Ea
1
= E0 a
1
Aa0
Aa
Ea0 = (E0 + F) a0
Aa1
Ea1 = E0 a1
Aa2
Aa0
Ea2 = E0 a2 .. .
Aa3 .. .
Aa1
2
Aa
1
(13.28)
Ci sono anche, naturalmente, tutte le altre equazioni per |n| > 2, che sono identiche all’equazione (13.16).
205
13.6 • Diffusione da parte delle imperfezioni di un reticolo
© 978-8808-22107-0
Nel caso generale, dovremmo, in realtà, usare una diversa A per l’ampiezza relativa al salto dell’elettrone da o verso l’atomo «zero», ma le caratteristiche fondamentali del fenomeno risultano anche da un esempio semplificato in cui tutte le A sono uguali. L’equazione (13.10) va ancora bene come soluzione per tutte le equazioni, esclusa quella per l’atomo «zero», per quest’ultimo non va. Abbiamo bisogno di una soluzione diversa che possiamo costruire nel modo seguente. L’equazione (13.10) rappresenta un’onda che avanza nella direzione x positiva. Un’onda che avanza nella direzione x negativa sarebbe una soluzione ugualmente buona, e si scriverebbe nella forma a(x n ) = e ik xn La soluzione più generale possibile per l’equazione (13.6) sarebbe una combinazione di un’onda progressiva e di una regressiva, cioè an = ↵eik xn + e
ik x n
(13.29)
Questa soluzione rappresenta un’onda complessa di ampiezza ↵ che si muove nella direzione +x e un’onda di ampiezza che si muove nella direzione x. Date ora un’occhiata all’insieme di equazioni del nostro nuovo problema, le (13.28) più tutte le altre per gli altri atomi. Le equazioni che contengono le an con n 1 sono tutte soddisfatte dall’equazione (13.29), a condizione che k sia legato a E e alla spaziatura b del reticolo dalla relazione E = E0 2A cos kb (13.30) Fisicamente, ciò significa che un’onda «incidente» di ampiezza ↵ si avvicina all’atomo «zero» (il «centro diffusore») da sinistra, e un’onda «diffusa» o «riflessa» di ampiezza se ne ritorna indietro verso sinistra. Non si perde in generalità supponendo che l’ampiezza ↵ dell’onda incidente sia uguale a 1. L’ampiezza allora è, in generale, un numero complesso. Le stesse cose potrebbero essere ripetute per le soluzioni di an per n 1. I coefficienti potrebbero essere diversi, così per queste soluzioni si avrebbe an =
eik xn + e
ik x n
per n
1
(13.31)
In questo caso è l’ampiezza di un’onda che va verso destra e quella di un’onda che proviene da destra. Consideriamo ora la situazione fisica in cui inizialmente si ha solo un’onda che parte da sinistra, e c’è soltanto un’onda «trasmessa» che esce al di là del centro diffusore, cioè dall’impurità. Proviamo con una soluzione in cui = 0. Sarà certamente possibile soddisfare tutte le equazioni per le an , eccetto il gruppo delle tre intermedie dell’equazione (13.28), con le seguenti soluzioni di prova an (per n < 0) = eik xn + e
ik x n
(13.32)
an (per n > 0) = eik xn
Onda riflessa β
–4
–3
–2
Si ricordi che E è dato in funzione di k dall’equazione (13.30). Sostituendo il valore di E così ottenuto nelle equazioni precedenti, e ricordando che 1 ix (e + e 2
ix
)
–1
0
1
2
3
4
13.6 Onde in un reticolo unidimensionale con un’«impurità» atomica in n = 0. FIGURA
La situazione che stiamo descrivendo è illustrata in FIGURA 13.6. Facendo uso delle (13.32) per a 1 e a+1 , le tre equazioni intermedie delle (13.28) ci permetteranno di ricavare una soluzione per a0 e i due coefficienti e . In tal modo si è trovata una soluzione completa. Posto x n = nb, dobbiamo risolvere le tre equazioni ( ) ( ) (E E0 ) eik( b) + e ik( b) = A a0 + eik( 2b) + e ik( 2b) ( ) (E E0 F) a0 = A eikb + eik( b) + e ik( b) (13.33) ( ) (E E0 ) eikb = A eik(2b) + a0
cos x =
Onda trasmessa γ
Onda incidente 1
206
Capitolo 13 • Propagazione in un reticolo cristallino
© 978-8808-22107-0
dalla prima equazione si ottiene che a0 = 1 +
(13.34)
a0 =
(13.35)
e dalla terza I precedenti risultati sono compatibili solo se =1+
(13.36)
Questa equazione ci dice che l’onda trasmessa ( ) non è altro che l’onda incidente originale (1) più un’altra onda uguale a quella riflessa ( ). Questo non è sempre vero, ma lo è nel caso che ci sia diffusione da parte di un atomo soltanto. Se ci fosse un gruppetto di impurità, l’ampiezza che si somma all’onda in avanti non sarebbe necessariamente uguale a quella dell’onda riflessa. L’ampiezza di quest’ultima si può ricavare dalla seconda delle equazioni (13.33); si trova che F = (13.37) F 2i A sen kb Questa è la soluzione completa per un cristallo con un atomo strano. Ci si potrebbe meravigliare del fatto che l’onda trasmessa possa essere «di più» di quella incidente, come risulta dall’equazione (13.34). Bisogna però ricordare che e sono numeri complessi e che il numero di particelle (o meglio, la probabilità di trovare una particella) in un’onda è proporzionale al modulo quadrato dell’ampiezza. Infatti si avrà la «conservazione degli elettroni» solo se | |2 + | |2 = 1 (13.38) Questo è il caso della nostra soluzione, come si può vedere.
13.7
Cattura da parte di un’imperfezione del reticolo
Un’altra situazione interessante si può presentare quando F è un numero negativo. Se l’energia dell’elettrone è minore in corrispondenza dell’impurità (a n = 0 ) che in qualunque altro luogo, allora l’elettrone può essere catturato da quest’atomo. Cioè, se E0 + F è più in basso del fondo della banda che si trova in E0 2A, allora l’elettrone può essere «intrappolato» in uno stato con E < E0 2A. Una tale soluzione, tuttavia, non può saltar fuori da quanto si è fatto finora. Si può però ottenerla se si fa in modo che la soluzione di prova presa per l’equazione (13.10) possa ammettere valori immaginari di k. Poniamo k = ±i. Ancora una volta, avremo soluzioni diverse per n < 0 e n > 0. Una possibile soluzione per n < 0 potrebbe essere an (per n < 0) = ce+ xn
(13.39)
Si è preso l’esponente con il segno più; in caso contrario, l’ampiezza diverrebbe infinitamente grande per grandi valori negativi di n. Analogamente, una possibile soluzione per n > 0 sarebbe an (per n > 0) = c 0 e
xn
(13.40)
Sostituendo queste funzioni di prova nella (13.28), esse sono tutte soddisfatte, tranne le tre intermedie, se E = E0 A (eb + e b ) (13.41) Poiché la somma dei due termini esponenziali è sempre maggiore di 2, questa energia è al di sotto della banda normale, e questo è proprio ciò che cercavamo. Le rimanenti tre equazioni della (13.28) sono soddisfatte se a0 = c = c 0 e se è scelto in modo tale che A (eb
e
b
)= F
(13.42)
Combinando questa equazione con la (13.41), si trova l’energia dell’elettrone intrappolato, e precisamente p 4A2 + F 2 (13.43) E = E0 L’elettrone intrappolato ha un’energia ben definita, che si trova un po’ al di sotto della banda di conduzione.
13.8 • Ampiezze di diffusione e stati legati
© 978-8808-22107-0
207
Si noti che le ampiezze che compaiono nelle equaProbabilità zioni (13.39) e (13.40) non ci dicono che l’elettrone intrappolato stia proprio sull’impurità. La probabilità di trovare l’elettrone sugli atomi vicini è data dal quac 2e–2κx c 2e+2κx drato di tali ampiezze. Per una particolare scelta dei parametri, essa potrebbe per esempio variare com’è indicato dalle barrette nel grafico di FIGURA 13.7. La x Impurità atomica massima probabilità è quella corrispondente a trovare l’elettrone sull’impurità. Per gli atomi vicini, la probabilità diminuisce esponenzialmente con la distanza dall’impurità. Questo è un altro esempio di «penetra- FIGURA 13.7 Le probabilità relative di trovare un elettrone intrappolato nelle zione di una barriera». Dal punto di vista della fisica locazioni atomiche nei pressi dell’impurità. classica, l’elettrone non ha abbastanza energia per andarsene dalla «buca» di energia che si trova nell’atomo trappola. Ma quantisticamente, può allontanarsene un po’.
13.8
Ampiezze di diffusione e stati legati
Per finire, il nostro esempio può essere usato per illustrare un punto che è assai utile oggi nella fisica delle particelle di alta energia. Questo punto è connesso con una relazione tra ampiezze di diffusione e stati legati. Supponiamo di avere scoperto, sperimentalmente, e con l’analisi teorica, in quale modo i pioni vengano diffusi dai protoni. In seguito viene scoperta una nuova particella e qualcuno si chiede se essa non possa essere semplicemente una combinazione di un pione e un protone che si trovino insieme in un qualche stato legato (in analogia a quanto succede a un elettrone legato a un protone a formare un atomo di idrogeno). Per stato legato si intende una combinazione che abbia un’energia minore di quella delle due particelle libere. Esiste una teoria generale che dice che stati legati si possono presentare in corrispondenza di quelle energie in cui l’ampiezza di diffusione diviene infinita quando essa viene estrapolata algebricamente in regioni di energia esterne alla banda permessa. (Il termine matematico per questa operazione è «continuazione analitica».) La ragione fisica di questo fatto è la seguente. Uno stato legato è una situazione in cui vi sono solo onde legate a un punto senza che ci siano onde entranti che diano origine a questo stato di cose: uno stato legato esiste per conto suo. La proporzione relativa tra le cosiddette onde «diffuse», cioè quelle create, e le onde che vengono «mandate dentro» è infinita. Possiamo controllare la correttezza di questa idea per mezzo del nostro esempio. Scriviamo la nostra espressione (13.37) per l’ampiezza diffusa direttamente in funzione dell’energia E della particella che subisce la diffusione (invece che in funzione di k). Poiché l’equazione (13.30) può essere riscritta nella forma q 2A sen kb = 4A2 (E E0 )2 l’ampiezza diffusa è
=
F F
i
p
4A2
(E
E0 )2
(13.44)
Nella nostra derivazione, questa equazione dovrebbe essere usata solo per stati reali, cioè quelli con energie comprese nella banda E = E0 ± 2A. Ma supponiamo di dimenticarcelo ed estendiamo questa formula nelle regioni di energia «non fisiche» dove |E E0 | > 2A. Per tali regioni non fisiche, possiamo scrivere(2) q q 4A2 (E E0 )2 = i (E E0 )2 4A2 (2) Il segno della radice che va scelto in questo caso è un particolare tecnico connesso con i possibili segni di nelle equazioni (13.39) e (13.40), che non vogliamo trattare qui.
208
Capitolo 13 • Propagazione in un reticolo cristallino
© 978-8808-22107-0
Quindi, l’«ampiezza di diffusione», qualunque sia il significato che si voglia ora attribuirle, è =
F p
F + (E
E0 )2
4A2
(13.45)
Chiediamoci ora: vi è qualche energia E per cui diviene infinita (cioè per cui l’espressione di ha un «polo»)? Sì, fintanto che F è negativa, il denominatore della (13.45) sarà zero per (E oppure per
E0 )2
4A2 = F 2
p E = E0 ± 4A2 + F 2
La scelta del segno meno ci dà proprio l’energia che si era vista rappresentare nell’equazione (13.43), l’energia dell’elettrone intrappolato. E scegliendo il segno più? Questa volta si ha un’energia al di sopra della banda permessa. E infatti, anche là, c’è un altro stato legato che ci eravamo persi risolvendo le equazioni (13.28). Lasciamo a voi come problema il compito di trovare l’energia e le ampiezze an per questo stato legato. La relazione fra diffusione e stati legati fornisce una delle più utili indicazioni nella ricerca che viene condotta per comprendere le osservazioni sperimentali sulle nuove particelle strane.
14
Semiconduttori
14.1
Elettroni e lacune nei semiconduttori
Uno dei più rimarchevoli e sensazionali progressi degli ultimi anni è stata l’applicazione della scienza dello stato solido alla tecnologia elettronica, che si è notevolmente sviluppata creando per esempio i transistor. Lo studio dei semiconduttori ha portato alla scoperta delle loro utili proprietà e, di conseguenza, a un gran numero di applicazioni pratiche. Questo campo sta cambiando con una tale rapidità che, quello che diremo oggi potrà essere considerato sbagliato l’anno prossimo. In ogni caso, sarà certamente incompleto. Inoltre è perfettamente chiaro che il continuo studio di questi materiali produrrà molte nuove e meravigliose applicazioni col passare del tempo. La comprensione di questo capitolo non è necessaria al resto del libro, ma forse troverete interessante vedere come almeno qualcosa di ciò che state imparando ha una qualche relazione con la pratica. Oggi si conosce un gran numero di semiconduttori, ma noi ci occupiamo solo di quelli che attualmente trovano maggiore applicazione nella tecnica. Essi sono anche quelli di cui comprendiamo meglio il funzionamento, e imparando a conoscerlo, comprenderemo anche quello degli altri, almeno fino a un certo punto. Le sostanze semiconduttrici che oggi sono di più comune impiego sono il silicio e il germanio. Questi elementi cristallizzano in un reticolo simile a quello del diamante, una specie di struttura cubica in cui gli atomi si legano in forma di tetraedro ai quattro atomi più vicini. Questi elementi sono degli isolanti a temperatura molto bassa, vicino allo zero assoluto, per quanto conducano leggermente a temperatura ambiente. Non sono dei metalli e vengono chiamati semiconduttori. Se in qualche modo si pone un elettrone aggiuntivo in un cristallo di silicio o di germanio, che si trovi a bassa temperatura, ci troveremo in presenza proprio di quella situazione che abbiamo descritto nel capitolo precedente. L’elettrone potrà vagare per il cristallo saltando da un atomo all’altro. In effetti, noi ci siamo interessati solo del comportamento degli elettroni in un reticolo rettangolare, e le equazioni sarebbero un po’ diverse per il tipo di reticolo che il silicio o il germanio posseggono in realtà. Tuttavia, tutti i punti essenziali vengono illustrati dai risultati ottenuti per il reticolo rettangolare. Come si è visto nel capitolo 13, questi elettroni possono avere solo energie comprese in una certa banda energetica, detta banda di conduzione. Entro questa banda, l’energia è legata al numero d’onda k correlato alla probabilità di transizione C (vedi equazione (13.24)) da E = E0
2Ax cos k x a
2Ay cos k y b
2Az cos k z c
(14.1)
Le A sono le ampiezze relative ai salti nelle direzioni x, y e z, e le spaziature reticolari in queste direzioni sono rappresentate da a, b e c. Per energie vicine al fondo della banda, l’equazione (14.1) si può approssimare con E = Emin + Ax a2 k x2 + Ay b2 k y2 + Az c2 k z2
(14.2)
(vedi paragrafo 13.4). Se consideriamo un elettrone in moto in una certa direzione, di modo che le componenti di k stiano nello stesso rapporto, l’energia è una funzione quadratica del numero d’onda, cioè, come
Consultazione: C. Kittel, Introduction to Solid State Physics, John Wiley and Sons, Inc., New York, 2nd ed., 1956. Capitoli 13, 14 e 18.
210
Capitolo 14 • Semiconduttori
© 978-8808-22107-0
si è visto, dell’impulso dell’elettrone. Possiamo allora scrivere E
E = Emin + ↵k 2
(14.3)
dove ↵ è una costante, e possiamo fare un grafico di E in funzione di k, come quello in FIGURA 14.1. Chiameremo un grafico di questo tipo «diagramma S di energia». Un elettrone che si trovi in un particolare stato di impulso ed energia sarà rappresentato da un punto, per esempio S, nella figura. Emin Come si è già menzionato nel capitolo 13, una situazione analoga si presenta se un elettrone viene tolto da un materiale isolante neutro. In tal caso un elettrone può fare un salto da un atomo vicino e riempire la k «lacuna», lasciando però un’altra «lacuna» nell’atomo da cui era partito. Quanto accade può essere descritto introducendo un’ampiezza relativa a FIGURA 14.1 Il diagramma energetico relativo trovare la lacuna in un particolare atomo e dicendo che la lacuna può saltare a un elettrone in un cristallo isolante. da un atomo al suo vicino. (Chiaramente, l’ampiezza A perché una lacuna salti dall’atomo a all’atomo b è esattamente uguale all’ampiezza perché un elettrone salti dall’atomo b nella lacuna dell’atomo a.) La matematica E necessaria allo studio di queste lacune è proprio la stessa che si usa per gli elettroni in più, e nuovamente si trova che l’energia della lacuna è legata al suo numero d’onda da un’equazione tipo la (14.1) o (14.2), salvo S il fatto che, naturalmente, Ax , Ay e Az hanno differenti valori numerici. La lacuna ha un’energia connessa al numero d’onda delle sue ampiezze di probabilità. La sua energia è compresa in una stretta banda e, vicino al E –min fondo di tale banda, varia quadraticamente col numero d’onda, cioè con l’impulso, come in FIGURA 14.1. In base ai ragionamenti del paragrafo 13.3, E– si trova che anche la lacuna si comporta come una particella classica con k una certa massa effettiva, a parte il fatto che in un cristallo non cubico la massa dipende dalla direzione di moto. Perciò la lacuna si comporta FIGURA 14.2 Per «creare» un elettrone libero come una particella positiva che si muove attraverso il cristallo. La carica è necessaria l’energia E – . di questa particella-lacuna è positiva, poiché essa si trova dove manca un elettrone; quando essa si muove in una direzione, sono in effetti gli elettroni che si muovono in direzione opposta. E Se poniamo parecchi elettroni in un cristallo neutro, essi se ne andranno in giro qua e là in maniera assai simile agli atomi di un gas a bassa pressione. Se non sono troppi, le loro interazioni non sono molto importanti. Se poniamo il cristallo in un campo elettrico, gli elettroni cominceranno a muoversi ordinatamente e fluirà una corrente elettrica. Alla fine, essi si S' E +min troveranno tutti a un’estremità del cristallo e se, in tal punto, è posto un elettrodo metallico, essi verranno raccolti e il cristallo tornerà allo stato E+ neutro. In modo analogo, possiamo porre nel cristallo un certo numero di k lacune. Queste ultime se ne andranno in giro per il cristallo in maniera casuale a meno che non vi sia un campo elettrico. In presenza di questo, fluiranno verso il terminale negativo, dove saranno «raccolte». Quello che FIGURA 14.3 Per «creare» una lacuna in uno stato in realtà avviene è che esse sono neutralizzate dagli elettroni del terminale S0 , è necessaria l’energia E + . metallico. Si possono anche avere elettroni e lacune contemporaneamente: e, se non ce ne sono troppi, se ne andranno ciascuno per la propria strada indipendentemente. In presenza di un campo elettrico, tutti contribuiranno alla corrente. Per ovvi motivi gli elettroni sono chiamati portatori negativi e le lacune portatori positivi. Finora abbiamo pensato di mettere dall’esterno gli elettroni nel cristallo, o di toglierveli in modo da formare delle lacune. Ma è anche possibile «creare» una coppia elettrone-lacuna nel cristallo stesso, allontanando un elettrone da un atomo neutro fino a una certa distanza. In tal caso, si hanno un elettrone libero e una lacuna libera ed entrambi si possono muovere nel modo che abbiamo descritto.
211
14.1 • Elettroni e lacune nei semiconduttori
© 978-8808-22107-0
14.4 I diagrammi energetici di un elettrone e di una lacuna disegnati insieme. FIGURA
–
–
E (elettrone)
E (elettrone) Banda di conduzione degli elettroni
S ELETTRONE E –min
E –min
Ecoppia Egap
k
E +min LACUNA
E +min
S' Banda di conduzione delle lacune
Stato S'
E + (lacuna) (Energia positiva verso il basso)
14.5 Diagramma dei livelli di energia degli elettroni e delle lacune. FIGURA
Stato S
E + (lacuna)
L’energia necessaria per porre un elettrone nello stato S, ciò che indicheremo dicendo «creare» lo stato S, è l’energia E , mostrata in FIGURA 14.2. Questa energia è leggermente maggiore dell’energia Emin . L’energia necessaria per «creare» una lacuna in uno stato S 0 è l’energia E + di + 0 FIGURA 14.3, un po’ superiore a Emin . Per creare una coppia negli stati S e S , l’energia richiesta + è esattamente E + E . La creazione di coppie è un processo che avviene di frequente (come vedremo in seguito), e di conseguenza molti preferiscono riunire la FIGURA 14.2 e la FIGURA 14.3 in un unico grafico, dove l’energia della lacuna è rappresentata nella parte inferiore, nonostante si tratti, ovviamente, di un’energia positiva. I nostri due grafici sono stati riuniti nella maniera descritta in FIGURA 14.4. Il vantaggio di un tale grafico consiste nel fatto che l’energia, Ecoppia = E + E + , necessaria a creare una coppia con l’elettrone in S e la lacuna in S 0 è data semplicemente dalla separazione verticale tra S e S 0, come si vede in FIGURA 14.4. L’energia minima che ci vuole per creare una + . coppia è detta energia di «separazione» ed è uguale a Emin + Emin Talvolta vi capiterà di vedere diagrammi più semplici, detti diagrammi dei livelli energetici, che si usano quando non si ha interesse a conoscere il valore della variabile k. Un tale diagramma, come quello mostrato in FIGURA 14.5, indica semplicemente le possibili energie degli elettroni e delle lacune(1) . Com’è possibile creare le coppie elettrone-lacuna? Vi sono vari modi. Per esempio, possono venir assorbiti fotoni dalla luce (o da raggi X) e si può avere così una creazione di coppie, se l’energia dei fotoni è superiore a quella di separazione. Il ritmo di produzione delle coppie è proporzionale all’intensità della luce. Se si appiccicano due elettrodi a una fettina di cristallo e vi si applica un potenziale di «polarizzazione», elettroni e lacune saranno costretti a muoversi verso gli elettrodi e la corrente nel circuito sarà proporzionale all’intensità della luce. Il meccanismo (1) In molti libri, questo stesso diagramma energetico è interpretato in modo differente. La scala di energia si riferisce ai soli elettroni. Invece di pensare all’energia delle lacune, si pensa allora all’energia che un elettrone avrebbe se riempisse la lacuna. Tale energia è minore di quella di un elettrone libero, minore proprio della quantità che si vede in FIGURA 14.5. Con questa interpretazione della scala delle energie, l’energia di separazione è la minima energia che deve essere ceduta a un elettrone per spostarlo dal suo stato legato alla banda di conduzione.
212
Capitolo 14 • Semiconduttori
© 978-8808-22107-0
che abbiamo descritto è responsabile del fenomeno della fotoconduttività e del funzionamento delle fotocellule. Le coppie elettrone-lacuna possono essere prodotte anche da particelle di alta energia. Quando una particella carica veloce, per esempio un protone o un pione con un’energia di qualche decina o centinaia di MeV, attraversa un cristallo, il campo elettrico prodotto da tale particella sbalza gli elettroni lontano dalle loro orbite legate, creando coppie elettrone-lacuna. Tali eventi si producono centinaia di migliaia di volte per ogni millimetro di percorso. Dopo il passaggio della particella, i portatori possono venire raccolti, e ciò dà luogo a un impulso elettrico. Questo è il meccanismo che fa funzionare i rivelatori a semiconduttore che sono recentemente entrati in uso nella fisica nucleare. Questi contatori non richiedono dei semiconduttori per il loro funzionamento, e quindi possono essere costruiti anche con isolanti cristallini. Infatti il primo contatore di questo tipo fu fatto usando un cristallo di diamante, che è un isolante a temperatura ambiente. Sono necessari dei cristalli di elevata purezza se si vuole che elettroni e lacune possano muoversi liberamente verso gli elettrodi, senza venire catturati. Si usano abitualmente semiconduttori di silicio e di germanio perché è possibile produrli di elevata purezza e di dimensioni ragionevolmente grandi (dell’ordine del centimetro). Finora, ci siamo occupati di cristalli semiconduttori a temperature vicine allo zero assoluto. Ma, a qualunque temperatura finita, vi è anche un altro meccanismo atto a creare coppie elettronelacuna. L’energia necessaria alla coppia può essere ricavata dall’energia termica del cristallo. Le vibrazioni termiche del cristallo possono trasferire la loro energia a una coppia, dando luogo a una creazione «spontanea». La probabilità per unità di tempo che un’energia dell’ordine dell’energia di separazione, Egap , sia concentrata tutta in una locazione atomica è proporzionale a e
Egap /T
dove T è la temperatura e è la costante di Boltzmann (vedi cap. 40, vol. 1). Vicino allo zero assoluto, non si ha una probabilità apprezzabile, ma via via che la temperatura si alza, la probabilità di produrre le coppie aumenta. A ogni valore finito della temperatura la produzione dovrebbe continuare per sempre a ritmo costante dando luogo a un numero sempre maggiore di portatori positivi e negativi. Questo, naturalmente, non avviene perché, dopo un po’, elettroni e lacune s’incontrano accidentalmente, l’elettrone cade nella lacuna e l’eccesso di energia viene ceduto al reticolo cristallino. Si dice, allora, che l’elettrone e la lacuna si sono «annichiliti». C’è quindi una certa probabilità per secondo che un elettrone e una lacuna s’incontrino, annichilandosi a vicenda. Se il numero di elettroni per unità di volume è Nn (n sta per portatori negativi) e la densità di portatori positivi è Np , la probabilità per unità di tempo che un elettrone e una lacuna s’incontrino e si annichilino è proporzionale al prodotto Nn Np . In condizioni di equilibrio, tale probabilità deve essere uguale a quella di creazione delle coppie. Si vede dunque che, in condizioni di equilibrio, il prodotto di Nn e Np deve essere dato da qualche costante moltiplicata per il fattore di Boltzmann: Nn Np = cost. e
Egap /T
(14.4)
Dicendo costante, s’intende quasi costante. Una teoria più completa, che comprenda un maggior numero di dettagli su come elettroni e lacune s’«incontrino» tra loro, mostra che la «costante» dipende leggermente dalla temperatura, ma la dipendenza più forte resta quella nell’esponenziale. Consideriamo, per esempio, una sostanza pura, originalmente neutra. A temperatura finita, ci si aspetta che il numero dei portatori positivi e negativi sia uguale: Nn = Np Quindi, ciascuna di queste grandezze dovrebbe variare con la temperatura come e
Egap /2T
La variazione di molte proprietà di un semiconduttore, per esempio la sua conduttività, è in gran parte determinata dal fattore esponenziale, perché tutti gli altri fattori variano assai più lentamente con la temperatura. L’energia di separazione per il germanio è circa 0,72 eV e per il silicio 1,1 eV.
14.2 • Semiconduttori impuri
© 978-8808-22107-0
A temperatura ambiente T è circa 1/40 di elettronvolt. A tale temperatura, ci sono abbastanza elettroni e lacune per dar luogo a una conduttività significativa, mentre, per esempio, a 30 K, cioè a un decimo della temperatura ambiente, la conduttività è impercettibile. L’energia di separazione del diamante è 6 o 7 eV e il diamante è un buon isolante a temperatura ambiente.
14.2
Semiconduttori impuri
Finora abbiamo parlato di due modi per introdurre degli elettroni estranei in un reticolo cristallino altrimenti perfetto. Un modo consiste nell’iniettare l’elettrone da una qualche sorgente esterna; l’altro, quello di sbalzar via un elettrone legato da un atomo neutro, creando contemporaneamente un elettrone e una lacuna. Ma è possibile mettere degli elettroni nella banda di conduzione di un cristallo in un altro modo ancora. Provate a immaginare un cristallo di germanio in cui uno degli atomi di germanio sia sostituito da un atomo di arsenico. Gli atomi di germanio hanno valenza 4 e la struttura cristallina è controllata da quattro elettroni di valenza. L’arsenico, d’altra parte, ha una valenza 5. Risulta che un singolo atomo di arsenico può starsene in un reticolo di germanio (poiché ha approssimativamente la grossezza giusta), ma in tali condizioni si comporta come un atomo di valenza 4, usando quattro dei suoi elettroni di valenza per formare i legami cristallini e lasciando fuori un elettrone. Questo elettrone in più è legato assai debolmente: la sua energia di legame infatti è minore di 1/100 di elettronvolt. A temperatura ambiente, l’elettrone assorbe con facilità una tale quantità di energia dall’energia termica del cristallo, e se ne va per proprio conto, muovendosi per il reticolo come un elettrone libero. Un’impurità atomica, del tipo dell’atomo di arsenico, è chiamata centro donatore, perché può cedere al cristallo un portatore negativo. Se il germanio viene fatto cristallizzare a partire da una massa fusa cui sia stata aggiunta una piccolissima quantità di arsenico, i centri donatori di arsenico si troveranno distribuiti in tutto il cristallo e quest’ultimo racchiuderà fin dal principio una certa densità di portatori negativi. Si potrebbe pensare che questi portatori vengano eliminati non appena il cristallo si trovi sottoposto a un qualunque debole campo elettrico. Ciò però non succede, perché gli atomi di arsenico che si trovano nel corpo del cristallo hanno ciascuno una carica positiva. Se il cristallo deve rimanere complessivamente neutro, la densità media degli elettroni, che fanno da portatori negativi, deve uguagliare la densità dei centri donatori. Ponendo due elettrodi alle estremità del cristallo e connettendoli a una batteria, si osserva un flusso di corrente; ma, non appena a un’estremità gli elettroni che fungono da portatori sono spazzati via, all’estremità opposta devono essere introdotti nuovi elettroni di conduzione in modo tale da far sì che la densità media degli elettroni di conduzione sia circa uguale a quella dei centri donatori. Poiché i centri donatori sono carichi positivamente, essi avranno una certa tendenza a catturare alcuni degli elettroni di conduzione durante il processo di diffusione di questi ultimi attraverso il cristallo. Un centro donatore può, perciò, agire come una trappola del tipo di quelle che abbiamo discusso nel paragrafo precedente. Tuttavia, se l’energia di cattura è abbastanza piccola – come succede per l’arsenico – il numero di portatori che sono intrappolati a un certo istante è solo una piccola frazione del loro numero totale. Per una comprensione completa del comportamento dei semiconduttori, bisogna tener conto di questo fenomeno di cattura. Per il resto della nostra discussione, noi tuttavia supporremo che l’energia di cattura sia sufficientemente bassa e la temperatura sufficientemente alta, in modo tale che tutti i centri donatori abbiano ceduto i loro elettroni. Naturalmente, questa è solo un’approssimazione. È anche possibile costruire cristalli di germanio contenenti impurità atomiche di valenza 3, come l’alluminio. L’atomo di alluminio cerca di comportarsi come un atomo di valenza 4 rubando un elettrone. Il furto può essere compiuto ai danni di qualche atomo di germanio circostante e l’alluminio finisce per essere un atomo carico negativamente con una valenza effettiva pari a 4. Naturalmente il furto di un elettrone a un atomo di germanio lascia al suo posto una lacuna: e quest’ultima può andarsene in giro per il cristallo sotto forma di un portatore positivo. Un’impurità atomica che dà vita, in tal modo, a una lacuna è chiamata un accettore, perché «accetta» un elettrone. Se un cristallo di germanio o di silicio viene prodotto per cristallizzazione da una
213
214
Capitolo 14 • Semiconduttori
© 978-8808-22107-0
soluzione cui sia stata aggiunta una piccola quantità di impurità di alluminio, sarà presente fin dall’inizio nel cristallo una certa densità di lacune, che potranno fungere da portatori positivi. Quando in un cristallo s’introducono delle impurità, sia che si tratti di donatori sia di accettori, si dice che il materiale è stato «drogato». In un cristallo di germanio a temperatura ambiente, e contenente impurità che siano donatori, oltre agli elettroni forniti da questi, vi sono anche elettroni di conduzione che provengono dalla creazione di coppie elettrone-lacuna per effetto termico. Qualunque sia la loro origine, tali elettroni sono ovviamente equivalenti, e quello che conta nei processi statistici che portano a uno stato di equilibrio, è il numero totale Nn . Se la temperatura non è troppo bassa, il numero di portatori negativi che provengono dagli atomi donatori è circa uguale al numero di impurità atomiche presenti. In condizioni di equilibrio, deve continuare a valere l’equazione (14.4); a ogni data temperatura è determinato il prodotto Nn Np . Ciò significa che se viene aggiunta qualche impurità donatrice che aumenti il numero Nn , il numero Np dei portatori positivi deve diminuire di una quantità tale che il prodotto Nn Np rimanga inalterato. Per concentrazioni di impurità sufficientemente elevate, il numero di portatori negativi Nn è determinato dal numero di donatori ed è pressoché indipendente dalla temperatura, cosicché tutta la variazione del fattore esponenziale è dovuta a Np , anche se quest’ultimo è molto minore di Nn . Un cristallo di sostanza pura, eccettuata una piccola concentrazione di impurità che siano donatori, possiederà, in maggioranza, dei portatori negativi; un materiale di questo tipo è chiamato un semiconduttore di «tipo n». Se un’impurità di tipo accettore viene introdotta in un reticolo cristallino, alcune delle nuove lacune, che così si producono, circoleranno nel cristallo e annichileranno alcuni degli elettroni liberi prodotti dalle fluttuazioni termiche. Questo processo continuerà finché non sia soddisfatta l’equazione (14.4). In condizioni di equilibrio, il numero dei portatori positivi aumenterà e quello dei portatori negativi diminuirà, in modo da mantenere costante il loro prodotto. Un materiale con eccesso di portatori positivi è detto semiconduttore di «tipo p». Ponendo due elettrodi su due facce di un cristallo semiconduttore e connettendoli a una sorgente di differenza di potenziale, verrà a crearsi un campo elettrico nell’interno del cristallo. Il campo elettrico costringerà i portatori positivi e negativi a muoversi e fluirà una corrente elettrica. Consideriamo dapprima quel che succede in un materiale di tipo n in cui vi è un’ampia maggioranza di portatori negativi. Per un materiale di questo tipo si possono trascurare le lacune: infatti il loro contributo alla corrente sarà assai piccolo, dal momento che ce ne sono così poche. In un cristallo perfetto, i portatori si muoverebbero in lungo e in largo senza alcun impedimento. In un cristallo reale, a temperatura finita (e soprattutto in un cristallo con delle impurità), gli elettroni non si muovono del tutto liberamente. Essi si urtano continuamente e ciò li sbatte fuori dalle loro traiettorie originali, cioè cambia il loro impulso. Queste collisioni sono responsabili proprio di quel processo di diffusione di cui si è parlato nel capitolo precedente e che si presenta dovunque vi siano irregolarità nel reticolo cristallino. Per un materiale di tipo n, la causa principale della diffusione sono proprio i centri donatori che producono i portatori. Poiché gli elettroni di conduzione nei centri donatori hanno energie che differiscono molto poco, le onde di probabilità vengono diffuse da questi centri. Comunque, anche in un cristallo perfettamente puro, ci sono (per ogni valore finito della temperatura) delle irregolarità reticolari dovute alle vibrazioni termiche. Da un punto di vista classico, si potrebbe dire che gli atomi non sono perfettamente allineati in un reticolo regolare, ma che, a ogni istante, sono leggermente fuori posto a causa delle loro vibrazioni termiche. L’energia E0 che, nella teoria che abbiamo descritto nel capitolo 13, è associata a ciascun punto del reticolo, varia leggermente da un punto all’altro, cosicché le onde di probabilità non vengono trasmesse inalterate, ma vengono piuttosto diffuse in modo irregolare. A temperature molto alte e per materiali molto puri, questa diffusione può divenire importante, ma nella maggior parte dei materiali drogati, usati nelle applicazioni pratiche, le impurità atomiche sono ciò che dà maggior contributo alla diffusione. Passiamo ora a fare una stima della conducibilità elettrica di un materiale di questo tipo. Quando un campo elettrico viene applicato a un semiconduttore di tipo n, ciascun portatore negativo viene a essere accelerato per effetto di questo campo, aumentando la propria velocità finché non viene deflesso da un centro donatore. Ciò significa che i portatori, che abitualmente si muovono in modo piuttosto casuale con energie dell’ordine di quella termica, vengono ora a
14.3 • L’effetto Hall
© 978-8808-22107-0
possedere una velocità media di deriva lungo le linee del campo elettrico e danno luogo a una corrente nel cristallo. In generale, la velocità di deriva è piccola rispetto alle velocità termiche caratteristiche, e questo ci permette di stimare la corrente supponendo che il tempo medio che intercorre tra gli urti successivi di un portatore sia costante. Supponiamo che il portatore negativo abbia una carica elettrica effettiva qn . La forza che si esercita sul portatore, posto in un campo elettrico E, sarà qn E. Nel paragrafo 43.3 del vol. 1, avevamo calcolato qual era la velocità di deriva media in una tale situazione, e avevamo trovato che essa è data da F⌧/m, dove F è la forza che agisce sulla carica, ⌧ è il tempo medio tra due collisioni e m è la massa. In effetti, bisognerebbe introdurre la massa effettiva che era stata calcolata nel capitolo precedente ma, visto che vogliamo fare solo un calcolo approssimativo, penseremo che la massa effettiva abbia lo stesso valore in tutte le direzioni e la indicheremo con mn . Con questa approssimazione, la velocità media di deriva sarà qn E⌧n vdrift = (14.5) mn Nota la velocità di deriva si può trovare la corrente. La densità di corrente elettrica j è semplicemente data dal numero di portatori per unità di volume, Nn , moltiplicato per la velocità media di deriva, e per la carica di ciascun portatore. La densità di corrente è perciò j = Nn vdrift qn =
Nn qn2 ⌧n E mn
(14.6)
Come si vede, la densità di corrente è proporzionale al campo elettrico; il nostro materiale semiconduttore obbedisce alla legge di Ohm. Il coefficiente di proporzionalità tra j e E, cioè la conducibilità , è dato da Nn qn2 ⌧n = (14.7) mn Per un materiale di tipo n, la conducibilità è relativamente indipendente dalla temperatura. Prima di tutto perché il numero della maggioranza di portatori Nn è determinato soprattutto dalla densità di donatori nel cristallo (almeno finché la temperatura non è tanto bassa da permettere che troppi portatori siano catturati). Secondariamente, il tempo medio tra due collisioni, ⌧n , è determinato soprattutto dalla densità di impurità atomiche, cosa che naturalmente non dipende dalla temperatura. Tutti gli stessi ragionamenti possono essere applicati a un materiale di tipo p, semplicemente cambiando il valore dei parametri che compaiono nell’equazione (14.7). Se contemporaneamente sono presenti portatori sia positivi sia negativi in numero paragonabile, bisogna sommare i contributi che provengono da ciascun tipo di portatore. La conducibilità totale sarà data da 2 Nn qn2 ⌧n Np qp ⌧p = + mn mp
(14.8)
Per materiali di elevata purezza, Np e Nn sono circa uguali. Sono tuttavia minori che in un materiale drogato, cosicché la conducibilità è minore. Inoltre, varieranno rapidamente con la temperatura (come e Egap /T , come s’è visto), di modo che la conducibilità possa variare con la temperatura con estrema rapidità.
14.3
L’effetto Hall
Senza dubbio, è una cosa piuttosto strana che in una sostanza, in cui gli unici oggetti relativamente liberi sono degli elettroni, ci sia una corrente elettrica dovuta a delle lacune che si comportano come delle particelle positive. Vogliamo perciò descrivere un esperimento che mostra in modo piuttosto chiaro e definitivo che il segno dei portatori di corrente elettrica è positivo. Supponiamo d’avere un blocco di materiale semiconduttore (ma andrebbe bene anche un metallo) e di sottoporlo a un campo elettrico in modo da far scorrere una corrente in una qualche direzione, per esempio
215
216
Capitolo 14 • Semiconduttori
© 978-8808-22107-0
quella orizzontale, come è mostrato in FIGURA 14.6. Supponiamo, inoltre, di porre il blocco in un campo magnetico ortogonale alla corrente, tale che + – il campo entra nel piano della figura. I portatori in movimento saranno +(–) sottoposti a una forza magnetica q(v ⇥ B). Poiché la velocità media di I B deriva è diretta verso destra o verso sinistra a seconda del segno della j carica dei portatori, la forza magnetica media nei portatori potrà essere diretta sia verso l’alto sia verso il basso. Errore! Se infatti la corrente e il – (+) campo magnetico sono diretti come abbiamo assunto in partenza, la forza magnetica sulle cariche in moto sarà sempre diretta verso l’alto. Cariche positive che si muovano nella direzione di j (verso destra) subiranno una FIGURA 14.6 L’effetto Hall è dovuto alle forze forza diretta verso l’alto. Se invece la corrente è dovuta al moto di cariche magnetiche che agiscono sui portatori. negative, queste ultime si spostano verso sinistra (fissato il segno della corrente di conduzione) e subiscono di conseguenza ancora una forza diretta verso l’alto. In condizioni stazionarie, tuttavia, non c’è alcun moto verso Voltmetro elettronico l’alto delle cariche, perché la corrente può fluire solo da sinistra a destra. – + Quel che succede è che un piccolo numero di cariche fluisce inizialmente 0 verso l’alto, dando luogo a una densità superficiale di carica lungo la faccia superiore del semiconduttore, mentre una densità superficiale uguale e opposta si forma sulla faccia inferiore. Le cariche si accumulano sulle superfici superiore e inferiore finché le forze elettriche, che esse producono I sulle cariche in movimento, cancellano esattamente (in media) la forza magnetica, e la corrente stazionaria continua a scorrere orizzontalmente. Le cariche che stanno sopra e sotto il cristallo producono una differenza di potenziale verticale lungo quest’ultimo, che può essere misurata con un voltmetro ad alta resistenza, com’è mostrato nella FIGURA 14.7. Il segno della differenza di potenziale rivelata dal voltmetro dipenderà dal segno FIGURA 14.7 Misura dell’effetto Hall. dei portatori responsabili della corrente. La prima volta che esperimenti di questo tipo vennero effettuati ci si aspettava che la differenza di potenziale risultasse negativa, come dovrebbe essere se la conduzione fosse dovuta agli elettroni negativi. Perciò, tutti rimasero profondamente sorpresi nel trovare che alcuni materiali presentavano un segno opposto per la differenza di potenziale. Sembrava che il portatore di corrente fosse una particella carica positivamente. Dalle nostre discussioni sui semiconduttori drogati si capisce come un semiconduttore di tipo n possa dar luogo alla differenza di potenziale caratteristica dei portatori negativi e come un semiconduttore di tipo p dia una differenza di potenziale opposta, dal momento che la corrente è trasportata dalle lacune, cariche positivamente. In origine, la scoperta del segno anomalo della differenza di potenziale nell’effetto Hall fu fatta non in un semiconduttore, ma in un metallo. Si era sempre supposto che nei metalli la conduzione fosse causata dagli elettroni: ma si trovò, invece, che per il berillio la differenza di potenziale aveva il segno sbagliato. Oggi sappiamo che, in certe circostanze, è possibile che nei metalli, oltre che nei semiconduttori, gli «oggetti» responsabili della conduzione siano le lacune. Per quanto, in ultima analisi, siano gli elettroni che si muovono nel cristallo, la relazione tra impulso ed energia e la risposta a un campo esterno sono cionondimeno proprio quelli caratteristici di una corrente elettrica dovuta a particelle positive. Vediamo ora di fare una stima qualitativa della differenza di potenziale che ci si può aspettare dall’effetto Hall. Se il voltmetro di FIGURA 14.7 è percorso da una corrente trascurabile, allora le cariche nell’interno del semiconduttore si devono muovere da sinistra a destra, e la forza magnetica verticale deve essere cancellata esattamente da un campo elettrico verticale che indicheremo con Etr («tr» sta per «trasversale»). Se il campo elettrico deve cancellare le forze magnetiche, si deve avere Etr = vdrift ⇥ B
(14.9)
Facendo uso della relazione tra velocità di deriva e densità di corrente elettrica data dall’equazione (14.6), si ottiene 1 Etr = jB qN
217
14.4 • Giunzioni a semiconduttori
© 978-8808-22107-0
La differenza di potenziale tra le superfici inferiore e superiore del cristallo è data naturalmente dall’intensità del campo, moltiplicata per lo spessore del cristallo. L’intensità del campo elettrico nel cristallo Etr è proporzionale alla densità di corrente e all’intensità del campo magnetico. La costante di proporzionalità, 1/qN, è detta coefficiente di Hall, e, di solito, è rappresentata dal simbolo RH . Il coefficiente di Hall dipende solo dalla densità di portatori, purché vi sia maggioranza di portatori di un determinato segno. La misura dell’effetto Hall è perciò un modo conveniente per determinare sperimentalmente la densità di portatori in un semiconduttore.
14.4
Giunzioni a semiconduttori
Passiamo ora a discutere cosa succede se si prendono due pezzi di germanio o di silicio con caratteristiche interne differenti, per esempio con differenze in qualità o quantità, e li si unisce per formare una «giunzione». Cominciamo con quella che è chiamata una giunzione p-n, in cui si ha del germanio di tipo p da una parte della superficie di separazione e del germanio di tipo n dall’altra parte, come mostra la FIGURA 14.8. In pratica, non è facile unire due pezzi separati di cristallo e riuscire a ottenere un contatto che sia uniforme su scala atomica. Piuttosto le giunzioni vengono FIGURA 14.8 Una giunzione p-n. costruite con un unico cristallo che viene modificato in due sezioni distinte. Una possibile maniera di far ciò consiste nell’aggiungere le impurità che fungeranno da droga alla «massa fusa», dopo che solo una metà del cristallo è già cristallizzata. Un altro modo è quello di spalmare una certa quantità Tipo p Tipo n (a) dell’elemento che fa da impurità sulla superficie del cristallo e poi riscaldare quest’ultimo in modo che alcune delle impurità atomiche diffondano nel cristallo. Le giunzioni costruite in questo modo non hanno superfici di V separazione molto ben definite, per quanto queste possano essere assotti4 gliate fino a circa 10 cm. Nella nostra discussione, ci riferiremo a una situazione ideale in cui le due regioni del cristallo con proprietà differenti (b) siano separate da una superficie infinitamente sottile. Dalla parte di tipo n di una giunzione p-n, vi sono degli elettroni liberi che possono circolare, e anche donatori fissi che compensano la carica elettrica totale. Dalla parte di tipo p ci sono delle lacune libere, che si muovono, e un ugual numero di accettori negativi, che provvedono a equilibrare la carica. Questa, almeno, è la situazione che si presenta N prima che i due materiali vengano a contatto. Una volta uniti, la situazione Np Nn cambia nella zona vicino alla superficie di separazione. Quando gli elettroni del materiale di tipo n arrivano alla superficie di separazione, essi non (c) vengono riflessi, come accadrebbe se si trattasse di una superficie libera, ma possono continuare il loro cammino dentro il materiale di tipo p. Alcuni degli elettroni del materiale di tipo n, tenderanno, perciò, a diffondere nell’interno del materiale di tipo p dove gli elettroni sono in minor numero. Questo travaso non può durare per sempre, perché via via che si perdono FIGURA 14.9 Il potenziale elettrico e le densità elettroni dal lato n, la carica positiva aumenta creando una differenza di dei portatori in una giunzione di semiconduttori potenziale elettrico che finisce per contrastare la diffusione degli elettroni non polarizzata. nella parte p. In maniera analoga, i portatori positivi del materiale di tipo p possono diffondere attraverso la giunzione nella parte di tipo n. Nel far ciò, essi lasciano dietro di sé un eccesso di carica negativa. In condizioni di equilibrio, la corrente netta di diffusione deve essere zero. Questo è dovuto ai campi elettrici che vengono a formarsi in modo tale da ricondurre i portatori positivi nuovamente nel materiale di tipo p. Questi due processi di diffusione che abbiamo descritto avvengono simultaneamente e, come avrete notato, agiscono entrambi nella direzione che tende a caricare in senso positivo il materiale di tipo n e in senso negativo il materiale di tipo p. A causa del valore finito della conducibilità del materiale semiconduttore, il salto di potenziale tra il lato p e il lato n avrà luogo in una regione
x
x
218
Capitolo 14 • Semiconduttori
© 978-8808-22107-0
relativamente ristretta vicino alla superficie di separazione. La maggior parte di ciascuno dei due blocchi di materiale avrà un potenziale costante. Sia l’asse x in direzione perpendicolare alla superficie di separazione; il potenziale varierà allora con x, come mostrato in FIGURA 14.9b. Nella FIGURA 14.9c sono riportati anche gli andamenti che si prevedono per la densità di portatori n, Nn , e di portatori p, Np . Lontano dalla giunzione le densità di portatori Np e Nn avranno il valore di equilibrio che ci si attende per dei pezzi singoli di materiale alla stessa temperatura. (La figura si riferisce a una giunzione in cui il materiale di tipo p è drogato più fortemente di quello di tipo n.) A causa del gradiente di potenziale nella giunzione, i portatori positivi devono risalire un salto di potenziale per raggiungere il lato n. Ciò significa che, in condizioni di equilibrio, ci sarà un numero minore di portatori positivi nel materiale di tipo n che nel materiale di tipo p. In base alle leggi della meccanica statistica, ci si aspetta che il rapporto del numero dei portatori p nei due lati della giunzione sia dato dalla seguente equazione Np (lato n) =e Np (lato p)
q p V /T
(14.10)
Il prodotto qp V al numeratore dell’esponenziale è semplicemente l’energia necessaria per trasportare una carica qp attraverso una differenza di potenziale V . Un’equazione esattamente dello stesso tipo descrive le densità dei portatori di tipo n: Nn (lato n) =e Nn (lato p)
qn V /T
(14.11)
Se le densità di equilibrio in ciascuno dei due materiali sono note, si può far uso di una qualunque delle equazioni sopra scritte per determinare la differenza di potenziale attraverso la giunzione. Da notare che, se le equazione (14.10) e (14.11) devono fornire lo stesso valore per la differenza di potenziale V , il prodotto Np Nn deve essere lo stesso dal lato p e dal lato n. (Si ricordi che qn = qp .) Si è già visto in precedenza che tale rapporto dipende solo dalla temperatura e dall’energia di separazione del cristallo. Quindi, purché le due parti del cristallo siano alla stessa temperatura, le due equazioni sono compatibili tra loro per lo stesso valore della differenza di potenziale. Poiché vi è una differenza di potenziale tra una parte e l’altra della giunzione, quest’ultima si presenta un po’ come una batteria. Potrebbe venire in mente che, se si connettessero con un filo il lato p e il lato n, si otterrebbe una corrente elettrica. Sarebbe bello riuscirci perché la corrente fluirebbe senza consumare nulla e si sarebbe ottenuta in tal modo una sorgente di energia infinita violando la seconda legge della termodinamica! Tuttavia, non si ha nessuna corrente, anche se si connette con un filo il lato p con il lato n. E il motivo si vede facilmente. Supponiamo di considerare dapprima un filo costituito da un pezzo di materiale non drogato. Quando questo filo viene connesso al lato n, viene a formarsi una giunzione; attraverso la quale vi sarà una differenza di potenziale. Supponiamo che sia esattamente la metà della differenza di potenziale tra il materiale di tipo p e il materiale di tipo n. Quando connettiamo il nostro filo (non drogato) al lato p della giunzione, ci sarà una differenza di potenziale alla nuova giunzione, ancora pari alla metà della caduta di potenziale attraverso la giunzione n-p. In tutte le giunzioni, le differenze di potenziale si aggiustano in modo tale che non vi sia flusso di corrente nel circuito. Qualsiasi tipo di filo si usi per congiungere insieme le due parti della giunzione, vengono a formarsi due nuove giunzioni e, purché tutte le giunzioni siano alla stessa temperatura, tutti gli sbalzi di potenziale nelle giunzioni si compensano e non si ha nessuna corrente attraverso il circuito. Tuttavia, risulta (e voi potete farne in dettaglio la teoria) che, se alcune delle giunzioni sono a temperatura differente dalle altre, vi è un flusso di corrente. Alcune delle giunzioni verranno riscaldate e altre raffreddate per effetto di questa corrente e vi sarà la conversione d’energia termica in energia elettrica. Questo effetto è responsabile del funzionamento delle termocoppie che vengono usate per misure di temperatura e dei generatori termoelettrici. Lo stesso effetto viene anche sfruttato per costruire piccoli frigoriferi. Se non si può misurare la differenza di potenziale tra i due lati di una giunzione n-p, come si fa a essere sicuri che il gradiente di potenziale mostrato in FIGURA 14.9 esista realmente? Un modo consiste nell’esporre la giunzione alla luce. Quando i fotoni vengono assorbiti, essi
© 978-8808-22107-0
14.5 • La giunzione a simiconduttore come raddrizzatore
possono produrre una coppia elettrone-lacuna. In presenza del forte campo elettrico che si ha nella giunzione (uguale alla pendenza della curva del potenziale di FIGURA 14.9), la lacuna viene attratta nella regione p e l’elettrone nella regione n. Se i due lati della giunzione vengono ora connessi da un circuito esterno, queste cariche addizionali danno luogo a una corrente. L’energia luminosa viene convertita dalla giunzione in energia elettrica. Le cellule solari che generano la potenza elettrica necessaria al funzionamento di alcuni dei nostri satelliti sfruttano questo principio. Nel corso della nostra discussione sul funzionamento di una giunzione di semiconduttori, si è supposto che lacune ed elettroni agiscano più o meno indipendentemente, se si eccettua il fatto che in qualche modo riescono a raggiungere uno stato di equilibrio statistico. Quando si è parlato della corrente che si produce per effetto dell’illuminazione della giunzione, abbiamo supposto che l’elettrone o la lacuna prodotti nelle vicinanze della giunzione potessero penetrare nell’interno del cristallo, prima di annichilirsi con un portatore di polarità opposta. Nelle immediate vicinanze della giunzione, dove la densità dei portatori di entrambi i segni è circa la stessa, l’effetto di annichilimento elettrone-lacuna (o «ricombinazione» come viene spesso chiamato) è un effetto importante, e un’analisi dettagliata del comportamento di una giunzione di semiconduttori deve tenerne opportunamente conto. Abbiamo dunque supposto che una lacuna o un elettrone prodotto nella regione della giunzione abbia una buona probabilità di entrare nell’interno del cristallo prima di ricombinarsi. Il tempo caratteristico necessario perché un elettrone o una lacuna trovi un compagno di polarità opposta e si annichili è compreso, per materiali semiconduttori normali, tra 10 3 s e 10 7 s. Questo tempo, fra l’altro, è assai più lungo del tempo medio ⌧ che intercorre tra due collisioni con i centri diffusori del cristallo e che abbiamo usato nell’analisi della conducibilità. In una normale giunzione n-p, il tempo necessario perché un elettrone o una lacuna, formatisi nella regione intorno alla giunzione, vengano trascinati nell’interno del cristallo, è generalmente molto più breve del tempo di ricombinazione. La maggior parte delle coppie contribuirà quindi alla corrente esterna.
14.5
La giunzione a simiconduttore come raddrizzatore
Passiamo ora a dimostrare come una giunzione p-n possa agire da raddrizzatore. Se si stabilisce una differenza di potenziale attraverso una giunzione, si avrà un forte flusso di corrente, se la polarità è di un certo segno, e un flusso assai piccolo se la stessa tensione è applicata con polarità opposta. Applicando una tensione alternata alla giunzione, si avrà in uscita un flusso di corrente in una sola direzione, cioè la corrente sarà stata «raddrizzata». Ritorniamo alla condizione di equilibrio descritta dai grafici di FIGURA 14.9 e vediamo cosa succede. Nel materiale di tipo p, c’è una grande concentrazione di portatori positivi, Np . Questi subiscono un processo di diffusione e ogni secondo un certo numero di essi si avvicina alla giunzione. Questa corrente di portatori positivi nei dintorni della giunzione è proporzionale a Np . Tuttavia, la maggior parte dei portatori viene respinta dal forte salto di potenziale che si ha nei pressi della giunzione e soltanto una frazione e qV /T la supera. Naturalmente, c’è anche una corrente di portatori positivi che si avvicinano alla giunzione dalla parte opposta. Anch’essa è proporzionale alla densità dei portatori positivi nella regione n, ma qui tale densità è molto minore di quella nella regione p. Quando i portatori positivi si avvicinano alla giunzione dal lato n, essi trovano un salto di potenziale con pendenza negativa e si precipitano immediatamente dalla parte p della giunzione. Indichiamo questa corrente con I0 . In condizioni di equilibrio, le correnti nelle due direzioni sono uguali. Quindi ci aspettiamo che valga la seguente relazione: I0 / Np (lato n) = Np (lato p)e
qV /T
(14.12)
Come si vede, questa equazione non è altro che la (14.10); semplicemente, è stata ottenuta in modo diverso. Supponiamo però di abbassare il potenziale dal lato n della giunzione di una quantità V ; ciò si può ottenere applicando una differenza di potenziale esterna alla giunzione. Ora il salto di
219
220
Capitolo 14 • Semiconduttori
potenziale non è più V , ma V V . La corrente di portatori positivi dal lato p verso il lato n avrà ora questa nuova differenza di potenziale nel fattore esponenziale. Indicando questa corrente con I1 , si ha
6
I1 / Np (lato p)e
5
3
I1 = I0 e+q
2 1 0 –3
–2
–1
1
2
–1 –2
V )/T
V /T
V /T .
Quindi si ottiene (14.13)
La corrente dal lato p aumenta esponenzialmente con il potenziale esterno V . Invece la corrente di portatori positivi dal lato n resta costante fin quando V non è troppo grande. Quando questi portatori si avvicinano alla superficie di separazione, essi trovano sempre un salto di potenziale verso il basso e finiscono tutti nel lato p. (Se V diviene maggiore della differenza di potenziale naturale V , la situazione cambia, ma noi non ci occuperemo di quel che succede per tensioni così elevate.) La corrente complessiva I, dovuta ai portatori positivi, che attraversa la giunzione, è data dalla differenza tra le correnti che provengono dai due lati:
14.10
La corrente che passa in una giunzione in funzione della tensione. FIGURA
q(V
Questa corrente è maggiore di I0 della quantità eq la seguente relazione tra I1 e I0 :
4
–4
© 978-8808-22107-0
I1 = I0 (e+q
V /T
1)
(14.14)
La corrente complessiva delle lacune I fluisce nella regione di tipo n. Qui giunte, le lacune diffondono all’interno della regione n, dove finiscono per annichilirsi con i portatori di tipo n, gli elettroni, che sono in maggioranza. Gli elettroni che vengono perduti per effetto dell’annichilimento vengono rimpiazzati da una corrente di elettroni provenienti dal terminale esterno del materiale di tipo n. Quando V è zero, la corrente complessiva dell’equazione (14.14) è nulla. Per V positivo, la corrente aumenta rapidamente all’aumentare della tensione applicata. Per V negativo, la corrente cambia segno, ma il termine esponenziale diviene presto trascurabile e la corrente negativa non supera mai I0 , che è piuttosto piccola nelle nostre ipotesi. Questa corrente inversa I0 è limitata dalla bassa densità dei portatori di minoranza nel lato n della giunzione. Se si ripete esattamente la stessa analisi per la corrente di portatori negativi che attraversano la giunzione, dapprima senza differenza di potenziale e poi con una piccola differenza di potenziale esterno applicata, V , si ottiene nuovamente un’equazione del tutto simile alla (14.14) per la corrente complessiva degli elettroni. Poiché la corrente totale è la somma delle correnti dei due tipi di portatori, l’equazione (14.14) si applica anche alla corrente totale purché s’identifichi I0 con la corrente massima che può fluire con una tensione invertita. La caratteristica tensione-corrente per l’equazione (14.14) è mostrata in FIGURA 14.10. Essa descrive il comportamento tipico di un diodo a stato solido, del tipo usato nei moderni calcolatori elettronici. Si noti che l’equazione (14.14) vale solo per piccole differenze di potenziale. Per differenze di potenziale che siano paragonabili o maggiori della differenza di potenziale interna naturale V , intervengono effetti di nuovo tipo e la corrente non obbedisce più a un’equazione così semplice. Voi forse ricorderete che, fra l’altro, si era trovata esattamente la stessa equazione (14.14) nella nostra discussione del «raddrizzatore meccanico» – la ruota dentata col dente di arresto – nel cap. 46 del vol. 1. Abbiamo trovato la stessa equazione nei due casi perché i processi fisici fondamentali sono estremamente simili.
14.6
Il transistor
La più importante applicazione pratica dei semiconduttori è forse il transistor. Il transistor consiste in due giunzioni a semiconduttore poste assai vicine l’una all’altra. Il suo funzionamento è basato
© 978-8808-22107-0
14.6 • Il transistor
221
in parte sugli stessi principi che abbiamo appena descritto per il diodo raddrizzatore, cioè per la giunzione raddrizzatrice. Supponiamo di costruire (a) p p n una piccola sbarretta di germanio con tre regioni distinte, una di tipo V p, una di tipo n e un’altra di tipo p, come si vede in FIGURA 14.11a. Questa combinazione viene chiamata transistor p-n-p. Ciascuna delle due giunzioni che compongono il transistor si comporterà in maniera assai (b) simile a quella descritta nel paragrafo precedente. In particolare ci sarà un gradiente di potenziale a ciascuna giunzione con una certa caduta dalla regione n a ciascuna delle regioni p. Se le due regioni p hanno le stesse proprietà interne, la variazione del potenziale lungo il cristallo sarà del tipo riportato nella FIGURA 14.11b. Supponiamo ora di connettere ciascuna delle tre regioni a una sorgente FIGURA 14.11 La distribuzione di potenziale di potenziale esterna, come si vede nella FIGURA 14.12a. Tutti i potenziali in un transistor in assenza di tensione. saranno riferiti al terminale connesso con la regione p di sinistra, cosicché quest’ultima sarà, per definizione, a potenziale zero. Chiameremo questo Ve = 0 Vb < 0 Vc 1
Quali sono i livelli energetici per gli stati con uno spin giù? Al solito, indichiamo con Cn l’ampiezza di probabilità per un certo stato | i di trovarsi nello stato | x n i. Se | i deve essere uno stato di energia definita, tutti i Cn devono variare nel tempo allo stesso modo, cioè Cn = an e
iEt/~
(15.9)
Questa soluzione di prova può essere inserita nella consueta equazione hamiltoniana i~
dCn X = Hnm Cm dt m
(15.10)
facendo uso dell’equazione (15.8) per gli elementi di matrice. Ovviamente, si ottengono infinite equazioni, ma tutte si possono scrivere nella forma Ean = 2Aan
Aan
1
Aan+1
(15.11)
Ancora una volta, ci troviamo ad avere lo stesso problema che già abbiamo risolto nel capitolo 13, eccetto che ora abbiamo 2A dove prima avevamo E0 . Le soluzioni corrispondono ad ampiezze Cn (le ampiezze che corrispondono a spin giù) che si propagano lungo il reticolo con una costante di propagazione k e un’energia E = 2A (1 cos kb) (15.12) Le soluzioni a energia definita corrispondono a «onde» di spin giù, dette «onde di spin». A ogni lunghezza d’onda corrisponde un’energia. Per grandi lunghezze d’onda (piccoli k) questa energia varia come E = Ab2 k 2 (15.13) Proprio come nel caso precedente, si può prendere in esame un pacchetto d’onde localizzato (che, comunque, contenga solo grandi lunghezze d’onda) che corrisponde ad avere un elettrone a spin giù localizzato in una certa regione del reticolo. Questo spin giù si comporterà come una «particella». Poiché la sua energia è legata a k dalla (15.13), la «particella» avrà una massa effettiva: ~2 meff = (15.14) 2Ab2 Queste «particelle» si indicano talvolta col nome di «magnoni».
15.2
227
15.2 • Due onde di spin
© 978-8808-22107-0
Due onde di spin
Passiamo ora a discutere cosa avviene se vi sono due spin giù. Prendiamo un insieme di stati di base. Scegliamo quegli stati in cui in due locazioni atomiche si hanno spin giù, come per lo stato mostrato in FIGURA 15.2. Questo stato può essere caratterizzato dalle coordinate x dei due atomi con lo spin giù. Quello della figura si può indicare con | x 2, x 5 i. In generale, gli stati di base sono | x n, x m i, un insieme doppiamente infinito! In questo schema di descrizione, lo stato | x 4, x 9 i e lo stato | x 9, x 4 i sono –3 –2 –1 0 1 2 3 4 esattamente lo stesso stato, perché ciascuno di essi dice semplicemente che c’è uno spin giù in 4 e uno in 9; l’ordine non ha alcuna importanza. Inoltre, lo stato FIGURA 15.2 Uno stato con due spin giù. | x 4, x 4 i non ha alcun significato, in quanto non esiste una cosa di questo genere. Un qualsiasi stato | i può essere descritto dando le ampiezze di tale stato relative a ciascuno degli stati di base. Quindi Cm,n = hx m, x n | i rappresenta ora l’ampiezza di probabilità per un sistema nello stato | i di trovarsi in uno stato in cui sia l’m-esimo sia l’n-esimo atomo hanno lo spin giù. Le complicazioni che ora saltano fuori non sono concettuali, ma di pura contabilità. (Uno dei problemi della meccanica quantistica sta proprio nella sua contabilità. Con un numero sempre maggiore di spin giù, le notazioni diventano sempre più elaborate, con un sacco di indici, e le equazioni hanno sempre più un aspetto orripilante; ma i concetti non sono per questo necessariamente più complicati di quelli del caso più semplice.) Le equazioni di moto del sistema di spin sono delle equazioni differenziali per i Cn,m . Esse sono dCn,m X = Hnm,i j Ci j (15.15) i~ dt i, j
Supponiamo di voler trovare gli stati stazionari. Come al solito, le derivate rispetto al tempo diventano E moltiplicata per le ampiezze, e i Cm,n possono essere sostituiti dai coefficienti am,n . Ora dobbiamo studiare attentamente l’effetto di H su di uno stato con gli spin m e n giù. Non è difficile immaginarselo. Supponiamo per un momento che m e n siano abbastanza lontani l’uno dall’altro, così che non ci si debba preoccupare dei guai ovvi a cui altrimenti si andrebbe incontro. L’operazione di scambio alla locazione x n sposterà lo spin giù all’atomo n + 1 o all’atomo n 1, e di conseguenza vi sarà ora un’ampiezza di probabilità che lo stato attuale derivi dallo stato | x m, x n+1 i e un’ampiezza che derivi invece dallo stato | x m, x n 1 i. Ma può essere stato l’altro spin a spostarsi; e quindi vi è una certa ampiezza che Cm,n riceva contributo da Cm+1,n o da Cm 1,n . Tutti questi effetti sono uguali. Il risultato finale per l’equazione hamiltoniana dei Cm,n è Eam,n = A (am+1,n + am
1,n
+ am,n+1 + am,n 1 ) + 4Aam,n
(15.16)
Questa equazione va bene, tranne che in due casi. Se m = n, non vi è nessuna equazione, e se m = n ± 1, due termini dell’equazione (15.16) mancano. Noi trascureremo queste eccezioni. Ignoreremo semplicemente il fatto che qualcuna di queste equazioni è leggermente diversa dalle altre. Dopotutto, stiamo supponendo che il cristallo sia infinito e, di conseguenza, abbiamo un numero infinito di termini; trascurarne qualcuno non dovrebbe importare gran che. Così, come prima grossolana approssimazione, dimentichiamoci delle equazioni che si presentano alterate. In altre parole, noi stiamo supponendo che l’equazione (15.16) sia valida per tutti i valori di m e n, anche per m e n l’uno accanto all’altro. Questo è il punto essenziale della nostra approssimazione. In questo caso, la soluzione non è difficile da trovare. Si ottiene immediatamente Cm,n = am,n e
iEt/~
(15.17)
con am,n = (cost.) eik1 xm eik2 xn
(15.18)
5
6
7
228
Capitolo 15 • L’approssimazione a particelle indipendenti
© 978-8808-22107-0
dove E = 4A
2A cos k1 b
2A cos k2 b
(15.19)
Pensate per un momento a quel che accadrebbe se si avessero due singole onde di spin (come quelle del paragrafo precedente), indipendenti fra loro, corrispondenti a k = k 1 e k = k2 ; le loro energie sarebbero, secondo l’equazione (15.12), ✏ 1 = 2A
2A cos k 1 b
✏ 2 = 2A
2A cos k 2 b
e
Notate che l’energia E dell’equazione (15.19) è proprio la loro somma: (15.20)
E = ✏(k1 ) + ✏(k2 )
In altri termini, possiamo interpretare la nostra soluzione nel seguente modo. Vi sono due particelle, cioè due onde di spin. Una di esse ha un impulso descritto da k 1 , l’altra da k 2 e l’energia del sistema è la somma delle energie dei due oggetti. Le due particelle si comportano in modo completamente indipendente. E questo è tutto. Naturalmente si è fatta qualche approssimazione, ma non vogliamo a questo punto metterci a discutere il grado di esattezza della nostra soluzione. Si può tuttavia ben immaginare che in un cristallo di dimensioni ragionevoli, con miliardi di atomi, e quindi miliardi di termini nell’hamiltoniana, il fatto di trascurare pochi termini non potrà portare a un grosso errore. Se si avessero tanti spin giù da dar luogo a un’apprezzabile densità, si dovrebbe invece certamente tener conto delle correzioni. (È piuttosto interessante che si possa scrivere una soluzione esatta nel caso in cui si abbiano due spin giù. Questo risultato non è particolarmente importante. Ma è interessante che le equazioni si possano risolvere esattamente in questo caso. La soluzione è am,n = eikc (xm +xn ) sen k |x m
xn |
(15.21)
con un’energia E = 4A
2A cos k1 b
2A cos k2 b
e con numeri d’onda k c e k legati a k1 e k2 dalle relazioni k1 = k c k k2 = k c + k
(15.22)
Questa soluzione comprende anche «l’interazione» dei due spin. Essa descrive il fatto che quando gli spin si avvicinano, vi è una qualche probabilità che avvenga una diffusione. Gli spin si comportano in maniera assai simile a particelle interagenti. Tuttavia la teoria dettagliata della loro diffusione esula da quanto vogliamo esporre qui.)
15.3
Particelle indipendenti
Nel paragrafo precedente abbiamo scritto l’hamiltoniana, equazione (15.15), per un sistema di due particelle. Facendo poi uso di un’approssimazione equivalente a trascurare ogni «interazione» tra le due particelle, abbiamo trovato gli stati stazionari descritti dalle equazione (15.17) e (15.18). Un tale tipo di stato è semplicemente il prodotto di due stati di particella singola. La soluzione che abbiamo trovato per am,n nell’equazione (15.18) non è tuttavia molto soddisfacente. Ci siamo già curati molto di far notare che lo stato | x 9, x 4 i non è uno stato diverso da | x 4, x 9 i, cioè che l’ordine di x m e x n non ha importanza. Più in generale, l’espressione algebrica per l’ampiezza Cm,n deve restare inalterata se si scambiano i valori di x m e x n , poiché questo non cambia lo stato. In entrambi i casi, Cm,n deve rappresentare l’ampiezza di trovare uno spin giù a x m e uno
15.3 • Particelle indipendenti
© 978-8808-22107-0
spin giù a x n . Notate però che la (15.18) non è simmetrica in x m e x n , poiché k1 e k2 sono in generale differenti. Il guaio è che noi non abbiamo imposto alla nostra soluzione dell’equazione (15.15) di soddisfare a questa ulteriore condizione. Fortunatamente, è facile sistemare le cose. Prima di tutto, notate che una soluzione dell’equazione hamiltoniana altrettanto buona della (15.18) è am,n = K eik2 xm eik1 xn
(15.23)
Ha perfino la stessa energia che avevamo ricavato per la (15.18). Ogni combinazione lineare della (15.18) e della (15.23) è ancora una buona soluzione e ha ancora un’energia data dalla (15.19). La soluzione che bisognava scegliere, per soddisfare la nostra richiesta di simmetria, è semplicemente la somma della (15.18) e della (15.23): f g am,n = K eik1 xm eik2 xn + eik2 xm eik1 xn (15.24)
Ora, dati comunque k1 e k2 , l’ampiezza Cm,n è indipendente dal modo in cui si ordinano x m e x n , e se ci capitasse di invertire tra loro le definizioni di x m e x n troveremmo lo stesso risultato. Anche la nostra interpretazione dell’equazione (15.24) per mezzo di «magnoni» deve essere modificata. Non si può più dire che l’equazione rappresenta una particella con un numero d’onda k 1 e una seconda particella con un numero d’onda k 2 . L’ampiezza (15.24) rappresenta uno stato di due particelle (magnoni). Lo stato è caratterizzato dai due numeri d’onda k1 e k2 e la nostra soluzione si presenta come uno stato composto di una particella d’impulso p1 = ~k1 e di un’altra particella di impulso p2 = ~k 2 , ma nel nostro caso non ci è possibile dire quale sia l’una o l’altra particella. Ormai, questa discussione dovrebbe avervi fatto venire in mente il capitolo 4 e i nostri discorsi sulle particelle identiche. Quello che abbiamo appena visto è che le particelle delle onde di spin – i magnoni – si comportano come particelle identiche di Bose. Tutte le ampiezze devono essere simmetriche nelle coordinate delle due particelle; ciò equivale a dire che se «si scambiano le due particelle», si ottiene ancora la stessa ampiezza con lo stesso segno. Ma, si potrebbe obiettare, perché scegliere di sommare i due termini per ottenere l’equazione (15.24)? Perché non sottrarli? In presenza di un segno meno, lo scambio di x m e x n , porterebbe solo a un cambiamento di segno per am,n che non ha nessuna importanza. Ma lo scambio di x m e x n non cambia assolutamente niente, tutti gli elettroni del cristallo restano esattamente dov’erano prima, e quindi non c’è nessuna ragione per cambiare sia pur solo il segno dell’ampiezza. I magnoni si comportano come particelle di Bose(2) . Questa discussione ha portato a un duplice risultato: primo, farvi conoscere qualcosa sulle onde di spin e, secondo, provare l’esistenza di uno stato la cui ampiezza è il prodotto di due ampiezze, e la cui energia è la somma delle energie corrispondenti alle due singole ampiezze. Per particelle indipendenti, l’ampiezza è il prodotto e l’energia è la somma. Si capisce subito perché l’energia è la somma. L’energia è il coefficiente di t in un esponenziale immaginario, in quanto è proporzionale alla frequenza. Qualunque cosa facciano due oggetti, di cui il primo ha un’ampiezza e iE1 t/~ , e il secondo e iE2 t/~ , se l’ampiezza per l’insieme dei due è il prodotto delle due singole ampiezze, allora nel prodotto compare una sola frequenza pari alla somma delle due frequenze. L’energia che corrisponde a tale ampiezza prodotto è la somma delle due energie. Così abbiamo svolto una serie di ragionamenti piuttosto involuti per dire una cosa molto semplice. Quando non si tiene conto delle interazioni tra particelle, si può pensare che ogni particella agisca indipendentemente. Ciascuna di esse può trovarsi individualmente in uno dei vari stati che avrebbe occupato se fosse stata sola. Bisogna comunque ricordare che, se si tratta di particelle identiche, esse si possono comportare come particelle di Bose o di Fermi a seconda dei casi. Per esempio, due elettroni in più in un cristallo, si comportano come particelle di Fermi. Scambiando le posizioni dei due elettroni, l’ampiezza deve cambiare di segno. Nell’equazione corrispondente alla (15.24), ci dovrebbe essere un segno meno tra i due termini al secondo (2) In generale, le quasi particelle di cui ci occupiamo possono comportarsi come particelle di Bose oppure di Fermi e, come nel caso di particelle libere, quelle con spin intero sono bosoni e quelle con spin semiintero sono fermioni. Un «magnone» rappresenta un elettrone a spin su che viene rovesciato. La variazione di spin è uno. Il magnone ha spin intero ed è quindi un bosone.
229
230
Capitolo 15 • L’approssimazione a particelle indipendenti
© 978-8808-22107-0
membro. Di conseguenza, due particelle di Fermi non possono trovarsi esattamente nelle stesse condizioni, cioè con uguali spin e con lo stesso k. L’ampiezza corrispondente a un tale stato è zero.
15.4
H
H C
H
C
C
C C
C
H
H
H
H C
H
H
C
C
C C
H
C
H
H
15.3 I due stati di base della molecola del benzene, usati nel capitolo 10. FIGURA
H
H C
H
C
C 6+ C
C H
H
C H
15.4 Un anello benzenico con sei elettroni rimossi. FIGURA
H
H C
H
FIGURA
C H
15.5
di etilene.
La molecola
La molecola del benzene
Per quanto la meccanica quantistica fornisca le leggi fondamentali che determinano la struttura delle molecole, queste leggi sono state applicate rigorosamente solo ai composti più semplici. I chimici, infatti, hanno elaborato vari metodi approssimati per calcolare alcune delle proprietà delle molecole complicate. Faremo ora vedere come l’approssimazione a particelle indipendenti sia usata dai chimici organici. Cominciamo con la molecola del benzene. Nel capitolo 10 abbiamo già discusso la molecola del benzene da un altro punto di vista. In quel caso si era data una descrizione approssimata della molecola come un sistema a due stati, i cui due stati di base sono mostrati in FIGURA 15.3. Vi è un anello di sei atomi di carbonio con un idrogeno legato al carbonio a ciascun vertice. Usando la descrizione convenzionale dei legami di valenza, è necessario ammettere che si abbiano doppi legami tra una metà degli atomi di carbonio e, nelle condizioni di minima energia, si hanno le due possibilità mostrate in figura. Vi sono anche altri stati, di energia maggiore. Nella nostra discussione sul benzene nel capitolo 10, ci siamo occupati solo di questi due stati e ci siamo dimenticati di tutto il resto. Si era visto che l’energia dello stato fondamentale della molecola non era uguale all’energia di uno dei due stati della figura, ma era minore, rispetto a tale valore, di una quantità proporzionale all’ampiezza per passare da uno all’altro di questi stati. Considereremo ora la stessa molecola da un punto di vista completamente diverso, utilizzando un diverso tipo di approssimazione. Questi due punti di vista ci daranno risposte differenti, ma un miglioramento delle approssimazioni da entrambe le parti finirà per darci la risposta giusta e una descrizione corretta della molecola del benzene. Se tuttavia non ci si preoccupa di migliorare le approssimazioni, che è poi la situazione più comune, allora non ci si deve meravigliare se le due descrizioni non concordano esattamente. Se non altro si vedrà che anche dal nuovo punto di vista, l’energia minima della molecola del benzene è minore di quella di entrambe le strutture a tre legami di FIGURA 15.3. La descrizione di cui ora faremo uso è la seguente. Immaginiamo che i sei atomi di carbonio di una molecola di benzene siano connessi solo da legami semplici, come in FIGURA 15.4. Abbiamo tolto sei elettroni – poiché un legame rappresenta una coppia di elettroni – cosicché avremo ora una molecola di benzene sei volte ionizzata. Vediamo ora quel che succede restituendo nuovamente i sei elettroni alla molecola, uno alla volta, e supponendo che ciascuno di essi possa muoversi liberamente lungo l’anello. Supponiamo, inoltre, che tutti i legami disegnati in FIGURA 15.4 siano saturati, così che non sia più necessario prenderli in considerazione. Che succede restituendo un elettrone allo ione molecolare? Ovviamente, esso si può sistemare in una qualunque delle sei posizioni attorno all’anello, in corrispondenza dei sei stati di base. Si avrà inoltre una certa ampiezza, per esempio A, per passare da una posizione alla successiva. Se si analizzassero gli stati stazionari, si troverebbero certi livelli permessi di energia. Questo, per un solo elettrone. Mettiamoci ora un secondo elettrone e facciamo l’approssimazione più ridicola che possa venire in mente, cioè che ciò che un elettrone fa non sia influenzato da quel che sta facendo l’altro. Naturalmente in pratica essi interagiscono; si respingono l’un l’altro a causa della forza di Coulomb e inoltre, se si trovano nella stessa posizione, hanno un’energia notevolmente diversa dal doppio dell’energia di quando ce n’è uno solo. Senza dubbio, l’approssimazione a particelle indipendenti non è legittimamente ammessa quando si hanno sei sole posizioni, e specialmente se ci si vogliono mettere sei elettroni. Tuttavia, i chimici organici sono riusciti a imparare un sacco di cose usando questo tipo di approssimazione. Prima di trattare in dettaglio la molecola del benzene, consideriamo un esempio più semplice, la molecola dell’etilene, che contiene soltanto due atomi di carbonio con due atomi di idrogeno per parte, come si vede nella FIGURA 15.5. Questa molecola ha un legame «in più» che si riferisce a
due elettroni dei due atomi di carbonio. Togliamo ora uno di questi due elettroni; che cosa avremo? Possiamo considerare questo come un sistema a due stati, in quanto l’elettrone rimanente può trovarsi presso l’uno o l’altro degli atomi di carbonio. Se lo si analizza come un sistema a due stati, si trova che le energie possibili per un singolo elettrone sono E0 A oppure E0 + A, come si vede in FIGURA 15.6. Aggiungiamo ora il secondo elettrone. Bene, se si hanno due elettroni, si può sistemare il primo nello stato più basso e il secondo nello stato più alto. Non è del tutto vero: ci stiamo dimenticando qualcosa. Ciascuno dei due stati è in realtà doppio. Quando diciamo che c’è uno stato permesso con energia E0 A, in realtà ce ne sono due. Due elettroni si possono trovare nella stessa posizione se uno di essi ha lo spin in su e l’altro in giù. (Non se ne possono mettere di più a causa del principio di esclusione.) Così, in pratica, si hanno due stati permessi d’energia E0 A. Si può disegnare un diagramma come quello di FIGURA 15.7 che indica i due livelli energetici e il loro grado di occupazione. Nelle condizioni di minima energia, entrambi gli elettroni saranno nello stato più basso, e i loro spin saranno opposti. L’energia del legame aggiuntivo è perciò 2(E0 A), se si trascura l’interazione tra i due elettroni. Ritorniamo al benzene. Ciascuno dei due stati di FIGURA 15.3 possiede tre doppi legami. Ciascuno di essi è un legame del tipo di quello dell’etilene e contribuisce con 2(E0 A) all’energia, dove ora E0 è l’energia necessaria a sistemare un elettrone in una delle posizioni del benzene, e A è l’ampiezza per passare alla posizione successiva. Di conseguenza, l’energia sarà pari a circa 6(E0 A). Però quando avevamo precedentemente studiato il benzene, avevamo visto che l’energia era minore di quella della corrispondente struttura con tre doppi legami. Vediamo ora se dal nostro nuovo punto di vista, l’energia del benzene risulta minore di quando si hanno tre legami semplici. Partiamo da un anello di benzene sei volte ionizzato e aggiungiamo un elettrone. Abbiamo a che fare con un sistema a sei stati. Non abbiamo ancora trattato un tale sistema, ma sappiamo già come si fa. Si scrivono sei equazioni nelle sei ampiezze e si va avanti. Risparmiamoci però un po’ di lavoro, osservando che noi abbiamo sostanzialmente già risolto questo problema quando abbiamo trattato quello di un elettrone in una catena infinita di atomi. Naturalmente il benzene non è una catena infinita, ma ha solo 6 atomi in cerchio. Supponiamo di aprire il cerchio e di formare una linea con gli atomi lungo tale linea numerati da 1 a 6. Su una linea infinita, la posizione successiva avrebbe il numero 7, ma, se imponiamo che questa posizione sia identica a quella col numero 1, e così di seguito, ci troveremo in una situazione identica a quella dell’anello del benzene. In altri termini, possiamo usare la soluzione per una catena infinita, con la condizione supplementare che tale soluzione debba essere periodica con un periodo di sei atomi. Dal capitolo 13 sappiamo che un elettrone in una catena possiede soluzioni di energia definita quando l’ampiezza in ciascuna locazione atomica è eik xn = eikbn . Per ogni k, l’energia è E = E0
2A cos kb
kbN = 2⇡s
E
E0 + A
E0
E0 – A
15.6 I possibili livelli di energia degli elettroni «in più» nella molecola di etilene. FIGURA
E
E0 + A
E0
E0 – A
(15.25)
Vogliamo ora utilizzare solo quelle soluzioni che si riproducono ogni 6 atomi. Occupiamoci del caso generale di un anello di N atomi. Se la soluzione deve avere un periodo pari a N spaziature atomiche, eikb N deve essere uguale all’unità, cioè kbN deve essere un multiplo di 2⇡. Se s è un intero qualsiasi, la nostra condizione dice che (15.26)
Si è già visto che non ha significato prendere k al di fuori dell’intervallo ±⇡/b. Ciò significa che si ottengono tutti gli stati possibili prendendo s nell’intervallo ±N/2. Si trova quindi che per un anello con N atomi, vi sono N stati di energia definita(3) i cui numeri d’onda k s sono dati da 2⇡ ks = s (15.27) Nb Ciascuno stato ha l’energia (15.25). Si ha uno spettro discreto di livelli energetici. Lo spettro del benzene (N = 6) è mostrato in FIGURA 15.8b. (I numeri tra parentesi indicano il numero di stati differenti con la stessa energia.) (3)
231
15.4 • La molecola del benzene
© 978-8808-22107-0
Si potrebbe pensare che per N pari ci siano N + 1 stati. Non è così, perché s = ±N/2 dà luogo allo stesso stato.
15.7 Nel legame aggiuntivo della molecola di etilene, due elettroni possono occupare il livello di energia più basso (uno con lo spin su, l’altro con lo spin giù). FIGURA
232
Capitolo 15 • L’approssimazione a particelle indipendenti
© 978-8808-22107-0
Vi è un modo elegante per analizzare i sei livelli di energia, che è riprodotto nella parte (a) della figura. Pensate a un cerchio, centrato su di un livello con s=3 E0 + 2A energia E0 , e di raggio 2A. Se, partendo dal basso, si (1) segnano sei archi uguali (ad angoli di k s b = 2⇡s/N, E0 + A s = 2 s = –2 (2) cioè di 2⇡s/6 per il benzene), le ordinate dei punti E0 sulla circonferenza sono le soluzioni dell’equazione 2A (15.25). I sei punti rappresentano i sei possibili stati. E0 – A (2) s = –1 s=1 Il livello d’energia minima è posto a E0 2A; ci sono E0 – 2A (1) poi due stati con la stessa energia E0 A, e così di s=0 2π/6 seguito(4) . Questi sono gli stati possibili per un elet(a) (b) trone. Se si ha più di un elettrone, due di essi possono occupare lo stesso stato, con spin opposti, beninteso. Nella molecola del benzene dobbiamo sistemare FIGURA 15.8 I livelli di energia in un anello con sei locazioni elettroniche sei elettroni. Nello stato fondamentale essi andranno a (per esempio, un anello benzenico). occupare gli stati di energia più bassa possibile, due in s = 0, due in s = +1 e due in s = 1. Quindi, secondo l’approssimazione a particelle indipendenti, l’energia dello stato fondamentale è E
Efond = 2 (E0
2A) + 4 (E0
A) = 6E0
8A
(15.28)
In effetti, l’energia è inferiore di una quantità 2A rispetto a quella con tre doppi legami separati. Confrontando l’energia del benzene con quella dell’etilene, si può determinare A. Questa risulta essere 0,8 eV, o, nelle unità che piacciono ai chimici, 18 kcal/mol. Questo modello può essere usato per calcolare, o perlomeno comprendere, altre proprietà del benzene. Per esempio, facendo uso della FIGURA 15.8, si può discutere l’eccitazione del benzene per mezzo della luce. Che cosa accade se si cerca di eccitare uno degli elettroni? Questo può saltare in uno degli stati di energia più elevata ancora liberi. La minima energia di eccitazione corrisponderà alla transizione dal più alto dei livelli occupati al più basso di quelli liberi. Questa richiede un’energia 2A. Il benzene assorbirà quindi luce di frequenza , con h = 2A. Si avrà anche assorbimento di fotoni di energia 3A e 4A. Non c’è bisogno di dire che lo spettro di assorbimento del benzene è stato misurato, e che la distribuzione delle righe spettrali è più o meno giusta, se non che la transizione più bassa ha luogo nell’ultravioletto; e per riprodurre i dati, si dovrebbe scegliere un valore di A tra 1,4 eV e 2,4 eV. Cioè il valore numerico di A risulta due o tre volte maggiore di quello predetto dall’energia di legame chimico. Quel che fa il chimico in situazioni come questa è analizzare molte molecole di tipo similare e di ricavare delle regole empiriche. Per esempio, arriva alla conclusione che per calcolare l’energia di legame bisogna usare quel certo valore di A, mentre per trovare con buona approssimazione lo spettro d’assorbimento, bisogna usare un altro valore di A. Potreste anche pensare che tutto ciò sia un po’ assurdo. Certamente, non è molto soddisfacente dal punto di vista di un fisico che cerchi di comprendere la natura a partire dai principi fondamentali. Ma il problema di un chimico è diverso. Egli deve cercare d’immaginare in anticipo quale sarà il comportamento di molecole che ancora non sono state prodotte o che non si riesce a comprendere completamente. Ciò di cui ha bisogno è una serie di regole empiriche; non ha una grande importanza da dove queste derivino. Perciò un chimico usa le teorie in modo totalmente diverso da un fisico. Lui si basa su equazioni che contengono un’ombra di verità, ma poi deve alterarne le costanti, facendo delle correzioni empiriche. Nel caso del benzene, il principale motivo per l’incompatibilità riscontrata è la nostra ipotesi che gli elettroni siano indipendenti; è proprio la teoria con cui siamo partiti che non è in realtà accettabile. Ciononostante ha un’apparenza di verità, perché i risultati che ne derivano sembra vadano nella direzione giusta. Con equazioni del genere, più alcune regole empiriche, e incluse varie eccezioni, il chimico organico si apre la strada nella giungla di cose complicate che ha (4) Quando due stati (che hanno distribuzione di ampiezza differente) hanno la stessa energia, si dice che i due stati sono «degeneri». Si noti che si possono avere quattro elettroni con energia E0 A.
233
15.5 • Ancora un po’ di chimica organica
© 978-8808-22107-0
deciso di studiare. (Non dimenticate che la ragione per cui un fisico riesce a calcolare qualcosa, partendo dai principi primi, è che sceglie solo problemi semplici. Non risolve mai problemi con 42 o anche con appena 6 elettroni. Finora, è stato capace di calcolare con precisione ragionevole solo l’atomo di idrogeno e quello di elio.)
15.5
Ancora un po’ di chimica organica
Vediamo ora come usare le stesse idee per studiare altre molecole. Consideriamo una molecola come il butadiene (1,3), la cui formula è mostrata in FIGURA 15.9 nell’abituale schema dei legami di valenza. Possiamo ripetere lo stesso gioco di prima con i quattro elettroni che corrispondono ai due doppi legami. Se si tolgono i quattro elettroni, si hanno quattro atomi di carbonio in fila. Già sapete come risolvere il caso di una linea. Voi direte: «Oh no, noi sappiamo trattare solo il caso di una linea infinita». Ma le soluzioni per una linea infinita comprendono anche quelle per una linea finita. State attenti. Sia N il numero di atomi sulla linea e numeriamoli da 1 a N come si vede in FIGURA 15.10. Scrivendo l’equazione per l’ampiezza nella posizione 1, non si ha nessun termine che derivi dalla posizione 0. Analogamente, l’equazione per la posizione N differisce da quella che si era usata nel caso della catena infinita perché non c’è nulla che arrivi dalla posizione N +1. Ma supponete che si possa trovare una soluzione per la catena infinita con la seguente proprietà: l’ampiezza di trovarsi sull’atomo 0 è zero e così pure quella di essere sull’atomo N + 1. L’insieme delle equazioni per tutte le posizioni da 1 a N della linea finita è quindi anch’esso soddisfatto. Si potrebbe pensare che non esistano soluzioni del genere per la linea infinita perché le nostre soluzioni erano del tipo eik xn che hanno dovunque ampiezza di ugual modulo. Ma d’altra parte, ricorderete che l’energia dipende solo dal valore assoluto di k, cosicché un’altra soluzione, ugualmente valida, per la stessa energia, sarebbe e ik xn . E una qualunque sovrapposizione di queste due andrebbe ancora bene. Sottraendole, si ottiene la soluzione sen k x n , che soddisfa alla condizione che l’ampiezza sia zero a x = 0, e che corrisponde sempre all’energia E0 2A cos kb Con un’opportuna scelta del valore di k, si può rendere nulla l’ampiezza anche in x N +1 . Questo impone che (N + 1)kb sia un multiplo di ⇡, cioè che kb =
⇡ s N +1
H
H C
C
⇡ , 5
2⇡ , 5
3⇡ 5
15.9 Rappresentazione del legame di valenza della molecola di butadiene (1, 3). FIGURA
–1
0
FIGURA
1
2
15.10
3
4⇡ 5
4
5
N –1 N
N +1
Una linea di N molecole.
E E0 + 1,618 A E0 + 0,618 A E0 E0 – 0,618 A
2A
E0 – 1,618 A 36°
FIGURA
15.11
I livelli di energia del butadiene.
(15.29)
e
C H
dove s è un intero compreso tra 1 e N. (Consideriamo solo valori positivi di k perché ciascuna soluzione contiene +k e k ; il cambiamento del segno di k riproduce lo stesso stato.) Per la molecola di butadiene, N = 4, cosicché vi sono quattro stati corrispondenti a kb =
C
H
(15.30)
Possiamo rappresentare i livelli energetici usando un diagramma circolare simile a quello usato per il benzene. Questa volta, usiamo un semicerchio diviso in cinque parti uguali come si vede in FIGURA 15.11. Il punto in basso corrisponde a s = 0, e non dà luogo ad alcuno stato. Lo stesso succede per il punto più in alto, che corrisponde a s = N + 1. I restanti quattro punti ci forniscono le quattro energie permesse. Vi sono quattro stati stazionari, ciò che ci si aspetta partendo da quattro stati di base. Nel diagramma circolare, gli intervalli angolari sono di ⇡/5 ossia di 36°. L’energia minima risulta essere E0 1,618A. (Ah, che meraviglie fa la matematica: la sezione
234
Capitolo 15 • L’approssimazione a particelle indipendenti
CH2
CH
CH3
H 3C
C 2H 5 N
N Mg
N
© 978-8808-22107-0
aurea dei Greci(5) ci dà lo stato di minima energia della molecola di butadiene secondo questa teoria!) Calcoliamo ora l’energia della molecola di butadiene quando si aggiungono i quattro elettroni. Con quattro elettroni si possono riempire due dei livelli più bassi, ciascuno con due elettroni di spin opposto. L’energia totale è E = 2 (E0 1,618 A) + 2 (E0 0,618 A) = (15.31) = 4 (E0 A) 0,472 A
N
Questo risultato sembra ragionevole. L’energia è un po’ più piccola di quando si hanno semplicemente due doppi legami, ma il legame non è così forte come nel benzene. A parte ciò, questo è il modo con cui il chimico analizza alcune molecole organiche. CH2 C C O Il chimico può usare non solo le energie, ma anche le ampiezze di probabilità. Dalla conoscenza dell’ampiezza di ciascuno stato e degli stati CH2 COOCH3 occupati, egli può predire la probabilità di trovare l’elettrone in un qualunque punto della molecola. Le regioni in cui è più probabile trovare gli COOC20H39 elettroni sono quelle più adatte a essere reattive nelle sostituzioni chimiche in cui si richiede che un elettrone sia messo in compartecipazione con qualche altro gruppo di atomi. Le altre regioni si adattano meglio a esFIGURA 15.12 Una molecola di clorofilla. sere reattive nelle sostituzioni chimiche che hanno tendenza a cedere un elettrone in più al sistema. Gli stessi concetti che abbiamo usato possono fornirci una qualche Etotale comprensione anche di una molecola complessa come la clorofilla, di cui una possibile versione è mostrata in FIGURA 15.12. Notate che i legami 0 2 4 6 8 10 12 doppi e semplici che sono stati disegnati a tratto marcato formano un n lungo anello chiuso con venti intervalli. Gli elettroni in più dei doppi legami possono circolare lungo tale anello. L’uso del metodo a particelle indipendenti può fornire un intero gruppo di livelli energetici. Vi sono –8A forti righe di assorbimento che derivano da transizioni tra quei livelli che giacciono nella parte visibile dello spettro e che danno a questa molecola il suo colore deciso. Altre molecole complesse simili a questa, come la FIGURA 15.13 Somma delle energie di tutti gli xantofilla, che fa diventare rosse le foglie, possono essere studiate allo elettroni quando gli stati più bassi nella FIGURA 15.8 stesso modo. sono occupati da n elettroni, se prendiamo E 0 = 0. L’applicazione di questo tipo di teoria alla chimica organica porta inoltre a una nuova idea. Ed è probabilmente quella che ha più successo o che E porta ai risultati più precisi almeno da un certo punto di vista. Quest’idea è connessa alla domanda: in queste situazioni si ha un legame chimico particolarmente forte? La risposta è molto interessante. Consideriamo dap0 2 4 6 8 10 12 prima l’esempio del benzene e immaginiamo la sequenza di eventi che si n producono partendo da una molecola sei volte ionizzata e aggiungendo via via più elettroni. Si avrà così a che fare con vari ioni di benzene, negativi o positivi. Supponiamo di mettere in grafico l’energia dello ione (o della molecola neutra) in funzione del numero di elettroni. Ponendo E0 = 0 (visto che non conosciamo il suo valore), si ottiene la curva di FIGURA 15.13. Per i primi due elettroni, la funzione è una retta. Per ciascuno dei gruppi succesFIGURA 15.14 I punti di FIGURA 15.13 interpolati sivi, la pendenza aumenta e vi è una discontinuità nella pendenza stessa tra da una curva continua. Le molecole con n = 2, 6, 10 sono più stabili delle altre. due gruppi di elettroni. La pendenza cambia quando uno ha appena finito di riempire un gruppo di livelli che hanno tutti la stessa energia e passa col nuovo elettrone al gruppo di livelli immediatamente più alto. In pratica, l’energia dello ione del benzene è molto diversa dalla curva di FIGURA 15.13 a causa dell’interazione degli elettroni e delle energie elettrostatiche che noi abbiamo trascurato. Queste correzioni tuttavia variano con n in modo piuttosto regolare. Quindi, anche apportandovi H 3C
(5)
Parte di un segmento che è medio proporzionale tra l’intero segmento e la parte restante.
235
15.6 • Altri usi di questa approssimazione
© 978-8808-22107-0
FIGURA
E0 + A
(1)
tutte queste correzioni, la risultante curva dell’energia avrà ancora delle irregolarità (sarà ancora accidentata) per quei valori di n in cui si ha un completo riempimento di un particolare livello energetico. Consideriamo ora una curva molto regolare che in media si accordi con i punti come quella in FIGURA 15.14. Potremo dire che i punti al di sopra di questa curva hanno energie «maggiori del normale» e i punti al di sotto di essa hanno energie «minori del normale». In generale, ci si aspetta che queste configurazioni con un’energia minore della normale abbiano, in senso chimico, una stabilità superiore alla media. Notate che le configurazioni più decisamente al di sotto della curva si hanno sempre al termine di uno dei segmenti di retta, cioè dove ci sono abbastanza elettroni da riempire completamente ciò che viene detto uno «strato energetico». Questa è una predizione molto precisa della teoria. Le molecole, o gli ioni, sono particolarmente stabili (in confronto ad altre configurazioni simili) quando gli elettroni a disposizione riempiono completamente uno strato energetico. Questa teoria ha spiegato e predetto alcune caratteristiche chimiche molto interessanti. Per considerare un esempio molto semplice, prendiamo in esame un anello a tre vertici. È quasi incredibile che i chimici riescano a fare un anello a tre e per di più stabile, tuttavia ci sono riusciti. Il diagramma circolare delle energie per tre elettroni è mostrato in FIGURA 15.15. Se ora sistemiamo due elettroni nello stato più basso, abbiamo solo due dei tre elettroni necessari. Il terzo elettrone deve essere messo in un livello molto più alto. Secondo le nostre argomentazioni, una tale molecola non dovrebbe essere particolarmente stabile, mentre la struttura con due elettroni lo sarebbe. Infatti, risulta che la molecola neutra di trifenilciclopropenile è assai difficile da fare, ma lo ione positivo che si vede in FIGURA 15.16 si realizza con relativa facilità. Un anello a tre non è mai facile a farsi perché c’è sempre una forte tensione quando i legami di una molecola formano un triangolo equilatero. Per formare un composto stabile, bisogna stabilizzare la struttura in qualche modo. Tuttavia, se si aggiungono tre anelli di benzene ai vertici, si riesce a realizzare lo ione positivo. (La ragione per cui si devono aggiungere questi anelli di benzene non è molto chiara.) In maniera analoga, si può analizzare anche un anello a cinque lati. Disegnando il diagramma energetico, si può vedere qualitativamente che la struttura con sei elettroni è particolarmente stabile, cosicché la molecola sarà maggiormente stabile nella forma di ione negativo. In effetti, l’anello a cinque, che è ben noto e facile da realizzare, agisce sempre come uno ione negativo. Similmente, è facile verificare che un anello a quattro o a otto vertici non presenta caratteristiche molto interessanti, ma che un anello a 14 o a 10 vertici, così come quello a 6, è stabile soprattutto nella forma neutra.
15.6
15.16 Il catione di trifenilciclopropenile. FIGURA
(2)
E0
E0 – 2A
15.15
Diagramma energetico per un anello a tre.
E
Altri usi di questa approssimazione
Vi sono due altri casi simili che descriveremo solo brevemente. Nel trattare la struttura dell’atomo si può pensare che gli elettroni riempiano strati successivi. La teoria di Schrödinger del moto di un elettrone può essere sviluppata facilmente solo per un singolo elettrone che si muova in un campo «centrale», cioè un campo che dipenda solo dalla distanza da un punto. Come fare
236
Capitolo 15 • L’approssimazione a particelle indipendenti
© 978-8808-22107-0
allora a capire quel che succede in un atomo con 22 elettroni? Un modo consiste nell’usare una specie di approssimazione a particelle indipendenti. Prima di tutto si calcola quel che succede con un elettrone; e si ottiene un certo numero di livelli energetici. Si mette un elettrone nello stato di minima energia. In un modello grossolano, si può continuare a ignorare le interazioni dell’elettrone e seguitare a riempire strati successivi, ma vi è un modo di ottenere risultati migliori tenendo conto, almeno approssimativamente, dell’effetto della carica elettrica portata dall’elettrone. Ogniqualvolta si aggiunge un elettrone se ne calcola l’ampiezza corrispondente a varie posizioni, e si usa poi questa ampiezza per stimare una specie di distribuzione di carica a simmetria sferica. Si usa il campo di questa distribuzione, insieme a quello del nucleo positivo e di tutti gli altri elettroni che erano stati precedentemente aggiunti, per calcolare gli stati permessi per l’elettrone successivo. In tal modo, è possibile ottenere delle stime ragionevolmente precise delle energie dell’atomo neutro, proprio come si è visto nel caso degli elettroni in una molecola ciclica. In uno strato parzialmente riempito, l’atomo mostrerà una preferenza per acquistare uno o più nuovi elettroni, o per perderne alcuni, in modo da finire nello stato più stabile con uno strato completo. Questa teoria spiega il meccanismo che sta dietro alle proprietà chimiche fondamentali che si manifestano nella tavola periodica degli elementi. I gas nobili sono quegli elementi in cui è stato esattamente completato uno strato, ed è particolarmente difficile farli reagire. (Alcuni di essi naturalmente reagiscono, per esempio col fluoro e l’ossigeno; ma tali composti sono debolmente legati; i gas cosiddetti inerti lo sono quasi del tutto.) Un atomo che possieda un elettrone in più o in meno di un gas nobile perderà o acquisterà facilmente un elettrone per porsi nella condizione di particolare stabilità (bassa energia) che proviene dall’avere uno strato completamente riempito; tali elementi sono chimicamente molto attivi e hanno valenza +1 o 1. L’altro caso si presenta in fisica nucleare. Nei nuclei atomici, i protoni e i neutroni interagiscono tra loro molto fortemente. Nonostante ciò, il modello a particelle indipendenti può ancora essere usato per analizzare la struttura nucleare. Dapprima si è trovato sperimentalmente che i nuclei erano particolarmente stabili se contenevano determinati numeri di neutroni, e precisamente 2, 8, 20, 28, 50 e 82. Anche i nuclei che contenevano questi numeri di protoni erano notevolmente stabili. Poiché, inizialmente, non vi erano spiegazioni per questi numeri, essi vennero chiamati «numeri magici» della fisica nucleare. È ben noto che protoni e neutroni interagiscono fortemente gli uni con gli altri; tutti rimasero perciò assai sorpresi quando ci si accorse che un modello a particelle indipendenti poteva predire una struttura a strati che si accordava con i primi numeri magici. In questo modello, si supponeva che ciascun nucleone (protone o neutrone) si muovesse in un potenziale centrale che era creato dall’effetto medio di tutti gli altri nucleoni. Questo modello, tuttavia, non riusciva a fornire i valori corretti per i numeri magici più alti. Venne poi scoperto da Maria Mayer, e indipendentemente da Jensen e dai suoi collaboratori, che, prendendo il modello a particelle indipendenti e aggiungendovi soltanto una correzione relativa alla cosiddetta «interazione di spin-orbita», si poteva costruire un modello migliorato che dava tutti i numeri magici. (L’interazione di spin-orbita fa sì che l’energia di un nucleone sia minore se il suo spin è diretto come il momento angolare che gli deriva dal suo moto nel nucleo.) La teoria dice molte altre cose ancora, la sua descrizione della cosiddetta «struttura a strati» dei nuclei ci permette di predire certe caratteristiche dei nuclei e delle reazioni nucleari. L’approssimazione a particelle indipendenti si è mostrata utile in moltissimi campi, dalla fisica dello stato solido, alla chimica, alla biologia e alla fisica nucleare. È spesso solo un’approssimazione grossolana, ma è in grado di far capire perché vi siano delle condizioni di particolare stabilità, come negli strati. Poiché tutta la complessità delle interazioni tra le particelle individuali viene trascurata, non bisogna sorprendersi se spesso tale approssimazione fallisce completamente nel riprodurre correttamente molti dettagli importanti.
Dipendenza delle ampiezze dalla posizione
16.1
Ampiezze in una dimensione
Ci proponiamo ora di discutere come variano nello spazio le ampiezze di probabilità della meccanica quantistica. In qualcuno dei capitoli precedenti, forse avrete provato la spiacevole sensazione che alcune cose venissero trascurate. Per esempio, quando abbiamo discusso la molecola dell’ammoniaca, abbiamo deciso di descriverla in termini di due stati di base. Uno di questi stati di base era stato scelto come quello che rappresentava la condizione in cui l’atomo di azoto si trovava «al di sopra» del piano dei tre atomi di idrogeno, e l’altro stato di base era quello in cui l’atomo di azoto si trovava «al di sotto» di tale piano. Ma perché scegliere proprio questi due stati? Perché non è possibile che l’atomo di azoto sia a 2 Å al di sopra del piano dei tre atomi di idrogeno, o a 3 Å, o a 4 Å? Certamente, vi sono molte altre posizioni che l’atomo di azoto può occupare. E ancora, quando si è parlato dello ione di idrogeno molecolare, in cui si ha un elettrone condiviso tra due protoni, si sono immaginati due stati di base: uno, in cui l’elettrone è nelle vicinanze del protone numero uno, e l’altro in cui l’elettrone è nelle vicinanze del protone numero due. È chiaro che si sono trascurati molti dettagli. L’elettrone non si trova esattamente dov’è il protone numero due, ma se ne sta solo nei pressi. Può trovarsi un po’ più in alto del protone, oppure un po’ più in basso, un po’ più a sinistra o a destra. Noi abbiamo intenzionalmente evitato di discutere dettagli di questo genere. Abbiamo detto che c’interessavano solo alcuni aspetti del problema e così supponevamo che, quando l’elettrone se ne stava nelle vicinanze del protone numero uno, si trovasse in condizioni abbastanza ben definite. In tali condizioni, la probabilità di trovare l’elettrone intorno al protone aveva anch’essa una distribuzione abbastanza ben definita e i dettagli non ci interessavano. Possiamo anche metterla in un altro modo. Nella nostra discussione dello ione di idrogeno molecolare, si era adottata una descrizione approssimata, rappresentando la situazione per mezzo di due stati di base. In realtà, di questi stati ce ne sono tantissimi. Un elettrone intorno a un protone può trovare una sistemazione nello stato più basso, o fondamentale, ma vi sono anche molti stati eccitati, e in ognuno di questi stati eccitati è diversa la distribuzione dell’elettrone intorno al protone. Noi abbiamo ignorato questi stati eccitati, dicendo che eravamo interessati solo a condizioni di bassa energia. Ma sono proprio questi stati eccitati che rendono possibili varie distribuzioni dell’elettrone intorno al protone. Se si vuole descrivere in dettaglio lo ione di idrogeno molecolare, bisogna tener conto anche di questi altri possibili stati di base. Ciò può essere fatto in diversi modi e uno di questi consiste nel considerare in maggior dettaglio stati in cui la posizione dell’elettrone nello spazio sia descritta con maggior precisione. Siamo ora in grado di prendere in considerazione un procedimento più elaborato che ci permetterà di parlare con maggiori particolari della posizione dell’elettrone, fornendoci un’ampiezza di probabilità di posizione per l’elettrone punto per punto, ovunque e in ogni situazione. Questa teoria più completa fornisce l’impalcatura per le approssimazioni che noi abbiamo fatto nelle nostre precedenti discussioni. In un certo senso, le nostre precedenti equazioni possono essere derivate come una sorta di approssimazione della teoria più completa. Vi potrà meravigliare il fatto che non si sia cominciato subito con la teoria più rigorosa, facendo poi via via le varie approssimazioni. Ci è parso che per voi sarebbe stato più facile acquisire una comprensione del meccanismo che sta alla base della meccanica quantistica, cominciando dalle
16
238
Capitolo 16 • Dipendenza delle ampiezze dalla posizione
© 978-8808-22107-0
approssimazioni in cui si hanno due soli stati ed elaborando poi gradualmente una teoria più rigorosa, che non procedendo in senso inverso. Per questo motivo, il nostro modo di accostarci a questo argomento risulta essere in ordine inverso a quello che si può trovare in molti libri. Via via che ci addentreremo nell’argomento di questo capitolo, vi accorgerete che contravverremo a una regola che avevamo fin qui seguito. Ogniqualvolta si era affrontato un problema, si era sempre cercato di dare una descrizione più o meno completa della fisica del problema stesso, facendovi vedere, per quanto possibile, dove ci conducevano le idee che avevamo introdotto. Si è fin qui cercato di esporre le conseguenze generali di una certa teoria descrivendone però anche alcuni aspetti particolari, per farvi vedere direttamente a quali risultati tale teoria conduce. Ora non ci atterremo più a questa regola. Descriveremo il modo con cui si può trattare la dipendenza spaziale delle ampiezze e le equazioni differenziali che esse soddisfano; ma non avremo il tempo di proseguire e di discutere molte delle implicazioni, anche ovvie, che discendono dalla teoria. In effetti non ci spingeremo nemmeno tanto lontano da collegare questa teoria a quelle formulazioni approssimate che abbiamo usato in precedenza, per esempio nel caso della molecola di idrogeno o di ammoniaca. Una volta tanto, non porteremo le cose fino in fondo ma le lasceremo incompiute. Ci stiamo avvicinando alla fine del corso e dobbiamo ritenerci soddisfatti di avervi dato un’introduzione alle idee generali. Vi mostreremo ora la relazione tra la nostra e alcune delle altre possibili descrizioni della meccanica quantistica. Speriamo di darvi un’idea sufficiente a che voi, leggendo altri libri, possiate imparare da soli quali sono le molte conseguenze delle equazioni che stiamo per spiegarvi. Oltre tutto, bisognerà pure che vi lasci qualcosa da fare in futuro. Cominciamo col riassumere ancora una volta quel che si è trovato sul movimento di un elettrone lungo una catena di atomi. Quando è possibile definire per un elettrone un’ampiezza per passare da un atomo al successivo, si hanno stati con energia definita in cui l’ampiezza di probabilità di presenza dell’elettrone è distribuita lungo il reticolo in forma di un’onda progressiva. Per grandi lunghezze d’onda, cioè per piccoli valori del numero d’onda k, l’energia dello stato è proporzionale al quadrato del numero d’onda. Per un reticolo cristallino con spaziatura b, in cui l’ampiezza di probabilità per unità di tempo corrispondente al salto di un elettrone da un atomo a quello vicino sia i A/~, l’energia dello stato è legata a k (per piccoli kb) da E = Ak 2 b2
(16.1)
(vedi paragrafo 13.2). Si è anche visto che gruppi di onde di questo tipo, con energie vicine l’una all’altra, possono dar luogo a un pacchetto che si comporta come una particella classica, con una massa meff data da: ~2 meff = (16.2) 2Ab2 Poiché le onde delle ampiezze di probabilità si comportano come particelle, ci si può ben aspettare che la descrizione quantistica generale di una particella mostri proprio quel tipo di comportamento ondulatorio che si osserva nei reticoli cristallini. Supponiamo di considerare il caso di un reticolo lineare e immaginiamo di fare sempre più piccola la spaziatura reticolare b. Al limite, finiremo per considerare il caso in cui l’elettrone può trovarsi dovunque lungo la linea. Saremo quindi portati a esaminare il caso di una distribuzione continua di ampiezze di probabilità; e otterremo, in tal modo, l’ampiezza relativa a trovare l’elettrone in un punto qualsiasi della retta. Questo sarebbe un modo di descrivere il moto di un elettrone nel vuoto. In altre parole, se immaginiamo che lo spazio possa essere caratterizzato da un’infinità di punti tutti vicinissimi l’uno all’altro, e se riusciamo a tirar fuori le equazioni che collegano le ampiezze in un punto a quelle nei punti vicini, avremo ottenuto le leggi quantistiche del moto di un elettrone nello spazio. Cominciamo col richiamare alcuni dei principi generali della meccanica quantistica. Supponiamo di avere una particella, per la condizione della quale, all’interno di un sistema quantistico, ci siano varie possibilità. Noi chiameremo «stato» una qualunque delle situazioni in cui l’elettrone può trovarsi, e lo caratterizzeremo con un vettore di stato, per esempio | i. Un’altra situazione sarà caratterizzata da un altro vettore di stato, per esempio | i. Introduciamo poi l’idea degli stati di base. Ammettiamo cioè che esista un insieme di stati | 1i, | 2i, | 3i, | 4i, e così di seguito, che abbiano le seguenti proprietà. Primo, questi stati sono completamente distinti l’uno dall’altro: diciamo che sono ortogonali. Con questo intendiamo che per ogni coppia di stati di base | ii e | ji,
16.1 • Ampiezze in una dimensione
© 978-8808-22107-0
l’ampiezza hi | ji, che dà la probabilità che un elettrone che si trova in effetti nello stato | ii possa venire anche osservato nello stato | ji, è uguale a zero, a meno che, naturalmente, | ii e | ji non rappresentino lo stesso stato. Quanto sopra viene rappresentato simbolicamente da hi | ji =
(16.3)
ij
Ricorderete che i j = 0 quando i e j sono differenti, e che i j = 1 quando i e j sono lo stesso numero. Secondo, gli stati di base | ii devono formare un insieme completo, cosicché, mediante questi, si possa descrivere un qualunque stato arbitrario. Cioè un qualunque stato | i può essere completamente descritto dando tutte le ampiezze hi | i che corrispondono alla probabilità che una particella nello stato | i possa essere trovata anche nello stato | ii. Infatti il vettore di stato | i è uguale alla somma degli stati di base, ciascuno moltiplicato per un coefficiente che è l’ampiezza della stato | i nello stato | ii : X | i= | iihi | i (16.4) i
Infine, se si considerano due stati qualunque | i e | i, l’ampiezza dello stato | i nello stato | i può essere ricavata proiettando dapprima lo stato | i sugli stati di base e poi ciascuno di questi sullo stato | i. Ciò si esprime scrivendo X h | i= h | iihi | i (16.5) i
La somma, naturalmente, deve essere eseguita su tutto l’insieme completo degli stati di base | ii. Nel capitolo 13, quando abbiamo ricavato quello che succede a un elettrone posto in un insieme lineare ordinato di atomi, abbiamo scelto come insieme di stati di base quelli in cui l’elettrone era localizzato presso uno o l’altro degli atomi dell’insieme. Lo stato di base | ni rappresentava la condizione in cui l’elettrone era localizzato in corrispondenza all’atomo numero «n». (Non ha alcun significato, naturalmente, l’aver chiamato i nostri stati | ni invece che | ii.) Poco dopo avevamo trovato conveniente caratterizzare questi stati con la coordinata x n dell’atomo invece che con il numero dell’atomo nella fila. Lo stato | x n i non è altro che un modo diverso di scrivere lo stato | ni. Quindi, secondo le regole generali, un qualsiasi stato, diciamo | i, viene descritto dando le ampiezze di un elettrone nello stato | i in ciascuno degli stati | x n i. Per convenienza, si usa il simbolo Cn per rappresentare queste ampiezze: (16.6)
Cn = hx n | i
Poiché gli stati di base sono associati con una posizione lungo la linea, possiamo pensare l’ampiezza Cn come funzione della coordinata x e scriverla come C(x n ). Le ampiezze C(x n ) varieranno, in generale, con il tempo, e saranno perciò anche funzioni di t. Non ci preoccuperemo in generale di indicare esplicitamente questa dipendenza. Nel capitolo 13 avevamo poi proposto che le ampiezze C(x n ) variassero con il tempo nella maniera descritta dall’equazione hamiltoniana (equazione (13.3)). Nelle nostre nuove notazioni, questa equazione è i~
@C(x n ) = E0 C(x n ) @t
AC(x n + b)
AC(x n
b)
(16.7)
Gli ultimi due termini al secondo membro rappresentano il processo in cui un elettrone arriva sull’atomo n dall’atomo n + 1 o dall’atomo n 1. Avevamo poi trovato che l’equazione (16.7) ammetteva soluzioni corrispondenti a stati con energia definita, che erano stati scritti nella forma C(x n ) = e
iEt/~ ik x n
e
(16.8)
Per gli stati di bassa energia, le lunghezze d’onda sono grandi (k è piccolo), e l’energia è legata a k dalla relazione E = (E0 2A) + Ak 2 b2 (16.9)
239
240
Capitolo 16 • Dipendenza delle ampiezze dalla posizione
© 978-8808-22107-0
oppure, scegliendo lo zero delle energie in modo tale che E0 2A = 0, l’energia è data dall’equazione (16.1). Vediamo un po’ quel che succede se si fa tendere a zero la costante reticolare b, tenendo però fisso il numero d’onda k. Se non si fa in modo che succeda qualcosa d’altro, l’ultimo termine nell’equazione (16.9) tenderebbe semplicemente a zero e tutti gli effetti fisici scomparirebbero. Ma pensate di variare contemporaneamente sia A sia b in modo tale che, quando b tende a zero, il prodotto Ab2 resti costante(1) ; l’equazione (16.2) ci permette allora di esprimere Ab2 per mezzo della costante ~2 /2meff . In tali circostanze, l’equazione (16.9) rimarrebbe inalterata, ma cosa ne sarebbe dell’equazione differenziale (16.7)? Per prima cosa, riscriviamo l’equazione (16.7) nella forma f g @C(x n ) i~ = (E0 2A) C(x n ) + A 2C(x n ) C(x n + b) C(x n b) (16.10) @t Con la nostra scelta di E0 , il primo termine viene eliminato. Possiamo poi immaginare che esista una funzione continua C(x) che, variando con regolarità, assuma il corretto valore C(x n ) a ogni x n . Facendo tendere a zero la distanza b, i punti x n si avvicinano sempre più e (se la variazione di C(x) è sempre molto regolare) la quantità entro parentesi risulta proporzionale alla derivata seconda di C(x). Si può quindi scrivere, come si può vedere sviluppando in serie di Taylor ciascun termine, l’uguaglianza 2C(x)
C(x + b)
C(x
b) ⇡ b2
@ 2 C(x) @ x2
(16.11)
Quindi, nel limite per b che tende a zero, prendendo b2 A uguale a ~2 /2meff , l’equazione (16.7) si trasforma in @C(x) ~2 @ 2 C(x) i~ = (16.12) @t 2meff @ x 2 Abbiamo dunque un’equazione che ci dice che la velocità di variazione di C(x), l’ampiezza di probabilità di trovare l’elettrone in x, dipende dall’ampiezza di probabilità di trovare un elettrone nei punti vicini proporzionalmente alla derivata seconda dell’ampiezza rispetto alla posizione. L’equazione quantistica corretta per il moto di un elettrone nello spazio libero è stata scritta per la prima volta da Schrödinger. Per un moto lungo una retta, essa ha esattamente la forma dell’equazione (16.12) se si sostituisce meff con m, la massa dell’elettrone nello spazio libero. Per il moto lungo una retta nel vuoto, l’equazione di Schrödinger è @C(x) ~2 @ 2 C(x) = (16.13) @t 2m @ x 2 Non abbiamo intenzione di farvi credere di aver dedotto l’equazione di Schrödinger, ma abbiamo soltanto voluto mostrarvi un modo di considerare tale equazione. Quando Schrödinger la scrisse per la prima volta, ne diede una specie di derivazione basata su alcuni argomenti euristici e su brillanti congetture di carattere intuitivo. Alcuni degli argomenti che usò erano addirittura falsi, ma questo non conta; l’unica cosa importante è che l’equazione che alla fine ne risultò fornisce una descrizione corretta della natura. Lo scopo della nostra discussione è dunque semplicemente quello di farvi vedere che l’equazione quantistica fondamentale (16.13) ha proprio la forma che si ottiene nel caso limite di un elettrone che si muova lungo una linea di atomi. Ciò significa che noi possiamo pensare che l’equazione differenziale che compare nella (16.13) descriva la diffusione di un’ampiezza di probabilità da un punto della linea al successivo. Cioè, se l’elettrone ha una data ampiezza di probabilità di trovarsi in un punto, dopo un piccolo intervallo di tempo esso avrà una certa ampiezza di trovarsi in punti contigui. In effetti, questa equazione ricorda un po’ quelle della diffusione che sono state usate nel vol. 1. Qui c’è, tuttavia, una differenza fondamentale: il coefficiente immaginario davanti alla derivata temporale rende il comportamento delle soluzioni completamente differente da quello che si ha nell’ordinaria diffusione, per esempio quella di un gas che esce da un tubo sottile. La diffusione ordinaria dà luogo a soluzioni esponenziali reali, mentre le soluzioni dell’equazione (16.13) sono delle onde complesse. i~
(1)
Si può pensare che via via che i punti x n si avvicinano, l’ampiezza A per saltare da x n+1 a x n aumenti.
16.2 • La funzione d’onda
© 978-8808-22107-0
16.2
La funzione d’onda
Ora che vi siete fatti un’idea di quale sarà l’aspetto della faccenda, ricominciamo da principio e studiamo il problema della descrizione del moto di un elettrone lungo una linea senza dover considerare stati connessi in qualche modo agli atomi di un reticolo. Ricominciamo da principio e vediamo quali concetti dobbiamo usare per descrivere il moto di una particella libera nello spazio. Visto che siamo interessati al comportamento di una particella su una linea continua, avremo a che fare con un numero indefinito di stati possibili e, come vedrete, i concetti che sono stati sviluppati per trattare un numero finito di stati avranno bisogno di alcune modifiche di carattere tecnico. Incominciamo col pensare che il vettore di stato | xi rappresenti uno stato in cui la particella sia localizzata esattamente alla coordinata x. Per ogni valore di x lungo la linea – per esempio 1,73 o 9,67 o 10,00 – vi è uno stato corrispondente. Prenderemo questi stati | xi come i nostri stati di base e, se tutti i punti della linea sono inclusi, si avrà un insieme completo di stati per descrivere il moto in una dimensione. Supponiamo ora di avere uno stato di tipo differente, per esempio | i, che rappresenti un elettrone distribuito in un certo modo lungo la linea. Una maniera di descrivere questo stato è quella di dare tutte le ampiezze di probabilità perché l’elettrone si trovi anche in ciascuno degli stati di base | xi. Bisogna, naturalmente, dare un numero infinito di ampiezze, una per ogni valore di x. Queste ampiezze le indicheremo con hx | i. Ognuna di esse è un numero complesso e, poiché si ha uno di tali numeri complessi per ogni valore di x, l’ampiezza hx | i è in realtà proprio una funzione di x, che scriveremo anche come C(x): C(x) ⌘ hx | i
(16.14)
Ci è già capitato di considerare questo genere di ampiezze che variano con continuità con le coordinate quando abbiamo discusso della variazione dell’ampiezza col tempo nel capitolo 7. Avevamo allora dimostrato, per esempio, che una particella con impulso definito aveva una particolare variazione della sua ampiezza nello spazio. Se una particella ha un impulso definito, p, e corrispondentemente una definita energia E, l’ampiezza di trovarla in un’arbitraria posizione x è del tipo hx | i = C(x) / e+ipx/~ (16.15)
Questa equazione esprime un importante principio generale della meccanica quantistica che connette gli stati di base che corrispondono alle varie differenti posizioni nello spazio a un altro sistema di stati di base, quello degli stati di impulso definito. Gli stati di impulso definito sono spesso più convenienti degli stati in x per certi tipi di problemi. Ciascun sistema di stati di base è, naturalmente, ugualmente accettabile per la descrizione di una situazione quantistica. Ritorneremo in seguito a esaminare la connessione tra loro. Per il momento, vogliamo attenerci alla nostra discussione della descrizione per mezzo degli stati | xi. Prima di procedere oltre, facciamo un piccolo cambiamento di notazione che speriamo non vi confonda troppo le idee. La funzione C(x), definita nell’equazione (16.14), avrà una forma che naturalmente dipenderà dal particolare stato | i che si sta considerando. Vorremmo indicare questo fatto in qualche modo. Per esempio, specificare la funzione C(x) di cui stiamo parlando per mezzo di un indice, cioè come C (x). Per quanto questa sia una notazione del tutto soddisfacente, essa è un po’ pesante e non è quella che troverete nella maggior parte dei libri. Molti tralasciano semplicemente la lettera C e usano il simbolo per definire la funzione (x) ⌘ C (x) = hx | i
(16.16)
Poiché questa è la notazione che tutto il resto del mondo usa, anche voi finirete con l’abituarvici e non vi spaventerete quando la incontrerete di nuovo. Ricordatevi, però, che ora noi useremo in due modi differenti. Nell’equazione (16.14), serve a caratterizzare un particolare stato fisico dell’elettrone. Al primo membro dell’equazione (16.16), d’altra parte, il simbolo viene usato per definire una funzione matematica di x, uguale all’ampiezza da associare a ogni punto x lungo la linea. Speriamo che questo non vi confonda troppo, una volta che vi siete abituati all’idea.
241
242
Capitolo 16 • Dipendenza delle ampiezze dalla posizione
© 978-8808-22107-0
Per inciso, la funzione (x) viene usualmente detta «funzione d’onda»; questo perché ha, nella maggioranza dei casi, la forma di un’onda complessa nelle variabili da cui dipende. Poiché abbiamo definito (x) come l’ampiezza di probabilità che un elettrone nello stato sia osservato nella posizione x, ci piacerebbe interpretare il modulo quadrato di come la probabilità di trovare l’elettrone nella posizione x. Ma, sfortunatamente, la probabilità di trovare una particella esattamente in un certo punto è zero. In generale, l’elettrone verrà a occupare una certa regione della linea e, poiché in ogni più piccola parte di linea vi è un numero infinito di punti, la probabilità che esso si trovi in un punto preciso non può essere un numero finito. Si può solo descrivere la probabilità di trovare un elettrone mediante una distribuzione di probabilità (2) che ci dà la probabilità relativa di trovare un elettrone approssimativamente localizzato nelle varie parti della linea. Indichiamo con prob(x, x) la probabilità di trovare l’elettrone in un piccolo intervallo x, situato nei pressi di x. Pur di scendere a una scala sufficientemente piccola, la probabilità in ogni situazione fisica varia con regolarità da un punto all’altro, di conseguenza la probabilità di trovare l’elettrone in un certo segmentino finito x è proporzionale a x. Possiamo ora modificare le nostre definizioni per tener conto di questo fatto. Possiamo pensare che l’ampiezza hx | i rappresenti una specie di «densità di ampiezza» per tutti gli stati di base | xi in una piccola regione. Poiché la probabilità di trovare l’elettrone in un intervallino x intorno a x è proporzionale a x, scegliamo la nostra definizione di hx | i in maniera tale che valga la seguente relazione: prob(x, x) = |hx | i| 2 x L’ampiezza hx | i è perciò proporzionale all’ampiezza di probabilità che un elettrone nello stato sia trovato nello stato di base x e la costante di proporzionalità è scelta in modo tale che il modulo quadrato dell’ampiezza hx | i dia la densità di probabilità di trovare un elettrone in una piccola zona. In modo equivalente, possiamo scrivere prob(x, x) = | (x)| 2 x
(16.17)
Dobbiamo ora modificare alcune delle nostre precedenti equazioni per renderle compatibili con questa nuova definizione dell’ampiezza di probabilità. Supponiamo di avere un elettrone nello stato | i e di voler conoscere l’ampiezza di probabilità di trovarlo in un differente stato | i che può corrispondere a una condizione di diversa distribuzione dell’elettrone. Trattando un insieme finito di stati discreti, si sarebbe usata l’equazione (16.5). Prima di modificare la nostra definizione di ampiezza, avremmo scritto X h | i= h | xihx | i (16.18) tutti gli x
Se ora entrambe queste ampiezze sono normalizzate allo stesso modo, così come abbiamo prima descritto, allora la somma di tutti gli stati in una piccola regione di x è equivalente alla moltiplicazione per x, e la somma su tutti i valori di x diviene semplicemente un integrale. Con le nostre definizioni modificate, la forma corretta diviene ⌅ h | i= h | xihx | i dx (16.19) tutti gli x
L’ampiezza hx | i è ciò che ora chiamiamo (x) e, in perfetta analogia, rappresenteremo con (x) l’ampiezza hx | i. Ricordando che h | xi è la complessa coniugata di hx | i, possiamo scrivere l’equazione (16.19) come ⌅ ⇤ (x) (x) dx h | i= (16.20) Con le nostre nuove definizioni, tutto si accorda con le formule di prima se si sostituisce sempre il segno di sommatoria con un integrale su x. (2)
Per una discussione delle distribuzioni di probabilità vedi paragrafo 6.4 del vol. 1.
16.3 • Stati di impulso definito
© 978-8808-22107-0
Bisogna menzionare una restrizione a quanto abbiamo detto. Ogni buon insieme di stati di base deve essere completo se si vuole usarlo per un’adeguata descrizione dei fatti. Per un elettrone in moto unidimensionale, in effetti, non è sufficiente specificare soltanto gli stati di base | xi, perché per ciascuno di questi stati l’elettrone può avere lo spin sia su sia giù. Un modo di ottenere un insieme completo è quello di prendere due insiemi di stati in x, uno che si riferisce allo spin su e l’altro allo spin giù. Noi, tuttavia, per il momento, non ci preoccuperemo di queste complicazioni.
16.3
Stati di impulso definito
Supponiamo di avere un elettrone in uno stato | i descritto dall’ampiezza di probabilità hx | i = (x) Sappiamo che questa rappresenta uno stato in cui la posizione dell’elettrone è ripartita lungo la linea con una distribuzione tale che la probabilità di trovare l’elettrone in un piccolo intervallo dx nell’intorno di x è proprio prob(x, dx) = | (x)| 2 dx Cosa si può dire circa l’impulso di questo elettrone? Proviamo a chiederci qual è la probabilità che questo elettrone abbia un impulso p. Cominciamo col calcolarci l’ampiezza di probabilità di trovare lo stato | i in un altro stato | imp pi che definiamo come uno stato con un impulso ben preciso pari a p. Possiamo trovare qual è questa ampiezza facendo uso della nostra equazione fondamentale per la determinazione delle ampiezze, equazione (16.19). Riferendoci allo stato | imp pi ⌅ +1 himp p | i = himp p | xi hx | i dx (16.21) x= 1
Naturalmente, la probabilità di trovare l’elettrone con impulso p dovrà essere data in funzione del modulo quadrato di questa ampiezza. Tuttavia, ci troviamo ancora una volta di fronte a un piccolo problema di normalizzazione. In generale, ci possiamo soltanto chiedere qual è la probabilità di trovare un elettrone con un impulso in un piccolo intervallo dp intorno a p. La probabilità che l’impulso abbia esattamente un certo valore p deve essere zero (a meno che lo stato | i non sia per l’appunto uno stato di impulso definito). Solo se cerchiamo la probabilità di trovare un impulso in un piccolo intervallo dp intorno a p, troveremo un valore finito. Vi sono vari modi di sistemare le normalizzazioni. Ne sceglieremo uno che a nostro parere è il più conveniente, per quanto questo ora possa apparirvi non tanto chiaro. Normalizzeremo le nostre ampiezze in modo tale che la probabilità sia connessa all’ampiezza dalla relazione dp prob(p, dp) = |himp p | i| 2 (16.22) 2⇡~ Con questa definizione, la normalizzazione dell’ampiezza himp p | xi è determinata. L’ampiezza himp p | xi è, naturalmente, la complessa coniugata dell’ampiezza hx | imp pi, che non è altro che quella che abbiamo scritto nell’equazione (16.15). Con la normalizzazione scelta, risulta che la costante di proporzionalità appropriata davanti all’esponenziale è 1. Cioè himp p | xi = hx | imp pi⇤ = e
ipx/~
(16.23)
hx | i dx
(16.24)
L’equazione (16.21) diviene allora himp p | i =
⌅
+1
e
ipx/~
1
Questa equazione, insieme alla (16.22), ci permette di trovare la distribuzione degli impulsi per ogni stato | i.
243
244
Capitolo 16 • Dipendenza delle ampiezze dalla posizione
© 978-8808-22107-0
Consideriamo un esempio particolare – quello in cui un elettrone è localizzato in una certa regione nell’intorno di x = 0. Supponiamo di prendere una funzione d’onda che abbia la forma seguente: 2 2 (x) = K e x /4 (16.25) La distribuzione di probabilità in x per questa funzione d’onda è il suo modulo quadrato, ossia prob(x, dx) = P(x) dx = K 2 e P(x) 0,4
0,3 0,2 0,1 –3σ
–2σ
–σ
0
σ
2σ
3σ
x
16.1 La densità di probabilità per la funzione d’onda dell’equazione (16.25). FIGURA
x 2 /2
2
dx
(16.26)
La funzione densità di probabilità P(x) è la curva gaussiana mostrata in FIGURA 16.1. Il grosso della probabilità è concentrato tra x = + e x = . Si dice che la «semi-larghezza» della curva è . (Più precisamente, è uguale alla radice quadrata dello scarto quadratico medio della coordinata x per una distribuzione di questo tipo.) Noi sceglieremo di solito la costante K in modo che la densità di probabilità P(x) non sia semplicemente proporzionale alla probabilità per unità di lunghezza in x di trovare l’elettrone, ma che abbia anche una scala tale che P(x) x sia uguale alla probabilità di trovare l’elettrone in x nei pressi di x. Si può trovare la costante K che rende possibile ciò imponendo che sia ⌅ +1 P(x) dx = 1 1
poiché la probabilità che l’elettrone venga trovato in un posto qualsiasi deve essere l’unità. Troviamo così ⇣ ⌘ 1/4 K = 2⇡ 2 (Si è fatto uso del fatto che
⌅
+1
t2
e
dt =
p
⇡
1
vedi vol. 1, pag. 423.) Ricaviamoci ora la distribuzione in impulso. Sia (p) l’ampiezza di trovare un elettrone con impulso p: (p) ⌘ himp p | i (16.27) Sostituendo la (16.25) nella (16.24) si ha ⌅ +1 (p) = e
ipx/~
1
L’integrale può anche essere riscritto nella forma ⌅ +1 p 2 2 /~2 Ke e (1/4
· Ke
x 2 /4
2 )(x+2ip
2
dx
2 /~)2
dx
(16.28)
(16.29)
1
Possiamo ora effettuare la sostituzione u=x+ e l’integrale è
⌅
+1
e 1
u 2 /4
2
2ip ~
2
du = 2
p
⇡
(16.30)
(I matematici probabilmente troverebbero da obiettare sulla maniera di ottenerlo, ma il risultato è, non di meno, esatto.) ⇣ ⌘ 1/4 2 2 2 (p) = 8⇡ 2 e p /~ (16.31)
16.4 • Normalizzazione degli stati in x
© 978-8808-22107-0
Abbiamo così ottenuto l’interessante risultato che l’ampiezza come funzione di p ha esattamente la stessa forma matematica dell’ampiezza come funzione di x; solo la larghezza della gaussiana è diversa. Possiamo scrivere quest’ultima come ⌘2 + (p) = * 2 , 2⇡~ -
1/4
e
p 2 /4⌘ 2
dove la semi-larghezza ⌘ della distribuzione in p è legata alla semi-larghezza in x da ~ ⌘= 2
(16.32) della distribuzione (16.33)
Il risultato che abbiamo ottenuto ci dice che, se si diminuisce molto la larghezza della distribuzione in x, rendendo piccolo , ⌘ diventa grande e la distribuzione in p risulta molto allargata. Oppure, inversamente: se si ha una distribuzione stretta in p, essa deve corrispondere a una distribuzione allargata in x. Volendo, si possono considerare ⌘ e come una sorta di misura dell’imprecisione nella determinazione dell’impulso e della posizione dell’elettrone nello stato che stiamo considerando. Indicandole con p e x rispettivamente, l’equazione (16.33) diviene p x=
~ 2
(16.34)
Ciò che è più interessante è che si possa provare che, per ogni altra forma di distribuzioni in x o in p, il prodotto p x non può essere minore del valore qui trovato. La distribuzione gaussiana dà il minimo valore possibile per il prodotto delle larghezze quadratiche medie. In generale, si può dire che ~ p x (16.35) 2 Questa è l’enunciazione quantitativa del principio di indeterminazione di Heisenberg, che avevamo già discusso qualitativamente varie volte in precedenza. Di solito, avevamo fatto uso dell’enunciato approssimato che p x è dello stesso ordine di ~.
16.4
Normalizzazione degli stati in x
Torniamo ora alla discussione delle modifiche delle equazioni fondamentali necessarie quando ci si trova in presenza di un continuo di stati di base. Quando si ha un numero finito di stati discreti, una condizione fondamentale che l’insieme di stati deve soddisfare è hi | ji =
ij
(16.36)
Se una particella si trova in uno degli stati di base, l’ampiezza di probabilità di essere in un altro stato di base è 0. Con un’opportuna scelta della normalizzazione, l’ampiezza hi | ii è stata posta uguale a 1 per definizione. Le due precedenti condizioni sono descritte dall’equazione (16.36). Vogliamo ora vedere come tale relazione debba essere modificata quando si usano come stati di base gli stati | xi di una particella su una linea. Se sappiamo che la particella è in uno degli stati di base | xi, qual è l’ampiezza di probabilità che essa si trovi in un altro stato di base | x 0i? Se x e x 0 sono due differenti posizioni sulla linea, allora l’ampiezza hx | x 0i è certamente 0, ciò che è in accordo con l’equazione (16.36). Ma se x e x 0 sono uguali, l’ampiezza hx | x 0i non sarà 1, a causa del solito vecchio problema di normalizzazione. Per vedere come si debba rattoppare questa faccenda, torniamo all’equazione (16.19), e applichiamo questa equazione al caso particolare in cui lo stato | i è proprio lo stato di base | x 0i. Si ottiene allora ⌅ 0 hx | i = hx 0 | xi (x) dx (16.37)
245
246
Capitolo 16 • Dipendenza delle ampiezze dalla posizione
© 978-8808-22107-0
Ma l’ampiezza hx | i non è altro che ciò che si era indicato con la funzione (x). Allo stesso modo, l’ampiezza hx 0 | i, che si riferisce allo stesso stato | i, è la stessa funzione ma della variabile x 0, cioè (x 0). Possiamo, perciò, riscrivere l’equazione (16.37) nella forma ⌅ 0 (x ) = hx 0 | xi (x) dx (16.38) Questa relazione deve valere per qualsiasi stato | i e, di conseguenza, per qualsiasi arbitraria funzione (x). Questa condizione dovrebbe determinare completamente la natura dell’ampiezza hx | x 0i, che, naturalmente, è semplicemente una funzione che dipende da x e x 0. Il nostro problema è ora quello di trovare una funzione f (x, x 0) tale che, moltiplicandola per (x), e integrandola su tutti i valori di x, dia come risultato proprio la quantità (x 0). Risulta però che non esiste una funzione matematica capace di fare una cosa del genere! O almeno niente di simile a ciò che di solito si indica con «funzione». Supponiamo di scegliere per x 0 il particolare valore 0, e consideriamo l’ampiezza h0 | xi come una certa funzione di x, per esempio f (x). Allora, l’equazione (16.38) si trasforma come segue: ⌅ (0) = f (x) (x) dx (16.39) Che tipo di funzione f (x) potrebbe eventualmente soddisfare questa equazione? Poiché l’integrale non deve dipendere dai valori che (x) assume per valori di x diversi da 0, f (x) deve evidentemente essere zero per tutti i valori di x, eccetto 0. Ma se f (x) è 0 dappertutto, anche l’integrale sarà 0, e l’equazione (16.39) non sarà soddisfatta. Ci troviamo così in una situazione impossibile: vogliamo una funzione che sia 0 dovunque, eccetto che in un punto, e che abbia tuttavia un integrale finito. Visto che non si può trovare una funzione con queste proprietà, la maniera più semplice di uscire dalla difficoltà è quella di asserire che la funzione f (x) è definita dall’equazione (16.39). Cioè f (x) è quella funzione che soddisfa correttamente alla (16.39). Una tale funzione fu inventata per la prima volta da Dirac e porta il suo nome. Noi la indicheremo con (x). Quel che vogliamo dire è semplicemente che la funzione (x) ha la strana proprietà che, sostituita a f (x) nella (16.39), fa sì che sotto integrazione, venga estratto il valore che (x) assume quando x è uguale a 0; e, poiché l’integrale deve essere indipendente da (x) per tutti i valori di x eccetto lo zero, la funzione (x) deve essere 0 ovunque, tranne che in x = 0. In definitiva scriviamo
f(x)
3
h0 | xi = (x) dove (x) è definita da (0) = Notate poi cosa succede se, al posto di ottiene che
2
1
0
x
16.2 Un insieme di funzioni, tutte di area unitaria, che assomigliano sempre più alla δ(x). FIGURA
⌅
(x) (x) dx
(16.40)
(16.41)
nella (16.41), si usa la particolare funzione «1». Si ⌅ 1= (x) dx (16.42)
Cioè, la funzione (x) ha la proprietà di essere 0 ovunque, tranne che in x = 0, ma anche, allo stesso tempo, di avere un integrale finito e pari a uno. Si può immaginare che la funzione (x) sia così fantasticamente infinita in un punto che l’area totale risulti uguale a uno. Un modo di raffigurarsi come sia fatta la funzione di Dirac è quello di immaginare una successione di rettangoli, o di qualsiasi altra funzione che voi preferiate e che abbia un picco, che diventa sempre più stretto e più alto racchiudendo sempre un’area unitaria, come si vede in FIGURA 16.2. L’integrale di questa funzione da 1 a +1 è sempre 1. Moltiplicandola per una qualunque funzione (x) e integrando il prodotto, si ottiene qualcosa che è all’incirca il valore della funzione in x = 0, e l’approssimazione migliora sempre più via via che si scelgono rettangoli sempre più stretti. Volendo, si può concepire la funzione in termini di un processo di limite di questo tipo. L’unica cosa importante tuttavia è che la funzione è definita in modo tale che l’equazione (16.41) valga per tutte le possibili funzioni (x). E questo definisce univocamente la funzione . Le sue proprietà sono di conseguenza quelle che abbiamo descritto.
16.4 • Normalizzazione degli stati in x
© 978-8808-22107-0
Cambiando l’argomento della funzione (x ⌅
da x a x
x 0) = 0
x 0, le corrispondenti relazioni sono x0 , x
x 0) (x) dx = (x 0)
(x
(16.43)
Se nell’equazione (16.38) si fa uso di (x x 0) in luogo dell’ampiezza hx | x 0i, l’equazione risulta soddisfatta. Abbiamo così il risultato che per i nostri stati di base in x, la condizione corrispondente alla (16.36) è hx 0 | xi = (x x 0) (16.44) Abbiamo così completato tutte quelle modifiche delle equazioni fondamentali che si erano rese necessarie per trattare il continuo di stati di base corrispondenti ai punti su una linea. L’estensione al caso a tre dimensioni è del tutto ovvio; per prima cosa si sostituisce la coordinata x con il vettore r. Gli integrali su x vengono sostituiti da integrali su x, y e z. In altre parole, essi diventano degli integrali di volume. E infine, la funzione unidimensionale viene semplicemente sostituita dal prodotto di tre funzioni , una in x, una in y e l’altra in z: (x
x 0) (y
y 0) (z
z 0)
Mettendo insieme tutto quanto, si ottiene questo gruppo di equazioni per le ampiezze di una particella nello spazio in tre dimensioni: ⌅ h | i = h | ri hr | i dV (16.45) hr | i = (r)
(16.46)
hr | i = (r) ⌅ ⇤ (r) (r) dV h | i= hr 0 | ri = (x
x 0) (y
y 0) (z
(16.47) z 0)
(16.48)
Che succede quando si ha a che fare con più di una particella? Vi diremo come ci si destreggia con due particelle e così vedrete facilmente quel che dovrete fare se vi capiterà di doverne trattare un numero maggiore. Supponete che vi siano due particelle, che indicheremo con particella numero 1 e particella numero 2. Quali stati di base si possono usare? Un insieme di stati perfettamente adeguato è quello che può essere descritto dicendo che la particella 1 è in x 1 e la particella 2 è in x 2 , e che scriveremo | x 1, x 2 i. Notate che la prescrizione della posizione di una particella soltanto non definisce uno stato di base. Uno stato di base deve definire la condizione dell’intero sistema. Non si deve pensare che ciascuna particella si muova indipendentemente come un’onda in tre dimensioni. Un qualsiasi stato fisico | i può essere definito dando tutte le ampiezze hx 1, x 2 | i relative a trovare le due particelle in x 1 e x 2 . Questa ampiezza generalizzata è perciò una funzione dei due insiemi di coordinate x 1 e x 2 . Vedete dunque che una tale funzione non è un’onda intesa nel senso di un’oscillazione che si muova in uno spazio a tre dimensioni. E, in generale, non è neppure il semplice prodotto di due onde individuali, una per ciascuna delle due particelle. Essa è piuttosto una specie di onda nello spazio a sei dimensioni definito da x 1 e x 2 . Se, in natura, si presenta il caso di due particelle interagenti, non vi è modo di descrivere ciò che succede a una di esse scrivendo una funzione d’onda per essa soltanto. I famosi paradossi che abbiamo considerato in precedenti capitoli, quando le misure effettuate su una particella si riteneva fossero in grado di dire anche cosa sarebbe successo a un’altra particella o di distruggere un’interferenza, hanno messo nei guai molte persone che cercavano di tener conto della funzione d’onda di una particella soltanto, invece che della funzione d’onda giusta che dipende dalle coordinate di entrambe le particelle. La descrizione completa può essere data in maniera corretta solo per mezzo di funzioni delle coordinate di entrambe le particelle.
247
248
Capitolo 16 • Dipendenza delle ampiezze dalla posizione
16.5
© 978-8808-22107-0
L’equazione di Schrödinger
Finora ci siamo preoccupati soltanto di trovare la descrizione di stati che si riferiscono a un elettrone che possa trovarsi in un punto qualsiasi dello spazio. Ora dobbiamo preoccuparci d’inserire nella nostra descrizione l’aspetto fisico delle varie circostanze che si possono presentare. Come già in precedenza, dobbiamo cercare di vedere come gli stati variano col tempo. Se abbiamo uno stato | i che si trasforma in uno stato | 0i qualche tempo dopo, possiamo descrivere la situazione facendo sì che la funzione d’onda, che è poi l’ampiezza hr | i, sia una funzione del tempo oltre che delle coordinate. Una particella che si trovi in una data situazione può quindi essere descritta da una funzione d’onda dipendente dal tempo (r, t) = (x, y, z, t) Una tale funzione d’onda descrive l’evoluzione degli stati che successivamente si presentano al passare del tempo. Questa, che viene chiamata la «rappresentazione delle coordinate» e che ci dà la proiezione dello stato | i sugli stati di base | ri, in pratica, non è sempre la più conveniente; tuttavia la prenderemo in considerazione per prima. Nel capitolo 8, abbiamo descritto la variazione nel tempo degli stati per mezzo dell’hamiltoniana Hi j . Si è visto che la variazione temporale delle varie ampiezze era espressa tramite l’equazione matriciale dCi X i~ = Hi j C j (16.49) dt j
Questa equazione ci dice che la variazione temporale di ciascuna ampiezza Ci è proporzionale a tutte le altre ampiezze C j , con coefficienti Hi j . Come possiamo immaginarci che appaia l’equazione (16.49) quando si usa l’insieme continuo di stati di base | xi? Per prima cosa, ricordiamoci che l’equazione (16.49) può essere anche scritta nella forma X d i~ hi | i = hi | Hˆ | ji h j | i dt j E ora è chiaro quel che dobbiamo fare. Per la rappresentazione x, ci aspettiamo quindi che sia ⌅ @ hx | i = hx | Hˆ | x 0i hx 0 | i dx 0 (16.50) i~ @t La somma sugli stati di base | ji risulta sostituita da un integrale su x 0. Siccome poi hx | Hˆ | x 0i è una certa funzione di x e di x 0, possiamo anche indicarla con H(x, x 0); essa corrisponde a Hi j nell’equazione (16.49). L’equazione (16.50) è quindi equivalente a ⌅ @ i~ (x) = H(x, x 0) (x 0) dx 0 @t con (16.51) 0 0 H(x, x ) ⌘ hx | Hˆ | x i Secondo l’equazione (16.51), la velocità di variazione di in x dipende dal valore di in tutti gli altri punti x 0; il fattore H(x, x 0) rappresenta l’ampiezza per unità di tempo perché l’elettrone salti da x 0 a x. Risulta, tuttavia, che in natura tale ampiezza è nulla tranne che per i punti x 0 che si trovano assai vicini a x. Ciò significa, come si è visto nell’esempio della catena di atomi all’inizio di questo capitolo, equazione (16.12), che il secondo membro dell’equazione (16.51) può essere espresso completamente per mezzo di e delle derivate di rispetto a x, tutte valutate nella posizione x. Per una particella non soggetta a forze, che si muova liberamente nello spazio, senza essere disturbata, la legge fisica corretta risulta ⌅ ~2 @ 2 (x) H(x, x 0) (x 0) dx 0 = 2m @ x 2
16.5 • L’equazione di Schrödinger
© 978-8808-22107-0
Ma da dove si può tirar fuori questa formula? Da nessun posto. Non è possibile derivarla da niente di quel che sappiamo. Essa è scaturita dalla mente di Schrödinger, che la inventò nello sforzo di trovare un’interpretazione delle osservazioni sperimentali del mondo in cui viviamo. Si può forse ricavare qualche indicazione del perché debba essere così ripensando alla nostra deduzione dell’equazione (16.12), che era stata ricavata dallo studio della propagazione di un elettrone in un cristallo. Ovviamente, le particelle libere non sono molto entusiasmanti. Che succede se la particella risulta soggetta a una forza? Ebbene, se la forza che agisce sulla particella può essere descritta per mezzo di un potenziale scalare V (x), ciò significa che stiamo pensando a forze elettriche, ma non a forze magnetiche, e se ci limitiamo a considerare basse energie, così da ignorare le complicazioni derivanti da moti relativistici, allora l’hamiltoniana che descrive correttamente il mondo reale è ⌅ ~2 @ 2 H(x, x 0) (x 0) dx 0 = (x) + V (x) (x) (16.52) 2m @ x 2 Ancora una volta, si può ottenere una traccia per quanto riguarda l’origine di questa equazione ripensando al moto di un elettrone in un cristallo e vedendo come bisognerebbe modificare le equazioni se l’energia di un elettrone variasse leggermente da una locazione atomica all’altra, cosa che potrebbe avvenire se vi fosse un campo elettrico applicato al cristallo. Allora il termine E0 dell’equazione (16.7) sarebbe leggermente variabile con la posizione, e corrisponderebbe al nuovo termine che è stato aggiunto alla (16.52). (Vi avrà forse meravigliato il fatto che siamo passati direttamente dalla (16.51) alla (16.52), invece di darvi semplicemente l’espressione esatta della funzione H(x, x 0) = hx | Hˆ | x 0i. Lo abbiamo fatto perché H(x, x 0) può essere scritta solo facendo uso di funzioni algebriche fuori dal comune, nonostante l’integrale complessivo che appare al secondo membro dell’equazione (16.51) sia costruito con cose che ben conoscete. Ma se davvero avete questa curiosità, H(x, x 0) può essere scritta nel modo seguente: ~2 2m
H(x, x 0) =
00
(x
x 0) + V (x) (x
x 0)
dove 00 indica la derivata seconda della funzione delta. Questa funzione piuttosto inconsueta può essere sostituita da un operatore differenziale che, per quanto equivalente, è in un certo senso più appropriato: 8 9 > ~2 @ 2 > = (x x 0) H(x, x 0) = < + V (x) > 2m @ x 2 > : ; Noi non faremo uso di queste espressioni e lavoreremo direttamente con quella dell’equazione (16.52).) Se ora usiamo l’espressione dell’equazione (16.52) per l’integrale che compare nella (16.50), otteniamo la seguente equazione differenziale per (x) = hx | i: i~
@ = @t
~2 @ 2 2m @ x 2
(x) + V (x) (x)
(16.53)
È del tutto ovvio quale equazione si debba usare al posto della (16.53) quando si tratta un caso tridimensionale. Gli unici cambiamenti sono che @ 2 /@ x 2 viene sostituito da r2 =
@2 @2 @2 + 2+ 2 2 @x @y @z
e V (x) viene sostituito da V (x, y, z). L’ampiezza (x, y, z) di un elettrone che si muova in un potenziale V (x, y, z) obbedisce all’equazione differenziale i~
@ = @t
~2 2 r +V 2m
(16.54)
Quest’ultima è detta equazione di Schrödinger ed è stata la prima equazione quantistica a essere scoperta. Fu formulata da Schrödinger prima di qualunque altra delle equazioni quantistiche che abbiamo descritto in questo libro.
249
250
Capitolo 16 • Dipendenza delle ampiezze dalla posizione
© 978-8808-22107-0
Noi abbiamo affrontato questo argomento seguendo un cammino completamente differente, ma, storicamente, il grande momento che segnò la nascita della meccanica quantistica si ebbe proprio quando Schrödinger scrisse per la prima volta l’equazione che porta il suo nome, nel 1926. Per molti anni, l’intima struttura atomica della materia era stata un grande mistero. Nessuno era stato in grado di capire cosa tenesse insieme i corpi materiali, come potesse esistere il legame chimico e soprattutto perché gli atomi fossero stabili. Per quanto Bohr fosse riuscito a dare una descrizione del moto di un elettrone nell’interno dell’atomo di idrogeno, che pareva spiegare lo spettro osservato della luce emessa da quest’atomo, le ragioni di tale moto restavano misteriose. La scoperta di Schrödinger delle leggi corrette che regolano il moto degli elettroni su scala atomica fornì una teoria per mezzo della quale era possibile effettuare dei calcoli quantitativi dettagliati e precisi sui fenomeni atomici. In linea di principio, l’equazione di Schrödinger è in grado di spiegare tutti i fenomeni atomici, eccetto quelli connessi al magnetismo e alla relatività. Essa spiega i livelli di energia di un atomo e tutti i fatti relativi al legame chimico. Questo tuttavia è vero solo in linea di principio, poiché la matematica diviene ben presto troppo complicata perché si possano in effetti risolvere esattamente problemi che non siano i più semplici possibili. Solo per gli atomi di idrogeno e di elio sono stati effettuati calcoli molto raffinati. Tuttavia, per mezzo di approssimazioni di vario tipo, alcune delle quali piuttosto grossolane, è possibile giungere a comprendere molti dei fatti relativi ad atomi più complicati e al legame chimico delle molecole. Alcune di queste approssimazioni le avete viste nei capitoli precedenti. L’equazione di Schrödinger, così come l’abbiamo scritta, non tiene per niente conto degli effetti magnetici. È possibile tener conto di tali effetti in maniera approssimata aggiungendo dei nuovi termini all’equazione. Tuttavia, come si è visto nel vol. 2, il magnetismo è essenzialmente un effetto relativistico, e perciò una descrizione corretta del moto di un elettrone in un campo elettromagnetico arbitrario può esser data solo nell’ambito di una precisa teoria relativistica. L’equazione relativistica giusta per un elettrone fu scoperta da Dirac un anno dopo che quella di Schrödinger vide la luce e si presenta in forma completamente diversa. Ma non ci sarà possibile discuterla qui. Prima di procedere a esaminare alcune delle conseguenze dell’equazione di Schrödinger, vogliamo mostrarvi come questa equazione si presenti per un sistema composto da un gran numero di particelle. Non ne faremo poi uso, ma vogliamo ugualmente presentarvela per mettere in luce il fatto che la funzione d’onda non è semplicemente un’onda ordinaria nello spazio, ma è piuttosto una funzione di molte variabili. Se vi sono molte particelle, l’equazione diviene i~
@ (r1, r2, r3, . . . ) X = @t i
~2 2mi
2 2 2 9 8 >
= + V (r1, r2, r3, . . . ) 2 2 > > @ x2 @ y @z i i ; : i
(16.55)
La funzione potenziale V corrisponde a quella che nel caso classico è l’energia potenziale totale di tutte le particelle. Se non vi sono forze esterne che agiscono sulle particelle, la funzione V è semplicemente l’energia elettrostatica d’interazione tra le particelle. Cioè, se la i-esima particella ha una carica Zi qe , la funzione V non è altro che(3) X Zi Z j e2 r i j tutte le
V (r1, r2, r3, . . . ) =
(16.56)
coppie
16.6
Livelli energetici quantizzati
In un prossimo capitolo ci occuperemo in dettaglio di una soluzione dell’equazione di Schrödinger che si riferisce a un esempio particolare. Ora, però, vogliamo farvi vedere l’origine di una delle conseguenze più notevoli dell’equazione di Schrödinger e precisamente del fatto sorprendente che un’equazione differenziale in cui compaiono solo funzioni continue, di variabili spaziali continue, (3)
Usiamo la convenzione stabilita nei precedenti volumi secondo la quale e2 ⌘ qe2 /4⇡✏0 .
251
16.6 • Livelli energetici quantizzati
© 978-8808-22107-0
a(x )
a(x ) V(x )
E
x1
x2
x
V < E
V > E
FIGURA
16.3
x
x
Una buca di potenziale per una particella che si muove
FIGURA
16.4
Forme possibili per la funzione d’onda a(x) per V > E
e per V < E.
lungo l’asse x.
possa dar luogo a effetti quantistici come i livelli energetici discreti degli atomi. Il fatto essenziale da capire è la ragione per cui un elettrone, che sia confinato in una certa regione di spazio da una qualche specie di «buca» di potenziale, debba necessariamente possedere un’energia, facente parte di un ben definito insieme discreto di energie. Supponiamo di considerare un elettrone in un caso unidimensionale, la cui energia potenziale vari con x nel modo descritto dal grafico di FIGURA 16.3. Supporremo che questo potenziale sia statico, cioè che non vari col tempo. Così come si è fatto tante volte in precedenza, cercheremo di trovare delle soluzioni che corrispondano a stati di energia definita, o equivalentemente, di frequenza definita. Proviamo a vedere se funziona una soluzione della forma = a(x) e
iEt/~
(16.57)
Sostituendo questa funzione nell’equazione di Schrödinger, si trova che la funzione a(x) deve soddisfare la seguente equazione differenziale: d2 a(x) 2m f = 2 V (x) dx 2 ~
g E a(x)
(16.58)
Questa equazione ci dice che per ogni x, la derivata seconda di a(x) rispetto a x è proporzionale ad a(x), con il coefficiente di proporzionalità pari a 2m (V ~2
E)
La derivata seconda di a(x) è la velocità di variazione della sua pendenza. Se l’energia potenziale V è maggiore dell’energia della particella E, la velocità di variazione della pendenza di a(x) avrà lo stesso segno di a(x). Ciò significa che la curva di a(x) volgerà la sua concavità in senso opposto all’asse, e avrà, più o meno, lo stesso carattere della funzione esponenziale positiva o negativa, e±x . Questo implica che nella regione a sinistra di x 1 , nella FIGURA 16.3, dove V è maggiore dell’energia E che stiamo considerando, la funzione a(x) si presenterà come una o l’altra delle curve che sono disegnate nella FIGURA 16.4a. Se d’altra parte la funzione potenziale V è minore dell’energia E, la derivata seconda di a(x) rispetto a x ha un segno opposto a quello di a(x) stessa, e la curva di a(x) volgerà la sua concavità verso l’asse x come uno dei tratti di curva che sono disegnati nella FIGURA 16.4b. La soluzione in questa regione ha in ogni tratto all’incirca la forma di una curva sinusoidale. Vediamo ora se ci riesce di costruire graficamente una soluzione per la funzione a(x) che corrisponda a un’energia della particella Ea in presenza del potenziale V mostrato in FIGURA 16.3. Poiché stiamo cercando di descrivere una situazione in cui una particella è legata all’interno
252
Capitolo 16 • Dipendenza delle ampiezze dalla posizione
© 978-8808-22107-0
V(x )
a(x )
Ea
x1
x2
x
a(x ) x1
x1
x2
x
x2
x
FIGURA 16.5 Funzione d’onda relativa all’energia E a che va a zero per x negativi.
16.6 La funzione d’onda a(x) della FIGURA 16.5 continuata oltre x 2 . FIGURA
V(x )
Eb
a(x )
Ea V > Ec x1
x2
x1
x1
x2
16.7 La funzione d’onda a(x) per un’energia E b maggiore di E a .
V > Ec
x
a(x )
FIGURA
V < Ec
x2
x
x
16.8 Funzione d’onda relativa a un’energia E c compresa tra E a ed E b .
FIGURA
di una buca di potenziale, cercheremo delle soluzioni per le quali l’ampiezza dell’onda assuma valori molto piccoli, per x al di fuori della buca di potenziale. Possiamo facilmente immaginare una curva del tipo mostrato in FIGURA 16.5 che tenda a zero per valori negativi grandi di x e cresca dolcemente via via che si avvicina a x 1 . Poiché V è uguale a Ea in x 1 , la curvatura della funzione diviene nulla in questo punto. Tra x 1 e x 2 , la quantità V Ea si mantiene sempre negativa così che la funzione a(x) rivolge sempre la concavità verso l’asse e la curvatura è tanto maggiore quanto maggiore è la differenza tra Ea e V . Se si continua la curva nella regione tra x 1 e x 2 , essa sarà più o meno come quella della FIGURA 16.5. Continuiamo ancora la curva nella regione a destra di x 2 . Qui essa si allontana dall’asse e si tende verso valori positivi grandi, com’è mostrato in FIGURA 16.6. Per il valore scelto dell’energia Ea , la soluzione a(x) aumenta sempre più al crescere di x. Infatti, la sua curvatura cresce essa stessa all’aumentare di x (se, contemporaneamente, il potenziale si mantiene costante). L’ampiezza cresce rapidamente fino a valori enormi. Che significa tutto ciò? Significa semplicemente che la particella non è «legata» dalla buca di potenziale. È enormemente più probabile trovarla fuori della buca che non dentro. Per la soluzione che abbiamo costruito, è assai più probabile
© 978-8808-22107-0
16.6 • Livelli energetici quantizzati
trovare l’elettrone a x = +1 che in qualsiasi altro poE sto. Non siamo quindi riusciti a trovare una soluzione V adatta per una particella legata. Facciamo la prova con un’altra energia, per esempio leggermente maggiore di Ea , diciamo l’energia Eb di FIGURA 16.7. Partendo con le stesse condizioni a si5 nistra, finiamo per trovare la soluzione disegnata nella 4 3 metà inferiore della FIGURA 16.7. Da principio sembra 2 1 che vada meglio, ma poi finisce per essere ugualmente 0 cattiva della soluzione corrispondente a Ea , con l’unix ca differenza che ora a(x) diviene sempre più negativa a(x) all’aumentare del valore di x. Forse questa è la via d’uscita. Visto che il piccolo cambiamento di energia da Ea a Eb ha fatto passare la E0 curva da un lato all’altro dell’asse, può darsi che esista un’energia compresa tra Ea ed Eb tale che la curva tenda a zero per grandi valori di x. In effetti, è proprio così, e la soluzione si presenta come in FIGURA 16.8. Prestate attenzione al fatto che la soluzione che abE1 biamo disegnato nella figura è di tipo assai speciale. Se soltanto alziamo o abbassiamo l’energia di pochissimo, la funzione si trasformerà in una curva simile all’una o all’altra delle curve tratteggiate mostrate in FIGURA 16.8 e non soddisferà più le condizioni neE2 cessarie per descrivere una particella legata. Abbiamo così ricavato il risultato che una particella può essere legata in una buca di potenziale soltanto quando possiede un’energia ben definita. E3 Questo implica che vi sia una sola energia possibile per una particella legata in una buca di potenziale? No. Anche altre energie sono possibili, ma non troppo vicine a Ec . Notate che la funzione d’onda disegnata in FIGURA 16.8 attraversa l’asse quattro volte nella zoE4 na compresa tra x 1 e x 2 . Se scegliessimo un’energia leggermente minore di Ec , otterremmo una soluzione che attraversa l’asse solo tre volte, solo due volte, una volta soltanto, o che non lo attraversa affatto. Le possibili soluzioni sono indicate nella FIGURA 16.9. (Vi possono essere anche altre soluzioni corrispondenti a valori dell’energia maggiori di quelli considerati.) Concludiamo, quindi, che se una particella è legata FIGURA 16.9 La funzione a(x) per i cinque stati legati di energia più bassa. in una buca di potenziale, la sua energia assume solo certi valori particolari, facenti parte di uno spettro discreto di energie. Vedete dunque in qual modo un’equazione differenziale possa descrivere fatti fondamentali della fisica quantistica. Si può notare un altro fatto. Se l’energia E è superiore al massimo della buca di potenziale, non vi sono più soluzioni discrete e tutte le energie sono permesse. Soluzioni di questo tipo corrispondono alla diffusione di particelle libere da parte di una buca di potenziale. Un esempio di tali soluzioni lo abbiamo incontrato quando abbiamo preso in considerazione gli effetti delle impurità atomiche in un cristallo.
253
17
Simmetria e leggi di conservazione
17.1 Ripasso: vol. 1, cap. 52, Simmetria delle leggi fisiche Consultazione: Angular Momentum in Quantum Mechanics, A.R. Edmonds, Princeton University Press, 1957
e p
(a) p
p
Simmetria
Nella fisica classica ci sono alcune grandezze che sono conservate, come l’impulso, l’energia e il momento angolare. Teoremi di conservazione per le grandezze corrispondenti esistono anche in meccanica quantistica. La cosa più bella è che in meccanica quantistica i teoremi di conservazione possono, in un certo senso, essere ricavati da qualcos’altro, mentre in meccanica classica, in pratica, essi sono il punto di partenza. (È possibile, in meccanica classica, fare qualcosa di simile a quanto faremo in meccanica quantistica, ma questo può essere fatto solo a un livello molto avanzato.) In meccanica quantistica, comunque, le leggi di conservazione sono profondamente connesse al principio di sovrapposizione delle ampiezze e alla simmetria dei sistemi fisici per vari tipi di trasformazioni. Questo appunto è l’argomento di questo capitolo. Per quanto noi applicheremo tali idee soprattutto alla conservazione del momento angolare, il punto essenziale è che i teoremi sulla conservazione di ogni genere di quantità sono collegati, in meccanica quantistica, alle proprietà di simmetria del sistema. Cominceremo quindi a studiare il problema delle simmetrie di un sistema. Un esempio assai semplice è lo ione di idrogeno molecolare in cui vi sono due stati (la molecola di ammoniaca andrebbe ugualmente bene). Gli stati di base che avevamo considerato per lo ione di idrogeno molecolare p erano quelli in cui l’elettrone era localizzato, in un caso vicino al protone numero 1 e, nell’altro, vicino al protone numero 2. Tali stati – che erano stati indicati con | 1i e | 2i – sono mostrati ancora una volta in FIGURA 17.1a. e Ora, finché i nuclei sono perfettamente uguali l’uno all’altro, questo sistema fisico presenta una certa simmetria. Cioè, se noi effettuiamo una p riflessione del sistema rispetto al piano posto a metà strada tra i due protoni, intendendo con questo che ogni punto da un lato del piano si sposta nella posizione simmetrica dall’altro lato, ci troviamo nella situazione rappresentata in FIGURA 17.1b. Poiché i protoni sono identici, l’operazione di riflessione cambia | 1i in | 2i e | 2i in | 1i. Indicheremo questa operazione e di riflessione con Pˆ e scriveremo p
Pˆ | 2i = | 1i
(b) e p
p
17.1 Se gli stati |1i e | 2i sono riflessi nel piano P-P, essi vanno negli stati | 2 i e |1i rispettivamente. FIGURA
Pˆ | 1i = | 2i
(17.1)
Il nostro Pˆ è quindi un operatore, nel senso che «fa qualcosa» sugli stati e produce nuovi stati. La cosa interessante è che Pˆ operando su qualsiasi stato produce un altro stato del sistema. ˆ come ogni altro operatore che abbiamo incontrato, ha degli Ma P, elementi di matrice che possono essere descritti per mezzo della consueta ovvia notazione. Cioè P11 = h1 | Pˆ | 1i P12 = h1 | Pˆ | 2i
17.1 • Simmetria
© 978-8808-22107-0
sono gli elementi di matrice che si ottengono moltiplicando Pˆ | 1i e Pˆ | 2i da sinistra per h1 |. Dall’equazione (17.1) ne deriva che essi sono h1 | Pˆ | 1i = P11 = h1 | 2i = 0
(17.2)
h1 | Pˆ | 2i = P12 = h1 | 1i = 1
ˆ rispetto al sistema Procedendo in modo analogo, possiamo ottenere P21 e P22 . La matrice di P, di base | 1i e | 2i, è ! 0 1 P= (17.3) 1 0
Ancora una volta vediamo che le parole operatore e matrice sono, in meccanica quantistica, equivalenti a tutti gli effetti pratici. Vi sono delle lievi differenze tecniche, come per esempio la differenza fra un «numero» e il «simbolo» che lo rappresenta, ma la distinzione è più che altro una pedanteria di cui non dobbiamo preoccuparci. Così, sia che Pˆ definisca una certa operazione, sia che venga in pratica usato per definire invece una matrice di numeri, noi lo chiameremo indifferentemente operatore o matrice. Adesso vogliamo farvi notare un punto in particolare. Noi supporremo che tutto il comportamento fisico che descrive l’intero sistema dello ione molecolare dell’idrogeno sia simmetrico. Non è necessario che lo sia davvero; può dipendere, per esempio, dalla presenza di altre cose che stanno nelle vicinanze dello ione stesso. Ma, se il sistema è simmetrico, allora è certamente vero quanto stiamo per esporre. Immaginiamo di partire a t = 0 con il sistema nello stato | 1i e di trovare dopo un intervallo di tempo t che il sistema si trova in una situazione più complicata, come per esempio in uno stato combinazione lineare dei due stati di base. Ricordatevi che nel capitolo 8, il «far passare un certo periodo di tempo» veniva rappresentato per mezzo della moltiplicazione ˆ Ciò significa che dopo un po’, diciamo 15 s, tanto per essere concreti, il sistema per l’operatore U. p si troverà in uno stato diverso. Per esempio, potrebbe essere per 2/3 parti nello nello stato | 1i e p per i 1/3 parti nello stato | 2i, e si scriverebbe quindi r r 2 1 ˆ | 1i + i | 2i (17.4) | a 15 si = U(15, 0) | 1i = 3 3 Ora ci chiediamo: cosa succede se partiamo con il sistema nello stato simmetrico | 2i e aspettiamo per 15 s nelle stesse condizioni? È chiaro che se tutto è simmetrico, come infatti stiamo supponendo, otterremo lo stato simmetrico di quello della (17.4): r r 2 1 ˆ | a 15 si = U(15, 0) | 2i = | 2i + i | 1i (17.5) 3 3 Le idee che abbiamo esposto sono indicate in maniera schematica in FIGURA 17.2. Perciò se la fisica di un sistema è simmetrica rispetto a un certo piano, e noi ricaviamo qual è il comportamento di un certo particolare stato, conosciamo anche qual è il comportamento che si otterrebbe riflettendo lo stato originale rispetto al piano di simmetria. Cerchiamo ora di dire le stesse cose un po’ più in generale, cioè un po’ più in astratto. Sia Qˆ una qualsiasi di un certo numero di operazioni che è possibile effettuare su di un sistema senza
Prob.
Prob.
Dopo il tempo t
FIGURA
17.2
Dopo il tempo t
In un sistema simmetrico, se un puro stato |1i si evolve come nella parte (a), un puro stato | 2 i si sviluppa come nella parte (b).
255
256
Capitolo 17 • Simmetria e leggi di conservazione
© 978-8808-22107-0
ˆ cioè l’operazione di riflessione, alterarne la fisica. Per esempio, possiamo pensare che Qˆ sia P, rispetto al piano intermedio tra i due atomi della molecola di idrogeno. Oppure, in un sistema con due elettroni potrebbe essere l’operazione di scambio dei due elettroni. Un’altra possibilità, in un sistema a simmetria sferica, sarebbe un’operazione di rotazione dell’intero sistema di un angolo finito intorno a un certo asse; anche questa non cambierebbe la fisica. Naturalmente, di solito si usa una particolare notazione per Qˆ a seconda del caso che si sta trattando. Più specificatamente, in genere indicheremo con Rˆ y (✓) l’operazione di «ruotare il sistema dell’angolo ✓ attorno all’asse y». ˆ invece, indichiamo semplicemente uno qualunque degli operatori che abbiamo descritto Con Q, o un altro qualsiasi che lasci inalterata la situazione fisica di partenza. Consideriamo ancora qualche esempio. Se abbiamo un atomo che non sia sottoposto a campi magnetici esterni né a campi elettrici esterni e se si effettua una rotazione delle coordinate intorno a un asse qualsiasi, si ottiene ancora lo stesso sistema. O ancora, la molecola di ammoniaca è simmetrica per la riflessione rispetto a un piano parallelo a quello dei tre atomi di idrogeno, almeno finché non vi è un campo elettrico. Quando però, c’è un campo elettrico e si fa una riflessione, bisognerebbe cambiare anche il campo elettrico e, di conseguenza, cambia anche il problema fisico. In assenza di campo esterno, tuttavia, la molecola costituisce un sistema simmetrico. Passiamo ora a considerare una situazione di tipo generale. Immaginiamo di partire con lo stato | 1 i e che, prima o poi, sotto certe precise condizioni fisiche, esso si trasformi nello stato | 2 i. Possiamo allora scrivere | 2 i = Uˆ | 1 i (17.6) (Potete per esempio pensare all’equazione (17.4).) Immaginiamo ora di effettuare l’operazione Qˆ sull’intero sistema. Lo stato | 1 i si trasformerà allora nello stato | 10 i, che si può anche scrivere come Qˆ | 1 i. Anche lo stato | 2 i si cambierà nello stato |
0 2i
= Qˆ |
2i
Ma se la fisica del sistema è simmetrica rispetto a Qˆ (non dimenticate il se; questa non è una proprietà generale dei sistemi), ne segue che, trascorso lo stesso tempo, nelle stesse condizioni fisiche, si avrà | 20 i = Uˆ | 10 i (17.7) (Confrontate con l’equazione (17.5).) Ma al posto di | 10 i possiamo scrivere Qˆ | 1 i e al posto di | 20 i possiamo scrivere Qˆ | 2 i, di modo che la (17.7) può essere messa nella forma Qˆ | Sostituendo ora Uˆ |
1i
a|
2i
2i
= Uˆ Qˆ |
1i
(17.8)
– equazione (17.6) – si ottiene Qˆ Uˆ |
1i
= Uˆ Qˆ |
1i
(17.9)
Non è difficile capire il significato di questa formula. Nel caso dello ione idrogeno, ci dice semplicemente che «fare una riflessione rispetto a un certo piano e poi aspettare un certo tempo» – l’espressione al primo membro nella (17.9) – produce gli stessi risultati che «aspettare per un certo tempo e poi effettuare la riflessione» – l’espressione al secondo membro nella (17.9). Queste due operazioni si equivalgono finché U non cambia per effetto della riflessione. Poiché la (17.9) è verificata per qualsiasi stato iniziale | 1 i, in realtà essa è una equazione tra operatori: Qˆ Uˆ = Uˆ Qˆ (17.10) Questo è ciò che volevamo ottenere: una formulazione matematica del concetto di simmetria. Quando l’equazione (17.10) è soddisfatta, diciamo che gli operatori Uˆ e Qˆ commutano. Possiamo dunque definire la «simmetria» come segue: un sistema fisico è simmetrico rispetto all’operazione ˆ l’operazione che esprime il trascorrere del tempo. (Volendo parlare Qˆ quando Qˆ commuta con U, di matrici, basta pensare che il prodotto di due operatori è equivalente al prodotto di matrici, e quindi l’equazione (17.10) vale anche per le matrici Q e U, per un sistema che sia simmetrico rispetto alla trasformazione Q.)
257
17.2 • Simmetria e leggi di conservazione
© 978-8808-22107-0
Fra l’altro, poiché per tempi infinitesimi ✏ si ha Uˆ = 1
ˆ i H✏ ~
dove Hˆ è la solita hamiltoniana (vedi capitolo 8), si vede che se la (17.10) è verificata, vale anche Qˆ Hˆ = Hˆ Qˆ
(17.11)
Perciò, la (17.11) è un’enunciazione matematica delle condizioni di simmetria di un certo sistema ˆ Essa quindi definisce una certa simmetria. fisico rispetto all’operatore Q.
17.2
Simmetria e leggi di conservazione
Prima di passare alle applicazioni dei risultati che abbiamo appena dedotto, vogliamo esaminare ancora un po’ il concetto di simmetria. Immaginiamo di essere in presenza di una situazione ˆ si ottenga molto particolare: una situazione cioè, in cui, dopo aver operato su di uno stato con Q, nuovamente lo stesso stato. Questo è un caso molto speciale, ma noi supporremo che per un certo stato | 0 i accada che | 0i = Qˆ | 0 i sia fisicamente lo stesso stato di | 0 i. Questo vuol dire che | 0i è uguale a | 0 i tranne che per qualche fattore di fase(1) . Come può avvenire una cosa del genere? Supponiamo, per esempio, di avere uno ione H+2 nello stato che avevamo indicato con | Ii(2) . In un tale stato, si ha un’uguale ampiezza di probabilità negli stati di base | 1i e | 2i. Le probabilità sono rappresentate in forma di istogramma in FIGURA 17.3a. Se si opera sullo staˆ questo ribalta lo stato, cambiando | 1i in | 2i e | 2i in | 1i, e si to | Ii con l’operatore di riflessione P, ottengono le probabilità indicate in FIGURA 17.3b. Ma questo è di nuovo proprio lo stato | Ii. Se fossimo partiti dallo stato | IIi, le probabilità prima e Prob. dopo la riflessione sarebbero state ancora le stesse. Vi è, tuttavia, una certa differenza se si considerano le ampiezze. Per lo stato | Ii le ampiezze sono 1 le stesse dopo la riflessione, ma per lo stato | IIi le ampiezze hanno segno opposto. In altre parole, 8 > | 1i + | 2i 9 > = | 2ip+ | 1i = | Ii Pˆ | Ii = Pˆ < > p2 > = 2 : ;
Scrivendo
8 > | 1i | 2i 9 > = | 2ip | 1i = Pˆ | IIi = Pˆ < > p2 > = 2 : ; Pˆ |
0i
= ei |
1/2
0
(17.12)
(a)
| IIi
Prob. 1
0i
1/2
si ha
8 > +1 per lo stato | Ii ei = < > 1 per lo stato | IIi : Consideriamo un altro esempio. Supponiamo di avere un fotone polarizzato con polarizzazione CD che si propaghi nella direzione z. Se si effettua una rotazione intorno all’asse z, l’ampiezza risulta semplicemente moltiplicata
0 (b)
17.3 Lo stato |I i e lo stato Pˆ |I i ottenuto riflettendo |I i nel piano centrale. FIGURA
(1) A proposito, si può dimostrare che Q ˆ è necessariamente un operatore unitario, cioè tale che, se operando su | i dà come risultato | i moltiplicato per un numero, questo numero deve avere la forma e i , con reale. È una cosa molto semplice, e la dimostrazione si basa sulla seguente osservazione. Una qualsiasi operazione del tipo di una riflessione o di una rotazione non fa perdere nessuna delle particelle presenti, e quindi la normalizzazione di | 0 i e di | i deve essere la stessa; tali stati devono quindi differire per un fattore di fase puramente immaginario. (2) Si veda il paragrafo 10.1. In questo paragrafo gli stati | Ii e | IIi sono invertiti rispetto alla trattazione precedente.
258
Capitolo 17 • Simmetria e leggi di conservazione
© 978-8808-22107-0
per ei , dove è l’angolo di rotazione, come noi già sappiamo. Perciò, in questo caso, in cui l’operazione è una rotazione, è proprio uguale all’angolo di rotazione. È ora chiaro che se a un certo istante, diciamo a t = 0, si verifica che un certo operatore Qˆ cambia soltanto la fase di un determinato stato, questo allora rimane vero sempre. In altre parole, se lo stato | 1 i si cambia nello stato | 2 i dopo un certo tempo t, ossia ˆ 0) | U(t,
1i
=|
(17.13)
2i
e se la simmetria del problema è tale che
allora è anche vero che Questo è evidente, poiché
Qˆ |
e se allora
Qˆ |
2i
Qˆ |
1i
= ei |
1i
(17.14)
Qˆ |
2i
= ei |
2i
(17.15)
2i
= Qˆ Uˆ |
1i
= Uˆ Qˆ |
Qˆ |
1i
= ei |
= Uˆ ei |
1i
= ei Uˆ |
1i
1i
1i
= ei |
2i
(Questa catena di uguaglianze segue dalla (17.13) e dalla (17.10) per un sistema simmetrico, dalla (17.14), e dal fatto che un numero come ei commuta con un operatore.) Perciò, in presenza di certe simmetrie, qualcosa che era vera inizialr (a) mente, è vera sempre. Ma questa non è proprio una legge di conservazione? Sì! Essa ci dice che, se considerando lo stato originale e facendo a parte un po’ di conti si scopre che una certa operazione, che è un’operazione y di simmetria del sistema, ha come solo effetto la moltiplicazione per una certa fase, allora sappiamo che la stessa proprietà sarà vera per lo stato finale, cioè che la medesima operazione moltiplicherà anche quest’ultimo x per lo stesso fattore di fase. Questo sarà sempre vero anche se noi non conoscessimo nient’altro circa il meccanismo interno dell’universo che fa passare il sistema dallo stato iniziale allo stato finale. Anche se non ci preoccupiamo di studiare i dettagli del meccanismo che fa sì che un sistema passi da uno stato all’altro, possiamo ugualmente dire che se una z cosa si trova originariamente in uno stato che possiede un certo carattere di simmetria, e se l’hamiltoniana di questa cosa è simmetrica sotto quella r (b) particolare operazione di simmetria, allora lo stato manterrà lo stesso carattere di simmetria per tutti i tempi successivi. Questa è la base di tutte le leggi di conservazione in meccanica quantistica. ˆ Per y Consideriamo un esempio particolare. Ritorniamo all’operatore P. ˆ prima cosa, modifichiamo leggermente la nostra definizione di P. Per Pˆ non considereremo semplicemente una riflessione speculare, perché ciò x –r richiede di specificare il piano in cui pensiamo di porre lo specchio. Vi è un particolare tipo di riflessione che non richiede una tale specificazione. Immaginiamo di ridefinire l’operazione Pˆ in questo modo: per prima cosa fate una riflessione rispetto al piano z, cosicché z vada in z, x rimanga x e ˆ FIGURA 17.4 L’operazione d’inversione, P. y rimanga y; poi ruotate il sistema di 180° intorno all’asse z in modo che x Ciò che si trova nel punto A in (x, y, z) viene spostato nel punto A0 in ( x, y, z). vada in x e y in y. L’intera operazione viene chiamata inversione. Ogni punto viene proiettato attraverso l’origine nella posizione diametralmente opposta. Tutte le coordinate di qualsiasi oggetto sono ribaltate. Useremo ancora il simbolo Pˆ per indicare questa operazione, che è rappresentata in FIGURA 17.4. Essa si presenta un po’ più conveniente di una semplice riflessione, perché non richiede che si specifichi il piano coordinato che viene usato per la riflessione, ma semplicemente il punto che è il centro della simmetria. z
17.2 • Simmetria e leggi di conservazione
© 978-8808-22107-0
Pensiamo ora di avere uno stato | 0 i che, per effetto dell’operazione di inversione, vada in ei | 0 i, cioè | 00 i = Pˆ | 0 i = ei | 0 i (17.16) Supponiamo ora di invertirlo nuovamente. Dopo due inversioni, ci ritroviamo esattamente dove eravamo partiti, nulla è minimamente cambiato. Si deve perciò avere Pˆ | Ma
ˆ Pˆ | P·
0i
0 0i
= Pˆ ei |
Ne segue che
ˆ Pˆ | = P· 0i
0i
=|
= ei Pˆ |
0i
0i
= (ei )2 |
0i
(ei )2 = 1
Perciò, se l’operatore di inversione è un’operazione di simmetria dello stato, si hanno due sole possibilità per ei : ei = ±1
che significa
Pˆ |
0i
=|
0i
o
Pˆ |
0i
=
|
0i
(17.17)
Classicamente, se uno stato è simmetrico per inversione, tale operazione riproduce lo stesso stato. In meccanica quantistica, invece, vi sono due possibilità: ottenere lo stesso stato oppure meno lo stesso stato. Quando otteniamo lo stesso stato, Pˆ | 0 i = | 0 i, diciamo che lo stato | 0 i ha parità pari. Quando il segno viene invertito, di modo che Pˆ | 0 i = | 0 i, diciamo che lo stato ha parità dispari. (L’operatore d’inversione Pˆ si chiama anche operatore di parità.) Lo stato | Ii dello ione H+2 ha parità pari; lo stato | IIi ha parità dispari – vedi equazioni (17.12). Naturalmente vi sono ˆ questi stati non hanno parità definita. degli stati che non sono simmetrici sotto l’operazione P; + Per esempio, nel sistema H2 , lo stato | Ii ha parità pari, lo stato | IIi parità dispari e lo stato | 1i non ha parità definita. Quando noi diciamo che una certa operazione, come l’inversione, viene compiuta «su un sistema fisico» possiamo pensare che ciò venga realizzato in due modi diversi. Possiamo pensare di spostare fisicamente ciò che si trova in r nel punto opposto r, o possiamo pensare di considerare lo stesso sistema da un nuovo riferimento x 0, y 0, z 0 legato al vecchio da x 0 = x, y 0 = y e z 0 = z. Analogamente, quando pensiamo a delle rotazioni, possiamo immaginarci di ruotare materialmente il sistema fisico, oppure di ruotare le coordinate rispetto alle quali misuriamo la posizione del «sistema», mantenendo quest’ultimo fisso nello spazio. In generale, questi due punti di vista sono essenzialmente equivalenti. Per le rotazioni essi sono equivalenti, eccetto che una rotazione del sistema di un angolo ✓ corrisponde a una rotazione degli assi coordinati dell’angolo opposto di ✓. Durante queste lezioni, abbiamo di solito considerato quel che avviene facendo una proiezione su un nuovo sistema di assi. Quel che si ottiene in questo modo è uguale a quello che si otterrebbe lasciando fissi gli assi e ruotando all’indietro il sistema della stessa quantità. Facendo così, i segni degli angoli vengono invertiti(3) . Molte delle leggi della fisica, ma non tutte, rimangono inalterate per una riflessione o per un’inversione delle coordinate. Esse, cioè, sono simmetriche rispetto all’inversione. Le leggi dell’elettrodinamica, per esempio, restano le stesse se cambiamo x in x, y in y e z in z, in tutte le equazioni. Ciò è vero anche per le leggi della gravità e per le interazioni forti della fisica nucleare. Soltanto le interazioni deboli, responsabili del decadimento , non posseggono una tale simmetria. (Abbiamo discusso questo argomento abbastanza dettagliatamente nel cap. 52 del vol. 1) Per ora, lasceremo da parte ogni considerazione sui decadimenti . Quindi, in tutti quei sistemi fisici dove ci si aspetta che i decadimenti non producano effetti apprezzabili – un possibile esempio sarebbe l’emissione di luce da parte di un atomo – l’hamiltoniana Hˆ e l’operatore Pˆ commutano. In tali circostanze, vale la seguente proposizione. Se uno stato ha originariamente parità pari e se si considera la situazione fisica a tempi successivi, esso avrà (3)
In altri libri potrete trovare formule con segni differenti; probabilmente vengono usate definizioni diverse degli angoli.
259
260
Capitolo 17 • Simmetria e leggi di conservazione
© 978-8808-22107-0
sempre parità pari. Per esempio, supponiamo che un atomo che sta per emettere un fotone si trovi in uno stato che sappiamo essere di parità pari. Consideriamo l’intero sistema, compreso il fotone, dopo l’emissione; esso avrà ancora la stessa parità (lo stesso accade se si parte con una parità dispari). Questo principio è detto della conservazione della parità. Vedete quindi come le parole «conservazione della parità» e «simmetria per riflessione» siano strettamente interconnesse in meccanica quantistica. Sebbene fino a pochi anni fa si pensasse che la natura conservasse sempre la parità, ora sappiamo che ciò non è vero. Si è scoperto che tale idea era falsa perché la reazione del decadimento non possiede quella simmetria per inversione che è invece comune alle altre leggi della fisica. Siamo ora in grado di provare un interessante teorema (che è valido fino a quando si trascurano le interazioni deboli): tutti gli stati di energia definita non degeneri devono avere parità definita. Cioè devono avere parità pari o dispari. (Ricordate che abbiamo talvolta incontrato dei sistemi in cui parecchi stati hanno la stessa energia: in tal caso, quegli stati sono detti degeneri. Il nostro teorema non è applicabile a essi.) Per uno stato | 0 i di energia definita, sappiamo che Hˆ |
0i
=E|
(17.18)
0i
dove E è semplicemente un numero e rappresenta l’energia dello stato. Se abbiamo un qualsiasi ˆ che sia operatore di simmetria del sistema, possiamo dimostrare che operatore Q, Qˆ |
0i
= ei |
(17.19)
0i
finché | 0 i sia uno stato non degenere di energia definita. Consideriamo il nuovo stato | 00 i che ˆ Se la situazione fisica è simmetrica, | 0 i deve avere la si ottiene dal precedente operando con Q. 0 stessa energia di | 0 i. Ma noi stiamo trattando una situazione in cui vi è un solo stato con quella energia, cioè | 0 i, e quindi | 00 i deve essere lo stesso stato, cioè può differire solo per una fase. Questo è il ragionamento fisico. Lo stesso salta fuori anche dal nostro formalismo. La definizione di simmetria che abbiamo dato è contenuta nell’equazione (17.10) o nella (17.11) (valide per ogni stato ), Hˆ Qˆ | i = Qˆ Hˆ | i
(17.20)
Ma qui stiamo considerando un solo stato |
0i
che ha un’energia definita, per cui
Hˆ |
0i
=E|
0i
ˆ si ottiene Poiché E è soltanto un numero, che può, se vogliamo, scavalcare Q, Qˆ Hˆ | Perciò
0i
⇣ Hˆ Qˆ |
ˆ | = QE 0i
⌘
0i
= E Qˆ |
⇣ = E Qˆ |
0i
⌘
0i
(17.21)
Quindi | 00 i = Qˆ | 0 i è ancora un’autostato di energia definita di Hˆ e con lo stesso E. Ma nelle nostre ipotesi, vi è uno solo di tali stati; deve perciò essere | 00 i = ei | 0 i. Quello che abbiamo provato è vero per ogni operatore Qˆ che sia un operatore di simmetria del sistema. Pertanto, in una situazione in cui si considerino solo forze elettriche e interazioni forti, e non decadimenti , di modo che la simmetria per inversione sia un’approssimazione legittima, si ha che Pˆ | i = ei | i. Ma abbiamo anche visto che ei deve essere +1 o 1. Perciò ogni stato di energia definita (che non sia degenere) ha parità pari o parità dispari.
17.3
Leggi di conservazione
Passiamo ora a un altro interessante esempio di operazione: una rotazione. Considereremo il caso particolare di un operatore che faccia ruotare un sistema atomico di un angolo intorno all’asse
17.3 • Leggi di conservazione
© 978-8808-22107-0
z. Indicheremo questo operatore(4) con Rˆz ( ). Immagineremo di trovarci in una situazione fisica in cui non si abbiano influenze esterne lungo gli assi x e y. Tutti i campi elettrici o magnetici li supporremo paralleli all’asse z (5) di modo che non vi siano cambiamenti nelle condizioni esterne quando l’intero sistema viene ruotato intorno all’asse z. Per esempio, se abbiamo un atomo nel vuoto e lo ruotiamo di un angolo intorno all’asse z, ci ritroviamo sempre con lo stesso sistema. Ma allora, devono esistere degli stati particolari che hanno la proprietà che una tale operazione produce un nuovo stato uguale a quello originale, moltiplicato per un fattore di fase. Facciamo una piccola parentesi per mostrarvi che quando ciò si verifica, la variazione di fase deve sempre essere proporzionale all’angolo . Supponete di ruotare due volte dell’angolo . Questo è come dire ruotare dell’angolo 2 . Se una rotazione di ha per effetto quello di moltiplicare lo stato | 0 i per una fase ei , cosicché Rˆz ( ) | 0 i = ei | 0 i due di queste rotazioni compiute successivamente moltiplicheranno lo stato per il fattore (ei )2 = = ei2 , visto che Rˆz ( ) Rˆz ( ) |
0i
= Rˆz ( )ei |
0i
= ei Rˆz ( ) |
0i
= ei ei |
0i
La variazione di fase deve essere proporzionale a (6) . Noi ci stiamo quindi occupando di quei particolari stati | 0 i per cui Rˆz ( ) | 0 i = eim | 0 i (17.22) dove m è un numero reale. Noi siamo anche a conoscenza del fatto notevole che se il sistema è simmetrico per una rotazione intorno a z e se lo stato originale è uno di quelli che hanno la proprietà di soddisfare la (17.22), allora conserverà nel tempo tale proprietà. Perciò il numero m è assai importante. Se ne conosciamo il valore inizialmente, lo conosciamo anche quando tutto il gioco è arrivato alla fine. È un numero che è conservato; m è una costante del moto. La ragione per cui abbiamo tirato fuori m è che esso non ha niente a che fare con un particolare angolo e anche perché corrisponde a una quantità classica. In meccanica quantistica, noi stabiliamo di chiamare la quantità m~ momento angolare intorno all’asse z, almeno per gli stati del tipo di | 0 i. Così facendo troviamo che, al limite in cui il sistema presenta dimensioni grandi, questa stessa quantità è uguale alla componente z del momento angolare della meccanica classica. Perciò se abbiamo uno stato per cui una rotazione intorno all’asse z ha per effetto soltanto la comparsa di un fattore di fase eim , allora noi abbiamo uno stato il cui momento angolare rispetto a tale asse è definito, e il momento angolare è conservato. Esso è pari a m~ ora e per sempre. Naturalmente è possibile compiere delle rotazioni intorno a un asse qualsiasi, e in tal modo si ottiene la conservazione del momento angolare rispetto ai vari assi. Vedete quindi come la conservazione del momento angolare sia collegata al fatto che, quando si ruota un certo sistema, si ottiene ancora lo stesso stato con solo un fattore di fase in più. Vogliamo ora mostrarvi come questo concetto sia del tutto generale. Perciò lo applicheremo a due altre leggi di conservazione che, per quanto riguarda le idee fisiche di base, hanno una perfetta corrispondenza con la conservazione del momento angolare. In fisica classica si ha la conservazione dell’impulso e dell’energia ed è interessante vedere come entrambe queste leggi siano collegate in qualche modo a delle simmetrie di tipo fisico. Pensiamo di avere un sistema fisico, un atomo, un nucleo complicato, una molecola, o qualcos’altro, e che non faccia alcuna differenza se questo sistema venga preso e spostato in un’altra posizione. Noi abbiamo quindi un’hamiltoniana che ha la proprietà di dipendere in un certo senso soltanto dalle coordinate interne e che non dipende invece dalla posizione assoluta nello spazio. In queste circostanze vi è (4) Più precisamente, definiremo R ˆ z ( ) come una rotazione del sistema fisico di intorno all’asse z, ciò che equivale a ruotare di + il sistema di coordinate. (5) Possiamo sempre scegliere z lungo la direzione del campo, purché vi sia un solo campo alla volta, e la sua direzione non cambi. (6) Per dare una dimostrazione più raffinata, dovremmo fare questi ragionamenti per piccole rotazioni ✏ . Poiché ogni angolo è la somma di un opportuno numero n di queste ultime, = n✏ , Rˆ z ( ) = [ Rˆ z (✏ )] n e la variazione totale di fase è n volte quella corrispondente a un piccolo angolo ✏ , ed è, perciò, proporzionale a .
261
262
Capitolo 17 • Simmetria e leggi di conservazione
© 978-8808-22107-0
una speciale operazione di simmetria che noi possiamo effettuare, cioè una traslazione spaziale. Definiamo Dˆ x (a) come l’operazione che corrisponde a uno spostamento pari alla distanza a lungo l’asse x. Quindi, per ogni stato, noi possiamo compiere questa operazione e ottenere un nuovo stato. Ma ancora una volta vi sono degli stati speciali che hanno la proprietà che, spostandoli di a lungo l’asse delle x, rimangono gli stessi a parte un fattore di fase. È anche possibile dimostrare, allo stesso modo di prima, che se questo avviene, la fase deve essere proporzionale ad a. Perciò possiamo scrivere per questi particolari stati Dˆ x (a) |
0i
= eik a |
0i
(17.23)
Il coefficiente k, moltiplicato per ~, viene detto componente x dell’impulso. E la ragione di questo nome è che questo numero coincide esattamente con l’impulso classico px quando si ha un sistema di grandi dimensioni. La proposizione generale è: se l’hamiltoniana resta inalterata quando il sistema viene spostato, e se lo stato inizialmente aveva un impulso definito nella direzione x, allora l’impulso in tale direzione rimarrà costante nel tempo. L’impulso totale di un sistema prima e dopo una collisione, o dopo un’esplosione o qualunque altra cosa, sarà sempre lo stesso. Vi è un’altra operazione che è del tutto analoga allo spostamento spaziale: un ritardo di tempo. Immaginate di avere una situazione fisica in cui non vi sia alcun fattore esterno che dipenda dal tempo, e che in un certo istante si faccia partire qualcosa in un certo stato e che la si lasci poi andare. Se ora noi facessimo partire la stessa cosa (in un’altra esperienza) due minuti dopo, oppure con un ritardo diciamo ⌧, e se nulla nelle condizioni esterne dipende dal valore assoluto del tempo, il successivo sviluppo sarebbe uguale e lo stato finale sarebbe lo stesso che nell’altro caso, a parte il fatto che esso sarebbe raggiunto a un tempo successivo ritardato di ⌧. Anche in queste circostanze, possiamo trovare degli stati particolari il cui sviluppo temporale presenta la caratteristica che lo stato ritardato è uguale al precedente moltiplicato per un fattore di fase. Ancora una volta è chiaro che per questi particolari stati la variazione di fase deve essere proporzionale a ⌧. Possiamo scrivere Dˆ t (⌧) |
0i
=e
i!⌧
|
0i
(17.24)
Convenzionalmente si usa il segno negativo nella definizione di !; con tale convenzione !~ è l’energia del sistema, ed essa è conservata. Perciò un sistema di energia definita è tale che quando subisce uno spostamento nel tempo, esso viene riprodotto moltiplicato per e i!⌧ . (Questo è proprio quel che abbiamo detto in precedenza quando abbiamo definito uno stato quantistico con una ben precisa energia, e perciò siamo in accordo con noi stessi.) Ciò significa che se un sistema è in uno stato di definita energia e se l’hamiltoniana non dipende da t, allora, qualunque cosa succeda, il sistema avrà sempre la stessa energia per tutti i tempi successivi. Vedete, perciò, qual è la relazione fra le leggi di conservazione e la simmetria della natura. La simmetria rispetto alle traslazioni temporali implica la conservazione dell’energia; la simmetria rispetto alla posizione in x, y o z implica la conservazione di quella certa componente dell’impulso. La simmetria rispetto alle rotazioni intorno agli assi x, y o z implica la conservazione delle componenti x, y o z del momento angolare. La simmetria rispetto a riflessioni implica la conservazione della parità. La simmetria rispetto allo scambio di due elettroni implica la conservazione di qualcosa a cui non abbiamo dato un nome e così via. Alcuni di questi principi hanno un analogo classico mentre altri no. Vi sono più leggi di conservazione in meccanica quantistica di quelle che hanno una qualche utilità in meccanica classica; o almeno di quelle di cui si fa abitualmente uso. Per mettervi in condizione di leggere altri libri di meccanica quantistica, dobbiamo fare una breve digressione tecnica, per descrivere le notazioni che di solito viene usata. L’operazione di traslazione temporale è naturalmente proprio l’operazione Uˆ di cui si è parlato prima: ˆ + ⌧, t) Dˆ t (⌧) = U(t
(17.25)
Molti preferiscono sempre trattare tutto per mezzo di spostamenti temporali infinitesimi, di traslazioni spaziali infinitesime o di rotazioni di angoli infinitesimi. Poiché ogni angolo o spostamento
17.4 • Luce polarizzata
© 978-8808-22107-0
finito può essere costruito accumulando una successione di spostamenti o angoli infinitesimi, risulta spesso più facile analizzare dapprima il caso infinitesimo. L’operatore per uno spostamento temporale infinitesimo t è, così come lo abbiamo definito nel capitolo 8, i t Hˆ ~
Dˆ t ( t) = 1
(17.26)
Perciò, Hˆ è analogo alla quantità classica che chiamiamo energia, perché se Hˆ | i risulta pari a una costante per | i, cioè Hˆ | i = E | i, allora tale costante è l’energia del sistema. La stessa cosa avviene anche per le altre operazioni. Se noi effettuiamo un piccolo spostamento nella direzione x, per esempio della quantità x, uno stato | i si trasformerà, in generale, in un altro stato | 0i. Possiamo scrivere ! i 0 ˆ | i = D x ( x) | i = 1 + pˆx x | i (17.27) ~ poiché quando x va a zero, | 0i deve diventare esattamente | i, ossia Dˆ x (0) = 1, e per piccoli x la variazione di Dˆ x ( x) da 1 deve essere proporzionale a x. L’operatore pˆx , definito in tal modo, è detto operatore dell’impulso, relativo alla componente x, naturalmente. Per identici motivi, di solito si scrive per piccole rotazioni ! i Rˆz ( ) | i = 1 + Jˆz | i (17.28) ~ e Jˆx è detto operatore della componente z del momento angolare. Per quei particolari stati per i quali Rˆz ( ) | 0 i = eim | 0 i per ogni piccolo angolo ottenendo così
, possiamo sviluppare il primo membro fino al primo ordine in Rˆz (
)|
0i
= eim
|
0i
= (1 + im
)|
,
0i
Confrontando questa con la definizione di Jˆz dell’equazione (17.28), ricaviamo che Jˆz |
0i
= m~ |
0i
(17.29)
In altre parole, se si opera con Jˆz su di uno stato di momento angolare definito rispetto all’asse z si ottiene m~ per lo stesso stato, dove m~ è il valore della componente z del momento angolare. È del tutto analogo a operare con Hˆ su di uno stato d’energia definita per ottenere E | i. Vogliamo ora farvi vedere alcune applicazioni del concetto della conservazione del momento angolare perché vi rendiate conto di come funziona. La cosa importante è che si tratta in realtà di un concetto assai semplice. Voi già sapevate che il momento angolare è conservato. L’unica cosa che, in pratica, dovete ricordare di questo capitolo è che se uno stato | 0 i ha la proprietà di cambiarsi in eim | 0 i per una rotazione di un angolo intorno all’asse z, allora ha una componente z del momento angolare pari a m~. Questo è tutto ciò di cui abbiamo bisogno per fare un certo numero di cose interessanti.
17.4
Luce polarizzata
Prima di tutto controlliamo uno dei nostri concetti. Nel paragrafo 11.4 abbiamo dimostrato che quando si osserva una luce con polarizzazione CD, in un sistema di riferimento ruotato dell’angolo intorno all’asse z (7) , essa risulta moltiplicata per ei . Forse questo fatto indica che i fotoni di luce che sono polarizzati circolarmente in senso destrogiro trasportano un momento angolare (7)
Scusateci! Questo angolo è l’opposto di quello usato nel paragrafo 11.4.
263
264
Capitolo 17 • Simmetria e leggi di conservazione
© 978-8808-22107-0
di una unità(8) lungo l’asse z? In effetti è proprio così. E questo significa anche che se si ha un fascio di luce contenente un gran numero di fotoni, tutti polarizzati circolarmente allo stesso modo, come nel caso di un fascio di luce descritto classicamente, questo trasporterà del momento angolare. Se l’energia totale trasportata dal fascio in un certo intervallo di tempo è W , il numero dei fotoni è N = W /~!. Ciascuno di questi trasporta un momento angolare pari a ~, perciò il momento angolare totale è W Jz = N~ = (17.30) ! È possibile dimostrare classicamente che la luce polarizzata circolarmente y in senso destrogiro trasporta un’energia e un momento angolare in proporzione a W /!? Questo dovrebbe essere un risultato classico, se tutto quel che fin qui abbiamo detto è giusto. Siamo qui di fronte a un caso in cui è possibile passare da un caso quantistico a uno classico. Staremo a vedere se la fisica classica conferma le nostre idee, e se abbiamo diritto a chiamare momento angolare la quantità m. Ricordatevi, prima di tutto, cosa s’intende classicamente per luce polarizzata. Essa viene descritta da un campo elettrico che ha componenti secondo x e y, oscillanti con uno x sfasamento di 90°, di modo che il vettore campo elettrico risultante E si muova in cerchio come indica la FIGURA 17.5a. Immaginiamo ora che la luce illumini una parete capace di assorbirla, o di assorbirne almeno una parte, e consideriamo un atomo della parete, trattandolo secondo lo schema della fisica classica. Spesso abbiamo descritto il moto di un elettrone in un atomo come quello di un oscillatore armonico che può essere messo in oscillazione da un campo elettrico esterno. Supporremo che l’atomo sia y isotropo, di modo che possa oscillare ugualmente bene sia in direzione x sia in direzione y. Perciò, con una luce polarizzata circolarmente, gli spostamenti lungo x e lungo y sono gli stessi, ma uno ritarda rispetto alElettrone l’altro di 90°. Il risultato finale è che l’elettrone si muove in circolo, come r si vede in FIGURA 17.5b. L’elettrone risulta spostato a una certa distanza r x dalla sua posizione di equilibrio nell’origine e ruota con un certo ritardo di fase rispetto al vettore E. Per esempio, i vettori E e r potrebbero stare tra loro come in FIGURA 17.5b. Al passare del tempo, il campo elettrico e il vettore di spostamento ruotano con la stessa frequenza, così che la loro orientazione relativa rimane sempre la stessa. Consideriamo ora qual è il lavoro che viene compiuto su questo elettrone. L’energia per unità di tempo FIGURA 17.5 (a) Il campo elettrico E in un’onda che viene ceduta all’elettrone è pari a v, la sua velocità, moltiplicata per la luminosa polarizzata circolarmente. (b) Il moto di un elettrone dovuto alla luce polarizzata circolarmente. componente di qE parallela alla velocità: dW = qEt v dt
(17.31)
Ma notate che vi è anche momento angolare ceduto all’elettrone, perché vi è sempre una coppia rispetto all’origine. Il momento di tale coppia è qEt r, ed esso deve uguagliare la variazione per unità di tempo del momento angolare dJz /dt: d Jz = qEt r dt
(17.32)
Ricordando che v = !r, si ha
d Jz 1 = dW ! Perciò, integrando per ottenere il momento angolare totale assorbito, si ottiene che esso è proporzionale all’energia totale, e la costante di proporzionalità è 1/!, in accordo con l’equazione (8)
È spesso molto conveniente misurare il momento angolare di un sistema atomico in unità ~. E si può allora dire che una particella a spin un mezzo ha un momento angolare ±1/2 rispetto a un asse qualsiasi. Oppure, in generale, che la componente del momento angolare è m. Non è necessario ripetere tutte le volte ~.
17.5 • La disintegrazione della particella Λ0
© 978-8808-22107-0
(17.30). La luce trasporta momento angolare: l unità (moltiplicata per ~) se la luce è polarizzata in senso destrogiro lungo l’asse z, e 1 unità, sempre lungo z, se è polarizzata in senso levogiro. Poniamoci ora la seguente domanda: qual è il momento angolare della luce polarizzata linearmente in direzione x? Un tale tipo di luce può essere rappresentato come una sovrapposizione di luce con polarizzazioni CD e CL. Perciò, vi è una certa ampiezza di probabilità che il momento angolare sia +~ e un’altra ampiezza che sia ~ e, di conseguenza, questa luce non ha un momento angolare definito. Essa ha una certa ampiezza di probabilità che esso sia +~ e un’uguale ampiezza che sia ~. L’interferenza di queste due ampiezze produce la polarizzazione lineare, ma il momento angolare può risultare con uguale probabilità pari a più o meno un’unità. Misure macroscopiche eseguite su un fascio di luce polarizzata linearmente dimostrerebbero che tale fascio non trasporta momento angolare, poiché, fra tanti fotoni, ce ne sono circa in ugual numero con polarizzazioni CD e CL, che contribuiscono al totale in senso opposto, facendo sí che il momento angolare medio sia nullo. Nella teoria classica, non vi è traccia di momento angolare se non in presenza di polarizzazione circolare. Abbiamo detto che una particella di spin uno può avere tre valori di Jz , cioè +1, 0 e 1 (i tre stati che vengono rivelati da un esperimento di Stern-Gerlach). Ma la luce è bizzarra: ha soltanto due stati. Non presenta il caso zero. Questa strana mancanza è dovuta al fatto che la luce non può starsene ferma. Per una particella di spin j che sia in quiete, ci debbono essere 2 j + 1 possibili stati con valori di Jz che vanno di unità in un’unità da j a + j. Ma risulta che per qualcosa che abbia spin j e massa zero esistono solo gli stati con componenti + j e j lungo la direzione di moto. Per esempio, la luce non ha tre stati, ma solo due, nonostante il fotone sia sempre un oggetto di spin uno. Ma come si accorda questo con le dimostrazioni che abbiamo dato in precedenza su ciò che succede quando si effettuano delle rotazioni spaziali, che stabilivano che per particelle di spin uno erano necessari i tre stati? Per una particella in quiete, si possono fare rotazioni intorno a un qualsiasi asse senza alterare lo stato d’impulso. Le particelle che hanno massa a riposo nulla (come i fotoni o i neutrini) non possono essere in quiete; solo le rotazioni intorno all’asse lungo la direzione di moto non cambiano lo stato d’impulso. I ragionamenti che si possono fare sulle rotazioni intorno a un solo asse non sono sufficienti a dimostrare che sono necessari tre stati, dato che uno di essi varia come ei per rotazioni di un angolo (9) . Ancora un’osservazione collaterale. Per una particella di massa a riposo nulla si ha, in generale, che solo uno dei due stati di spin rispetto alla direzione di moto (+ j, j) è veramente necessario. Per i neutrini, che sono particelle di spin un mezzo, esistono in natura solo gli stati con la componente del momento angolare opposta alla direzione di moto ~/2 (e per gli antineutrini solo quelli con la componente lungo il moto +~/2). Quando un sistema possiede una simmetria per inversione (di modo che la parità è conservata, come per la luce) sono invece necessarie entrambe le componenti + j e j.
17.5
La disintegrazione della particella Λ0
Vogliamo ora dare un esempio dell’uso del teorema di conservazione del momento angolare in uno specifico problema fisico quantistico. Consideriamo il decadimento di una particella lambda (⇤0 ), che si disintegra in un protone e in un mesone ⇡ per effetto di un’interazione «debole»: ⇤0 ! p + ⇡ Immaginiamo di sapere che il pione ha spin zero, che il protone ha spin un mezzo e che la particella ⇤0 ha spin un mezzo. Vogliamo ora risolvere il seguente problema. Supponiamo che la ⇤0 possa venir prodotta in modo tale da essere completamente polarizzata, col che intendiamo (9) Abbiamo cercato di trovare almeno una dimostrazione che la componente del momento angolare lungo la direzione del moto per una particella di massa zero deve essere un multiplo intero di ~/2, e non qualcosa come ~/3. Ma anche usando tutte le proprietà delle trasformazioni di Lorentz, o chissà che, non ci siamo riusciti. Può essere che non sia vero. Bisognerà che ne parliamo col Professor Wigner che sa tutto su queste cose.
265
266
Capitolo 17 • Simmetria e leggi di conservazione
© 978-8808-22107-0
che il suo spin è, per esempio, «su» rispetto a un asse z opportunamente scelto, come si vede in FIGURA 17.6a. Si chiede con quale probabilità tale particella si disintegrerà in modo che il protone si allontani formando un angolo ✓ rispetto all’asse z come in FIGURA 17.6b. p In altre parole, qual è la distribuzione angolare dei prodotti di disintegrazione? Esamineremo i decadimenti vp nel sistema di coordinate in cui la ⇤0 si trova in quiete e quindi misureremo gli angoli in tale sistema: le loro espressioni potranno poi essere sempre trasformate in quelle di un altro sistema, se lo vogliamo. Cominiciamo col considerare il caso particolare (a) (b) in cui il protone viene emesso in un piccolo angolo solido ⌦ lungo l’asse z (FIGURA 17.7). Prima della 0 disintegrazione, abbiamo una ⇤0 con lo spin «su» nella FIGURA 17.6 Una particella Λ con lo spin «su» decade in un protone e un pione (nel sistema del centro di massa). Con quale probabilità il protone FIGURA 17.7a. Dopo un piccolo intervallo di tempo, verrà emesso nell’angolo ✓ ? per ragioni a tutt’oggi sconosciute, a parte il fatto che esse sono collegate ai decadimenti deboli, la ⇤0 esplode dando luogo a un protone e un pione. Supponiamo che il protone si allontani lungo l’asse +z. Di conseguenza, per la conservazione dell’impulso, il pione deve andare verso il basso. Poiché il protone è una particella a spin un mezzo, il suo spin deve essere «su» oppure «giù», e vi sono in linea di principio le due possibilità che sono mostrate nelle FIGURE 17.7b e 17.7c. Tuttavia, la conservazione del momento angolare richiede che il protone abbia spin «su». Questo lo si può vedere molto semplicemente col seguente ragionamento. Una particella che si muova lungo l’asse z non può portare alcun contributo al momento angolare lungo tale asse per effetto del suo moto; perciò, solo gli spin possono contribuire a Jz . Il momento angolare di spin lungo l’asse z è +~/2 prima della disintegrazione, perciò deve essere +~/2 anche dopo. Possiamo quindi dire, visto che il pione non ha spin, che lo spin del protone deve essere «su». Se vi preoccupate del fatto che simili ragionamenti possano non essere validi in meccanica quantistica, possiamo anche perdere un po’ di tempo per farvi vedere che invece lo sono. Lo stato iniziale (prima della disintegrazione), che indichiamo con | ⇤0, spin +zi ha la proprietà di venire moltiplicato per il fattore di fase ei /2 quando subisce una rotazione di un angolo intorno all’asse z. (Nel sistema ruotato, il vettore di stato è ei /2 | ⇤0, spin +zi.) Questo è ciò che intendiamo per spin «su» nel caso di una particella a spin un mezzo. Poiché il comportamento Prima z
Dopo z
Prima
Dopo
z
Prima
z
z
p
p
FIGURA
(a)
z p
vp
vp
vp
o
o
17.8
Decadimento lungo l’asse z di una Λ0 con lo spin «giù».
z p
vp FIGURA 17.7 Due possibilità per il decadimento di una Λ0 con lo spin «su» con il protone emesso lungo l’asse +z. Soltanto (b) conserva il momento angolare.
Dopo
z
Sì
No
(b)
(c)
(a)
No
Sì
(b)
(c)
© 978-8808-22107-0
17.5 • La disintegrazione della particella Λ0
della natura non dipende dalla nostra scelta degli assi, lo stato finale (protone più pione) deve avere la stessa proprietà. Possiamo scrivere lo stato finale per esempio nella forma | protone in moto lungo +z, spin +z; pione in moto lungo zi Ma, in realtà, non abbiamo bisogno di specificare il moto del pione, poiché nel sistema che abbiamo scelto il pione si muove sempre nella direzione opposta al protone; possiamo perciò semplificare la nostra descrizione dello stato finale come segue: | protone in moto lungo +z, spin +zi Che cosa succede ora di questo vettore di stato se si ruota il sistema di coordinate di un angolo intorno all’asse z? Poiché il protone e il pione si muovono lungo l’asse z, il loro moto non viene alterato per effetto della rotazione. (Ecco perché abbiamo scelto questo caso particolare; in caso contrario, non avremmo potuto fare questo ragionamento.) Inoltre, nulla succede al pione, poiché ha spin zero. Il protone, però, ha spin un mezzo. Se il suo spin è rivolto in «su» si avrà una variazione di fase di ei /2 come risultato della rotazione. (Se il suo spin fosse rivolto in «giù» il cambiamento di fase relativo al protone sarebbe e i /2 .) Ma la variazione di fase connessa con la rotazione deve essere la stessa prima e dopo l’eccitazione del processo di disintegrazione, se il momento angolare deve essere conservato. (E lo sarà senz’altro perché non vi sono influenze esterne sull’hamiltoniana.) Perciò l’unica possibilità è che lo spin del protone sia «su». Se il protone va in su, anche il suo spin deve essere in «su». Perciò concludiamo che la conservazione del momento angolare permette il processo mostrato nella FIGURA 17.7b, ma non quello mostrato nella FIGURA 17.7c. Poiché sappiamo che la disintegrazione effettivamente avviene, ci deve essere una certa ampiezza di probabilità per il processo nella FIGURA 17.7b, quello con il protone con lo spin «su». Indicheremo con a l’ampiezza di probabilità relativa a una disintegrazione di questo tipo, in un qualsiasi intervallo di tempo infinitesimo(10) . Vediamo ora cosa succederebbe se lo spin della ⇤0 fosse stato inizialmente rivolto in «giù». Ancora una volta consideriamo i decadimenti in cui il protone va in su lungo l’asse z, come si vede in FIGURA 17.8. Voi capirete subito che, in questo caso, il protone deve avere lo spin «giù», se il momento angolare è conservato. Indichiamo con b l’ampiezza di probabilità per una disintegrazione di questo tipo. Non possiamo dire niente di più sulle due ampiezze a e b. Esse dipendono dai meccanismi interni della ⇤0 e dai decadimenti deboli, e nessuno sa ancora come fare a calcolarli. Dobbiamo ricavare le ampiezze dai dati sperimentali. Ma con queste due sole ampiezze, noi possiamo ricavare tutto quello che desideriamo sulla distribuzione angolare dei prodotti di disintegrazione. Dobbiamo solo sempre stare attenti nel definire completamente gli stati di cui stiamo parlando. Vogliamo trovare qual è la probabilità che il protone si allontani in una direzione che formi un angolo ✓ rispetto all’asse z (nel piccolo angolo solido ⌦ ) come disegnato in FIGURA 17.6. Tracciamo un nuovo asse z in questa direzione e chiamiamolo z 0. Noi sappiamo come fare ad analizzare quello che succede lungo tale asse. Rispetto al nuovo asse, la ⇤0 non ha più lo spin «su», ma ha una certa ampiezza di probabilità di avere lo spin «su» e un’altra ampiezza di averlo «giù». Ci siamo già calcolati queste ampiezze nel capitolo 6, e ancora nel capitolo 10, equazione (10.30). L’ampiezza corrispondente all’avere lo spin «su» è cos ✓/2, e quella per lo spin «giù» è(11) sen ✓/2. Quando la ⇤0 ha lo spin «su» lungo l’asse z 0, emetterà un protone nella direzione +z 0 con un’ampiezza a. Perciò l’ampiezza di probabilità di trovare un protone con lo spin «su» emesso in direzione z 0 è ✓ (17.33) a cos 2 (10) Noi riteniamo ora che tutto il meccanismo della meccanica quantistica vi sia abbastanza familiare da potervi parlare dei vari argomenti da un punto di vista più fisico, senza perder tempo a scrivere tutti i dettagli di tipo matematico. Nel caso che quel che stiamo dicendo non vi sia chiaro, abbiamo messo in fondo al paragrafo alcuni dei dettagli mancanti. (11) Abbiamo scelto z 0 nel piano xz e fatto uso degli elementi di matrice R (✓). Ma anche con un’altra scelta si sarebbe y ottenuta la stessa risposta.
267
268
Capitolo 17 • Simmetria e leggi di conservazione
z
© 978-8808-22107-0
z
z p
z p
z'
sz' = 1/2
sz' = –1/2 vp
vp
FIGURA
17.9
z'
Due possibili stati nei quali la Λ0 può decadere.
Analogamente, l’ampiezza di probabilità di trovare un protone con lo spin «giù» emesso nella direzione positiva di z 0 è ✓ b sen (17.34) 2 I due processi cui queste ampiezze si riferiscono sono mostrati in FIGURA 17.9. Poniamoci ora il seguente facile problema. Se la ⇤0 ha lo spin «su» lungo l’asse z, con quale probabilità il protone di decadimento verrà emesso nella direzione individuata da ✓? I due stati di spin («su» o «giu» lungo z 0) sono tra loro distinguibili anche se decidiamo di non prenderli in considerazione. Quindi, per ottenere la probabilità, dobbiamo quadrare le ampiezze e sommare. La probabilità f (✓) di trovare un protone nel piccolo angolo solido ⌦ intorno a ✓ è f (✓) = |a| 2 cos2 Ricordando che
✓ ✓ + |b| 2 sen2 2 2
sen2
✓ 1 = (1 2 2
cos2
✓ 1 = (1 + cos ✓) 2 2
e che
(17.35)
cos ✓)
possiamo scrivere f (✓) come f (✓) = * ,
|a| 2 + |b| 2 + * |a| 2 |b| 2 + + cos ✓ 2 2 - , -
(17.36)
La distribuzione angolare ha la forma
f (✓) =
(1 + ↵ cos ✓)
(17.37)
La probabilità ha una parte che è indipendente da ✓ e una che varia linearmente con cos ✓. Dalle misure sulla distribuzione angolare, possiamo ricavare ↵ e , e quindi |a| e |b|. Vi sono poi molte altre domande cui siamo in grado di rispondere. E se, per esempio, ci interessano solo i protoni con spin «su» lungo il vecchio asse z? Ciascuno dei termini della (17.33) e della (17.34) darà luogo a un’ampiezza di probabilità di trovare un protone con lo spin «su» e con lo spin «giù» rispetto all’asse z 0 (+z 0 e z 0). Lo spin «su» rispetto al vecchio asse | +zi può essere espresso in funzione degli stati di base | +z 0i e | z 0i. Possiamo allora combinare le due ampiezze (17.33) e (17.34) con gli opportuni coefficienti (cos ✓/2 e sen ✓/2) per ottenere l’ampiezza totale ✓ ✓ a cos2 + b sen2 2 2
17.5 • La disintegrazione della particella Λ0
© 978-8808-22107-0
Il suo quadrato è la probabilità che il protone venga emesso a un angolo ✓ con lo spin nella stessa direzione di quello della ⇤0 («su» lungo l’asse z). Se la parità fosse conservata, potremmo dire una cosa in più. La disintegrazione di FIGURA 17.8 si ottiene semplicemente riflettendo, per esempio nel piano x y, la disintegrazione di (12) . Se la parità fosse conservata, b dovrebbe essere uguale ad a o a a. Perciò il FIGURA 17.7 coefficiente ↵ della (17.37) sarebbe zero, e la disintegrazione avrebbe luogo con uguale probabilità in tutte le direzioni. I risultati sperimentali mostrano che c’è effettivamente un’asimmetria nella disintegrazione. La distribuzione angolare che risulta dalle misure varia come cos ✓, così come abbiamo predetto, e non come cos2 ✓ o come un’altra potenza. In effetti, è proprio perché la distribuzione angolare ha questa forma che possiamo dedurre da queste misure che lo spin della ⇤0 è 1/2. Inoltre, si vede che la parità non è conservata. Infatti, si trova sperimentalmente che il coefficiente ↵ è 0,62 ± 0,05, e, quindi, b è circa il doppio di a. La mancanza di simmetria per riflessione risulta quindi del tutto chiara. Vedete quindi quante cose si possono ricavare dalla conservazione del momento angolare. Nel prossimo capitolo ne daremo ancora altri esempi. Nota parentetica
In questo paragrafo, con a intendiamo l’ampiezza di probabilità che lo stato | protone in moto lungo +z, spin +zi venga generato in un tempo infinitesimo dt dallo stato | ⇤, spin +zi, o, in altre parole, che hprotone in moto lungo +z, spin +z | H | ⇤, spin +zi = i~a
(17.38)
dove H è l’hamiltoniana di tutto l’universo, o almeno di quella parte di esso che è responsabile del decadimento della particella ⇤. La conservazione del momento angolare significa che l’hamiltoniana deve avere la seguente proprietà: hprotone in moto lungo +z, spin z | H | ⇤, spin zi = 0
(17.39)
Con l’ampiezza b, intendiamo che hprotone in moto lungo +z, spin z | H | ⇤, spin zi = i~b
(17.40)
La conservazione del momento angolare implica che hprotone in moto lungo +z, spin +z | H | ⇤, spin zi = 0
(17.41)
Se le ampiezze come le abbiamo scritte nelle (17.33) e (17.34) non risultassero chiare, possiamo esprimerle più matematicamente come segue. Con la (17.33) intendiamo indicare l’ampiezza di probabilità che la ⇤ con lo spin lungo +z si disintegri in un protone che si muova lungo +z 0 con lo spin anch’esso in direzione +z 0, cioè l’ampiezza hprotone in moto lungo +z 0, spin +z 0 | H | ⇤, spin +zi
(17.42)
Dai teoremi generali della meccanica quantistica, questa ampiezza può essere scritta come X hprotone in moto lungo +z 0, spin +z 0 | H | ⇤, ii h⇤, i | ⇤, spin +zi (17.43) i
dove la somma è estesa a tutti gli stati di base | ⇤, ii della particella ⇤ in quiete. Poiché la particella ⇤ ha spin un mezzo, vi sono due di tali stati di base che possono essere espressi con riferimento (12)
Ricordate che lo spin è un vettore assiale che s’inverte per riflessione.
269
270
Capitolo 17 • Simmetria e leggi di conservazione
© 978-8808-22107-0
a qualunque base si preferisca. Se si usano per stati di base quelli con spin «su» e con spin «giù» rispetto a z 0 (+z 0, z 0), l’ampiezza della (17.43) è uguale alla somma hprotone in moto lungo +z 0, spin +z 0 | H | ⇤, +z 0i h⇤, +z 0 | ⇤, +zi + + hprotone in moto lungo +z 0, spin +z 0 | H | ⇤, z 0i h⇤, z 0 | ⇤, +zi
(17.44)
Il primo fattore del primo termine è a, e il primo fattore del secondo termine è zero, come risulta dalla definizione (17.38) e dalla (17.41), che a sua volta segue dalla conservazione del momento angolare. Il rimanente fattore h⇤, +z 0 | ⇤, +zi del primo termine è semplicemente l’ampiezza che una particella di spin un mezzo che ha lo spin «su» rispetto a un certo asse abbia anche lo spin «su» rispetto a un’asse ruotato di un angolo ✓, in riferimento al primo. Tale ampiezza è cos ✓/2 (TABELLA 6.2). Perciò la (17.44) è uguale proprio ad a cos ✓/2, come abbiamo scritto nella (17.33). L’ampiezza della (17.34) si deduce con lo stesso tipo di ragionamento nel caso di una particella ⇤ con lo spin «giù».
17.6
Sommario delle matrici di rotazione
Vogliamo ora raccogliere insieme tutte le varie cose che abbiamo imparato sulle rotazioni per le particelle a spin un mezzo e a spin uno, di modo che esse possano risultare utili per farvi riferimento in futuro. Nella pagina che segue troverete delle tabelle per le due matrici di rotazione Rz ( ) e Ry ( ) per le particelle a spin un mezzo, per le particelle a spin uno e per i fotoni (particelle a spin uno con massa a risposo uguale a zero). Per ogni valore dello spin abbiamo dato gli elementi della matrice h j | R | ii per le rotazioni intorno all’asse z o all’asse y. Essi, naturalmente, sono esattamente equivalenti alle ampiezze del tipo h+T | 0 Si che abbiamo usato in capitoli precedenti. Con Rz ( ) intendiamo indicare che lo stato è proiettato in un nuovo sistema di coordinate, ruotato dell’angolo intorno all’asse z, convenendo di usare sempre la regola della mano destra per definire il senso positivo delle rotazioni. Con Ry (✓) intendiamo indicare che gli assi di riferimento vengono ruotati di un angolo ✓ intorno all’asse y. Una volta note queste due rotazioni, potete, ovviamente, valutare le espressioni per una rotazione arbitraria. Come sempre, scriviamo gli elementi di matrice in modo che lo stato a sinistra sia uno stato di base del nuovo (cioè ruotato) sistema di riferimento, e quello a destra sia invece uno stato di base del vecchio sistema di riferimento (cioè di quello non ruotato). Le espressioni riportate nelle tabelle possono essere interpretare in molti modi. Per esempio, i vari e i /2 nella TABELLA 17.1 significano che l’elemento di matrice h |R| i = e Ma significano anche che oppure che È sempre la stessa cosa.
Rˆ | i = e
i /2
h | Rˆ = h | e
i /2
| i i /2
17.6 • Sommario delle matrici di rotazione
© 978-8808-22107-0
TABELLA
17.1
Matrici di rotazione per lo spin un mezzo.
Due stati: | +i, «su» lungo l’asse z, m = +1/2 | i, «giù» lungo l’asse z, m = 1/2 Rz ( )
TABELLA
17.2
| +i
| i 0
/2
h+ |
e+i
h |
0
Ry (✓)
| +i
i /2
e
| i
h+ |
cos ✓/2
sen ✓/2
h |
sen ✓/2
cos ✓/2
Matrici di rotazione per lo spin uno.
Tre stati: | +i, m = +1 | 0i, m = 0 | i, m = 1 Rz ( )
| +i
| 0i
| i
h+ |
e+i
0
0
h0 |
0
1
0
h |
0
0
Ry (✓)
| +i
| 0i
h+ |
1 (1 + cos ✓) 2
1 + p sen ✓ 2
1 p sen ✓ 2
h0 |
1 (1 2
h |
TABELLA
17.3
e
| i 1 (1 2
cos ✓)
1 + p sen ✓ 2
cos ✓ 1 p sen ✓ 2
cos ✓)
i
1 (1 + cos ✓) 2
Fotoni.
⌘ 1 ⇣ Due stati: | Ri = p | xi + i | yi , m = +1 (polarizzazione CD) 2 ⌘ 1 ⇣ | Li = p | xi i | yi , m = 1 (polarizzazione CL) 2 Rz ( )
| Ri
| Li
hR |
e+i
0
hL |
0
e
i
271
18
Il momento angolare
18.1
Radiazione di dipolo elettrico
Nel capitolo precedente abbiamo sviluppato l’idea della conservazione del momento angolare in meccanica quantistica e abbiamo mostrato come essa possa essere usata per predire la distribuzione angolare dei protoni che derivano dalla disintegrazione della particella ⇤0 . Vogliamo ora darvi qualche altro esempio delle conseguenze della conservazione del momento angolare nei sistemi atomici. Il primo esempio riguarda l’irradiazione di luce da parte di un atomo. La conservazione del momento angolare (fra l’altro) determinerà la polarizzazione e la distribuzione angolare dei fotoni emessi. Supponiamo di avere un atomo che si trovi in uno stato eccitato di momento angolare definito, per esempio di spin uno, e che esso compia una transizione verso uno stato di momento angolare zero di energia minore, emettendo un fotone. Il problema è quello di immaginarsi quale sarà la distribuzione angolare e la polarizzazione dei fotoni. (Questo problema è quasi esattamente uguale a quello della disintegrazione della ⇤0 , eccetto che ora abbiamo particelle di spin uno invece che di spin un mezzo.) Poiché lo stato dell’atomo di energia più alta ha spin uno, vi sono tre possibilità per la componente z del suo momento angolare. Il valore di m potrebbe essere +1, oppure 0, o 1. Nel nostro esempio supporremo che sia m = +1. Una volta visto come funziona questo caso, potete andare a calcolarvi quello che avviene negli altri. Supponiamo che l’atomo se ne stia con il suo momento angolare lungo l’asse +z, come mostra la FIGURA 18.1a. Ci chiediamo
z
z
z
z
Fotone CL
Fotone CD
Atomo nello stato eccitato
j=1 m=1
Atomo nello stato fondamentale
j=0 m=0
Atomo nello stato eccitato
j=1 m = –1
Ampiezza b
Ampiezza a Prima
Prima
Dopo
18.1 Un atomo con m = +1 emette un fotone con polarizzazione CD lungo l’asse +z. FIGURA
Atomo nello stato fondamentale
j=0 m=0
18.2 Un atomo con m = CL lungo l’asse +z.
FIGURA
Dopo
1 emette un fotone con polarizzazione
© 978-8808-22107-0
18.1 • Radiazione di dipolo elettrico
273
con quale ampiezza emetterà luce polarizzata circolarmente in senso destrogiro lungo l’asse z positivo, in modo tale che l’atomo finisca per trovarsi con un momento angolare zero, come si vede nella FIGURA 18.1b. Purtroppo non sappiamo rispondere a questa domanda. Ma sappiamo che la luce con polarizzazione circolare destrogira porta un’unità di momento angolare lungo la sua direzione di propagazione. Perciò, dopo che il fotone è stato emesso, la situazione dovrebbe essere quella che si vede in FIGURA 18.1b; l’atomo rimane con uno spin zero lungo l’asse z, visto che abbiamo supposto di avere un atomo il cui stato più basso abbia uno spin zero. Indicheremo con a l’ampiezza che un tale evento si verifichi. Più precisamente, indicheremo con a l’ampiezza di probabilità che sia emesso un fotone in un certo piccolo angolo solido ⌦, centrato sull’asse z, in un intervallo di tempo dt. Notate che l’ampiezza per l’emissione di un fotone con polarizzazione CL nella stessa direzione è zero. Il momento angolare lungo l’asse z per un tale fotone sarebbe 1, e zero per l’atomo, cioè in totale 1, e non si avrebbe conservazione del momento angolare. Analogamente, se lo spin dell’atomo è inizialmente rivolto in «giù» ( 1 lungo l’asse z), esso può emettere solo un fotone polarizzato CL nella direzione dell’asse +z, come mostra la FIGURA 18.2. Indicheremo con b l’ampiezza corrispondente a un tale evento, sempre intendendo l’ampiezza relativa all’emissione di un fotone in un certo angolo solido ⌦. D’altra parte, se l’atomo si trova nello stato con m = 0, esso non può assolutamente emettere un fotone nella direzione +z, perché un fotone può avere soltanto momento angolare +1 o 1 lungo la sua direzione di moto. Poi, possiamo anche mostrare che b è legata ad a. Immaginiamo d’invertire la situazione in FIGURA 18.1, cioè immaginiamo come si presenterebbe il sistema se ne spostassimo ogni sua parte in un punto equivalente che si trovi dalla parte opposta rispetto all’origine. Ciò non significa che dobbiamo riflettere i vettori dei momenti angolari, perché essi hanno un carattere artificiale. Noi dobbiamo invece invertire le effettive caratteristiche di moto che corrispondono a tali momenti angolari. Nelle FIGURE 18.3a e 18.3b abbiamo disegnato come il processo di FIGURA 18.1 si presenta prima e dopo un’inversione rispetto al centro dell’atomo. Notate come il senso di (a) rotazione dell’atomo rimanga inalterato(1) . Nel sistema invertito di FIGURA 18.3b abbiamo un atomo con m = +1 che emette verso il basso un fotone polarizzato in senso levogiro. Se ora ruotiamo il sistema di FIGURA 18.3b di 180° intorno all’asse x o y, esso diviene identico a quello di FIGURA 18.2. La combinazione di un’inversione e di una rotazione riporta il secondo processo nel primo. Facendo uso della TABELLA 17.2, vediamo che una rotazione di 180° intorno (b) all’asse y porta semplicemente uno stato con m = 1 in uno stato con m = = +1, quindi l’ampiezza b deve essere uguale all’ampiezza a, eccetto che per un possibile cambiamento di segno dovuto all’inversione. Il cambiamento di segno nell’inversione dipenderà dalle parità degli stati iniziale e finale dell’atomo. Nei processi atomici la parità è conservata, di modo che la parità dell’intero sistema deve essere la stessa prima e dopo l’emissione del fotone. Quello che succede in realtà dipenderà dal fatto che le parità degli stati iniziali e finali dell’atomo siano pari o dispari; la distribuzione angolare sarà differente nei vari casi. Noi prenderemo in esame il caso abituale in FIGURA 18.3 Se il processo in (a) è trasformato per cui la parità è dispari per lo stato iniziale e pari per quello finale; si avrà inversione rispetto al centro dell’atomo, esso appare così la cosiddetta «radiazione di dipolo elettrico». (Se gli stati iniziale e come in (b). finale hanno la stessa parità, si dice che si ha una «radiazione di dipolo magnetico», che ha le stesse caratteristiche di quella emessa da una corrente oscillante in un circuito.) Se la parità dello stato iniziale è dispari, la corrispondente ampiezza cambia segno nel(1) Quando cambiamo x, y e z in x, y e z, si potrebbe pensare che tutti i vettori risultino invertiti. Ciò è vero per i vettori polari, come gli spostamenti e le velocità, ma non per un vettore assiale, come il momento angolare, o per un qualunque vettore che derivi da un prodotto vettoriale tra due vettori polari. I vettori assiali hanno ancora le stesse componenti dopo un’inversione.
274
Capitolo 18 • Il momento angolare
© 978-8808-22107-0
l’inversione che porta il sistema dalla situazione di FIGURA 18.3a alla situazione di FIGURA 18.3b. Lo stato finale dell’atomo ha parità pari e la corrispondente ampiezza non cambia perciò segno. Se la reazione procede in modo da conservare la parità, l’ampiezza b deve essere uguale ad a in modulo, ma di segno opposto. Ne concludiamo che se a è l’ampiezza di probabilità che un atomo in uno stato m = +1 emetta un fotone verso l’alto, allora, quando le parità degli stati iniziale e finale sono quelle che abbiamo supposto, l’ampiezza di probabilità che in uno stato m = 1 venga emesso verso l’alto un fotone con polarizzazione CL è a(2) . Ora abbiamo tutto quel che ci serve per ricavare l’ampiezza corrispondente all’emissione di un fotone in una qualsiasi direzione che formi un angolo ✓ rispetto all’asse z. Immaginate di avere all’inizio un atomo polarizzato con m = +1. Possiamo scomporre questo stato negli stati +1, 0 e 1 rispetto a un nuovo asse z 0 diretto come il fotone che viene emesso. Le ampiezze di questi tre stati sono quelle date nella metà inferiore della TABELLA 17.2. L’ampiezza che venga emesso un fotone con polarizzazione CD, sempre nella direzione ✓, è quindi a volte l’ampiezza di avere m = +1 in quella direzione, cioè a h+ | Ry (✓) | +i =
a (1 + cos ✓) 2
(18.1)
L’ampiezza corrispondente all’emissione di un fotone con polarizzazione CL nella stessa direzione è a volte l’ampiezza corrispondente a m = 1 nella nuova direzione. Facendo uso della TABELLA 17.2, si trova che essa è a a h | Ry (✓) | +i = (1 cos ✓) (18.2) 2 Se v’interessano altre polarizzazioni, potete ricavare le relative ampiezze da una sovrapposizione delle nostre due. Per ottenere l’intensità di una qualsiasi componente come funzione dell’angolo, dovete naturalmente fare il modulo quadrato delle ampiezze.
18.2
Diffusione della luce
Usiamo ora questi risultati per risolvere un problema leggermente più complicato, ma anche leggermente più realistico. Immaginiamo che gli stessi atomi siano nel loro stato fondamentale ( j = 0), e che diffondano un fascio di luce incidente. Supponiamo che la luce sia diretta inizialmente nella direzione +z, di modo che si abbiano dei fotoni che arrivano sull’atomo dalla direzione z, come si vede in FIGURA 18.4a. Possiamo considerare la diffusione della luce come un processo in due tempi: il fotone viene prima assorbito e poi riemesso. Se all’inizio si ha un fotone con polarizzazione CD come in FIGURA 18.4a, e se il momento angolare è conservato, allora, dopo l’assorbimento, l’atomo si troverà in uno stato con m = +1, come si vede in FIGURA 18.4b. L’ampiezza per questo processo verrà indicata con c. L’atomo potrà poi emettere un fotone con polarizzazione CD in direzione ✓, come nella FIGURA 18.4c. L’ampiezza totale per la diffusione di un fotone con polarizzazione CD nella direzione ✓ è semplicemente c moltiplicato per la (18.1). Indichiamo l’ampiezza di diffusione con hD 0 | S | Di; si ha allora hD 0 | S | Di =
ac (1 + cos ✓) 2
(18.3)
Naturalmente, esiste anche un’ampiezza relativa all’assorbimento di un fotone con polarizzazione CD e all’emissione di un fotone con polarizzazione CL. Il prodotto delle due rappresenta l’ampiezza hL 0 | S | Di che un fotone polarizzato CD sia diffuso con una polarizzazione CL. Per mezzo della (18.2), si ha ac hL 0 | S | Di = (1 cos ✓) (18.4) 2 (2)
Alcuni di voi potrebbero obiettare al nostro ragionamento dicendo che gli stati finali che abbiamo considerato non hanno una parità definita. Troverete nella Nota aggiuntiva 2 alla fine del capitolo un’altra dimostrazione che può darsi vi piaccia di più.
275
18.2 • Diffusione della luce
© 978-8808-22107-0
Chiediamoci ora quel che succede quando arriva un fotone polarizzato CL. Quando esso viene assorbito, l’atomo passa in uno stato con m = 1. Con lo stesso tipo di ragionamenti di cui abbiamo fatto uso nel paragrafo precedente, possiamo dimostrare che questa ampiezza deve essere c. L’ampiezza che un atomo in uno stato con m = 1 emetta un fotone polarizzato CD a un angolo ✓ è uguale ad a moltiplicata per l’ampiezza h+ | Ry (✓) | i, che è uguale a (1 cos ✓)/2. Perciò si ha hD 0 | S | Li =
ac (1 2
cos ✓)
j=0 m=0
ac (1 + cos ✓) 2
z
j=0 m=0
j=1 m=1
(18.5)
Infine l’ampiezza di diffusione di un fotone polarizzato CL ancora con una polarizzazione CL è hL 0 | S | Li =
z
z
(a)
(b)
(c)
18.4 La diffusione della luce da parte di un atomo, vista come un processo in due tempi. FIGURA
(18.6)
(Vi sono due segni meno che si elidono.) Se facciamo una misura dell’intensità diffusa per ogni possibile combinazione di polarizzazioni circolari, si otterrà un risultato proporzionale al quadrato di ognuna delle nostre quattro ampiezze. Per esempio, con un fascio di luce incidente con polarizzazione CD, l’intensità della luce diffusa con polarizzazione CD varierà come (1 + cos ✓)2 . Tutto questo va molto bene, ma supponiamo ora di partire con della luce polarizzata linearmente. E ora? Se abbiamo della luce polarizzata lungo x, essa può essere rappresentata da una sovrapposizione di luce con polarizzazione CD e CL. Scriviamo allora (vedi paragrafo 11.4): ⌘ 1 ⇣ | xi = p | Di + | Li 2
(18.7)
Oppure, nel caso di luce polarizzata lungo y, avremmo | yi =
i ⇣ p | Di 2
| Li
⌘
(18.8)
Che altro volete sapere? Volete trovare l’ampiezza di probabilità perché un fotone polarizzato lungo x sia diffuso verso ✓ con una polarizzazione CD? La risposta si ottiene dalla solita regola di combinazione delle ampiezze. Moltiplicate dapprima la (18.7) per hD 0 | S in modo da avere ⌘ 1 ⇣ hD 0 | S | xi = p hD 0 | S | Di + hD 0 | S | Li 2
(18.9)
e poi fate uso della (18.3) e della (18.5) per l’espressione delle due ampiezze. Otterrete così ac hD 0 | S | xi = p cos ✓ 2
(18.10)
Se aveste cercato l’ampiezza di diffusione di un fotone con polarizzazione x in un fotone con polarizzazione CL, avreste ottenuto ac hL 0 | S | xi = p cos ✓ 2
(18.11)
Infine supponete di voler trovare l’ampiezza di diffusione di un fotone polarizzato lungo x, in maniera che questo conservi la sua polarizzazione. Quello che ora cercate è hx 0 | S | xi, che può essere scritto come hx 0 | S | xi = hx 0 | D 0i hD 0 | S | xi + hx 0 | L 0i hL 0 | S | xi
(18.12)
276
Capitolo 18 • Il momento angolare
Facendo uso delle relazioni
ne segue che
© 978-8808-22107-0
⌘ 1 ⇣ | D 0i = p | x 0i + i | y 0i 2 ⌘ 1 ⇣ | L 0i = p | x 0i i | y 0i 2 1 hx 0 | D 0i = p 2 1 hx 0 | L 0i = p 2
(18.13) (18.14)
(18.15) (18.16)
Ne ricavate perciò hx 0 | S | xi = ac cos ✓
(18.17)
La risposta è che un fascio di luce polarizzato lungo x viene diffuso nella direzione ✓ (nel piano xz) con un’intensità proporzionale a cos2 ✓. Cercando qual è l’ampiezza diffusa con polarizzazione lungo y si troverebbe hy 0 | S | xi = 0 (18.18) Perciò la luce diffusa è completamente polarizzata in direzione x. Possiamo ora notare qualcosa d’interessante. I risultati espressi dalla (18.17) e dalla (18.18) corrispondono esattamente alla teoria classica della diffusione della luce che abbiamo visto nel paragrafo 32.5 del vol. 1, dove si era pensato che l’elettrone fosse legato all’atomo semplicemente da una forza di richiamo lineare, di modo che l’insieme si comportava come un oscillatore classico. Forse starete pensando: «Nella teoria classica è tutto molto più semplice; visto che essa dà la risposta giusta, perché andarci a preoccupare della teoria quantistica?». Prima di tutto, noi abbiamo considerato finora solo il caso particolare, per quanto piuttosto comune, di un atomo con uno stato eccitato con j = 1 e con lo stato fondamentale con j = 0. Se lo stato eccitato avesse spin due, si otterrebbe un risultato differente. Inoltre, non vi è alcuna ragione per cui il modello con un elettrone attaccato a una molla e mantenuto in moto da un campo elettrico oscillante debba funzionare anche quando è presente un solo fotone. Ma abbiamo trovato che in realtà funziona e che l’intensità e la polarizzazione che se ne ricavano sono quelle giuste. Perciò, in un certo senso, stiamo controllando la veridicità di tutto ciò che abbiamo detto nel corso. Nel vol. 1 abbiamo svolto la teoria dell’indice di rifrazione e della diffusione della luce in maniera puramente classica e ora abbiamo dimostrato che la teoria quantistica fornisce gli stessi risultati per il caso più comune. Per esempio, ora ci siamo studiati la polarizzazione della luce del cielo con la meccanica quantistica, che è l’unica maniera corretta di farlo. Naturalmente, tutte le teorie classiche che funzionano dovrebbero essere corroborate in ultima analisi da legittimi ragionamenti quantistici. È ovvio che tutti quegli argomenti che ci siamo dilungati a spiegarvi erano stati scelti proprio in quei settori della fisica classica che mantengono inalterata la loro validità in meccanica quantistica. Avrete notato che non abbiamo mai discusso in dettaglio alcun modello atomico in cui gli elettroni circolano in orbite ben definite. E questo perché un tale modello condurrebbe a dei risultati che non sarebbero in accordo con la meccanica quantistica. Ma il modello dell’elettrone attaccato a una molla, che in un certo senso non «assomiglia» per niente all’aspetto di un atomo, funziona, e quindi noi lo abbiamo usato nella teoria dell’indice di rifrazione.
18.3
Annichilimento del positronio
Vogliamo ora considerare un esempio particolarmente bello. È una cosa molto interessante e, per quanto sia un po’ complicata, speriamo che non lo sia troppo. L’esempio tratta di un sistema, chiamato positronio, costituito da un «atomo» fatto con un elettrone e un positrone: si tratta quindi di uno stato legato di e+ ed e . È del tutto simile a un atomo d’idrogeno, tranne che il
© 978-8808-22107-0
18.3 • Annichilimento del positronio
protone è sostituito da un positrone. Questo oggetto ha, come l’atomo d’idrogeno, molti stati. Come nel caso dell’idrogeno, lo stato fondamentale si suddivide in una «struttura iperfine» a causa dell’interazione dei momenti magnetici. Gli spin dell’elettrone e del positrone sono entrambi un mezzo, e possono essere paralleli o antiparelleli a un determinato asse. (Nello Positronio stato fondamentale non vi è alcun contributo al momento angolare dovuto al moto orbitale.) Vi sono perciò quattro stati: tre sono sottostati di un sistema a spin uno, e hanno tutti la stessa energia; uno è uno stato di spin zero con energia differente. La separazione delle energie è comunque assai e+e– maggiore dei 1420 megacicli dell’idrogeno, perché il momento magnetico del positrone è molto più grande, circa 1000 volte, di quello del protone. La differenza più importante, tuttavia, consiste nel fatto che il positronio non può durare per sempre. Il positrone è l’antiparticella dell’elettrone ed Dopo Prima essi possono annichilirsi vicendevolmente. Le due particelle scompaiono completamente, convertendo l’energia a riposo in radiazione, che viene rivelata nella forma di raggi (fotoni). Nella disintegrazione, due particelle FIGURA 18.5 L’annichilimento del positronio con massa a riposo finita, vanno a finire in due o più oggetti che hanno in due fotoni. invece una massa a riposo nulla(3) . Cominciamo con l’analizzare la disintegrazione dello stato del positroz nio che ha spin zero. La disintegrazione in due raggi ha luogo con una vita 10 media di circa 10 s. Inizialmente si hanno un positrone e un elettrone l’uno accanto all’altro con gli spin antiparalleli, che formano il positronio. m = +1 CD Dopo la disintegrazione, si hanno due fotoni, che si allontanano con impulsi uguali e opposti (FIGURA 18.5). Gli impulsi devono essere uguali e opposti perché l’impulso totale dopo la disintegrazione deve essere zero, come era prima, se si considera il caso dell’annichilimento a riposo. Se il positronio Positronio non era a riposo, possiamo disinteressarcene, risolvere il problema e poi j=0 trasformare tutto quanto nel sistema del laboratorio. (Vedete che ora siamo m=0 e+e– in grado di fare tutto quello che vogliamo: abbiamo tutti gli strumenti che ci servono.) Notate per prima cosa che la distribuzione angolare non è molto interessante. Poiché lo stato iniziale ha spin zero, non vi sono assi privilegiati, e il sistema è simmetrico per qualsiasi rotazione. Lo stato finale m = –1 CD deve quindi essere anch’esso simmetrico per una qualsiasi rotazione. Ciò significa che tutti gli angoli di disintegrazione sono ugualmente probabili e l’ampiezza è la stessa qualunque sia la direzione dei fotoni. Naturalmente, una volta che uno dei fotoni va in una certa direzione, l’altro deve andare in direzione opposta. FIGURA 18.6 Un caso possibile di annichilimento L’unico problema che rimane, e che vogliamo prendere ora in esame, del positronio lungo l’asse z. riguarda la polarizzazione dei fotoni. Identifichiamo le direzioni di moto dei fotoni con gli assi più e meno z. Possiamo usare la rappresentazione che vogliamo per gli stati di polarizzazione dei fotoni; noi sceglieremo quella delle polarizzazioni circolari destrogira e levogira, sempre rispetto alle direzioni di moto(4) . Immediatamente vediamo che se il protone che va verso l’alto è polarizzato CD, allora il momento angolare è conservato se anche il fotone che va verso il basso è polarizzato CD. Ciascuno di essi porta un’unità di momento angolare rispetto alla direzione del proprio impulso, cioè più o meno un’unità rispetto all’asse z. Il totale è zero e il momento angolare dopo la disintegrazione è lo stesso di prima (FIGURA 18.6). (3) Al giorno d’oggi, con la comprensione più profonda che abbiamo della natura, non abbiamo una maniera facile di decidere se l’energia di un fotone è meno «materiale» di quella di un elettrone, perché come ricorderete tutte le particelle si comportano in maniera assai simile. L’unica distinzione possibile è che il fotone ha una massa a riposo zero. (4) Notate che noi analizziamo sempre il momento angolare rispetto alla direzione di moto della particella. Se ci chiedessimo qual è il momento angolare rispetto a un qualsiasi altro asse ci dovremmo preoccupare anche della possibilità che ci sia un momento angolare «orbitale», che deriva da un termine del tipo p ⇥ r . Per esempio, non possiamo dire che i fotoni partono esattamente dal centro del positronio. Essi possono partire come due cose che vengono sparate fuori dal bordo di una ruota che sta girando. Ma non dobbiamo più tenere conto di queste possibilità quando prendiamo l’asse di quantizzazione lungo la direzione di moto.
277
278
Capitolo 18 • Il momento angolare
© 978-8808-22107-0
18.7 Per lo stato con j = 1 del positronio, il processo (a) e quello da esso ottenuto ruotando di 180° intorno a y (b) sono esattamente uguali. FIGURA
j=1 m=0
j=1 m=0 e+e–
e+e–
Lo stesso ragionamento prova che se il fotone che va verso l’alto ha una polarizzazione CD, quello che va verso il basso non può averla CL. In tal caso, lo stato finale avrebbe due unità di momento angolare. Questo non è possibile se lo stato iniziale ha spin zero. Notate che uno stato finale di questo tipo non è possibile nemmeno per l’altro stato fondamentale del positronio, quello di spin uno, perché anche questo può avere al massimo un’unità di momento angolare rispetto a una qualunque direzione. Vogliamo ora dimostrare che un annichilimento in due fotoni è comunque impossibile per lo stato di spin uno. Si potrebbe pensare che, prendendo lo stato con j = 1, m = 0, che ha un momento angolare zero rispetto all’asse z, esso si comporti come lo stato di spin zero, e possa quindi disintegrarsi in due fotoni con polarizzazione CD. Infatti, la disintegrazione disegnata schematicamente in FIGURA 18.7a conserva il momento angolare rispetto all’asse z. Ma guardate ora cosa succede se questo sistema viene ruotato di 180° intorno all’asse y; si ottiene il disegno di FIGURA 18.7b. Questo è esattamente uguale a quello della FIGURA 18.7a. Tutto quello che abbiamo fatto è stato scambiare i due fotoni. Ora i fotoni sono particelle di Bose; se le scambiamo, l’ampiezza rimane con lo stesso segno, e quindi l’ampiezza relativa alla disintegrazione della parte b deve essere la stessa di quella relativa alla parte a. Ma noi abbiamo supposto che l’oggetto iniziale avesse spin uno. E quando si ruota di 180° intorno all’asse y un oggetto di spin uno che si trova in uno stato con m = 0, la sua ampiezza cambia segno (vedi TABELLA 17.2 per ✓ = ⇡ ). Perciò le due ampiezze per le FIGURE 18.7a e 18.7b devono avere segni opposti; lo stato di spin uno non si può disintegrare in due fotoni. Quando viene formato il positronio, ci si aspetta che ciò avvenga nello stato di spin zero per 1/4 del tempo e nello stato di spin uno (con m = = 1, 0 o +1 ) per 3/4 del tempo. Perciò, per 1/4 del tempo, si avrebbero CL annichilimenti in due fotoni. Nei rimanenti 3/4 di tempo non ci possono essere annichilimenti in due fotoni. È ancora possibile l’annichilimento, ma deve avvenire con tre fotoni. È più difficile che questo succeda, e la vita media è perciò 1000 volte più lunga, circa 10 7 s. E questo è ciò che viene osservato sperimentalmente. Ma noi non tratteremo in maggior dettaglio j=0 m=0 l’annichilimento dello stato di spin uno. e+e– Finora abbiamo ricavato, occupandoci soltanto del momento angolare, che lo stato di spin zero del positronio può decadere in due fotoni con polarizzazione CD. Vi è anche un’altra possibilità: che decada in due fotoni con polarizzazione CL, come si vede in FIGURA 18.8. La domanda che CL immediatamente segue è: qual è la relazione tra le ampiezze di questi due possibili modi di decadimento? La possiamo ricavare dalla conservazione della parità. Per farlo, tuttavia, abbiamo bisogno di conoscere la parità del positronio. FIGURA 18.8 Un’altra possibilità per l’annichilimento del positronio. I fisici teorici hanno dimostrato, in un modo che non è facile da spiegare, che
18.3 • Annichilimento del positronio
© 978-8808-22107-0
la parità dell’elettrone e del positrone, che è la sua antiparticella, devono essere opposte, cosicché lo stato fondamentale di spin zero del positronio deve avere parità dispari. Noi ci limiteremo a supporre che sia dispari e, visto che ciò è in accordo con l’esperienza, considereremo quest’ultimo fatto come una dimostrazione sufficiente della verità dell’ipotesi. Vediamo quel che succede quando si effettua un’inversione sul processo di FIGURA 18.6. Quando lo facciamo, i due fotoni invertono le loro direzioni di moto e anche le polarizzazioni. Il disegno che rappresenta la situazione dopo l’inversione si presenta come in FIGURA 18.8. Supponendo che la parità del positronio sia dispari, se ne deduce che le ampiezze dei due processi delle FIGURE 18.6 e 18.8 devono avere segno opposto. Indichiamo con | D1 D2 i lo stato finale di FIGURA 18.6, in cui entrambi i fotoni sono polarizzati CD, e con | L 1 L 2 i quello di FIGURA 18.8, in cui entrambi i fotoni hanno polarizzazione CL. Lo stato finale effettivo, che indicheremo con | Fi, dovrà perciò essere | Fi = | D1 D2 i | L 1 L 2 i (18.19) Un’inversione cambia perciò i D in L e produce lo stato P | Fi = | L 1 L 2 i
| D1 D2 i =
| Fi
(18.20)
che è uguale allo stato (18.19) cambiato di segno. Perciò lo stato finale | Fi ha parità negativa, cioè la stessa dello stato iniziale a spin zero del positronio. Questo è l’unico stato finale che conservi sia momento angolare sia parità. Vi è una certa ampiezza relativa a una disintegrazione in questo stato, di cui però non abbiamo bisogno di occuparci in questo momento, poiché ci stiamo interessando solo di questioni connesse con la polarizzazione. Che significato fisico ha lo stato finale (18.19)? Un significato è il seguente: se si osservano i due fotoni per mezzo di due rivelatori, che possono essere predisposti per contare separatamente i fotoni con polarizzazione CD e CL, si vedranno sempre due fotoni polarizzati CD insieme o due fotoni polarizzati CL insieme. Cioè, se voi vi piazzate da una parte del positronio e qualcun’altro dalla parte opposta, potete misurare la polarizzazione e dire al vostro amico quale sarà la polarizzazione che egli misurerà. Voi avete una probabilità al 50% di trovare un fotone con polarizzazione CD o CL; ma qualunque polarizzazione troviate, siete in grado di predire che lui troverà la stessa. Visto che le probabilità di trovare polarizzazioni CD o CL sono al 50%, questo fa pensare alla possibilità che vi sia polarizzazione lineare. Chiediamoci cosa succede se osserviamo i fotoni per mezzo di contatori che rivelano solo luce polarizzata linearmente. Per i raggi, la polarizzazione non si misura così facilmente come per la luce; non esiste un polarizzatore in grado di lavorare bene per lunghezze d’onda così piccole. Ma supponiamo che esista, tanto per semplificare la discussione. Immaginate d’avere un contatore che riveli solo luce polarizzata lungo x, e che dall’altra parte vi sia un vostro amico che possa rivelare luce polarizzata, per esempio lungo y. Con che probabilità riuscireste a rivelare i due fotoni provenienti da un annichilimento? Quello che cerchiamo è l’ampiezza di probabilità che | Fi si trovi nello stato | x 1 y2 i. In altre parole, ci serve l’ampiezza hx 1 y2 | Fi che, naturalmente, è semplicemente hx 1 y2 | D1 D2 i
hx 1 y2 | L 1 L 2 i
(18.21)
Benché ora stiamo trattando ampiezze per due particelle, i due fotoni, possiamo maneggiarle esattamente come quelle per particelle singole, poiché ciascuna agisce indipendentemente dall’altra. Ciò significa che l’ampiezza hx 1 y2 | D1 D2 i è uguale proprio al prodotto delle due ampiezze indipendentiphx 1 | Dp1 i e hy2 | D2 i. Facendo uso della TABELLA 17.3, si trova che queste due ampiezze sono 1/ 2 e i/ 2, quindi i hx 1 y2 | D1 D2 i = + 2 Analogamente si trova che i hx 1 y2 | L 1 L 2 i = 2
279
280
Capitolo 18 • Il momento angolare
© 978-8808-22107-0
Sottraendo tra loro queste ampiezze, secondo la (18.21), si trova che hx 1 y2 | Fi = +i
(18.22)
Perciò si ha una probabilità pari a uno(5) che, se voi rivelate un fotone nel vostro rivelatore per polarizzazioni lungo x, il vostro amico ne riveli uno nel suo rivelatore per polarizzazioni lungo y. Supponiamo ora che il vostro amico predisponga il suo contatore per rivelare una polarizzazione lungo x, come avete fatto voi. Ebbene, non riuscirà mai a ottenere un segnale quando voi ne avete uno. Se vi fate tutto il conto, otterrete che hx 1 x 2 | Fi = 0
(18.23)
Naturalmente, risulterà anche che, se predisponete il vostro contatore per rivelare una polarizzazione lungo y, il vostro amico otterrà dei conteggi in coincidenza con i vostri soltanto se avrà fatto in modo di rivelare solo polarizzazioni lungo x. Tutto ciò ci conduce a considerare un’interessante situazione. Immaginate di avere opportunamente sistemato qualcosa come un blocco di calcite, che ha l’effetto di separare i fotoni in un fascio polarizzato lungo x e un fascio polarizzato lungo y, e mettete un contatore in ciascuno dei fasci. Chiamiamo il primo contatore x e il secondo contatore y. Se anche il vostro amico dall’altra parte fa la stessa cosa, voi siete sempre in grado di dirgli in quale fascio andrà a finire il suo fotone. Tutte le volte che sia voi sia lui otterrete un conteggio simultaneo, voi potete andare a vedere quale dei vostri contatori ha acchiappato il fotone e dirgli in quale dei suoi contatori ne troverà uno. Se, per esempio, dopo una certa disintegrazione, trovate un fotone nel vostro contatore x, potete dirgli che dovrà avere un conteggio nel suo contatore y. Ma per molti che imparano la meccanica quantistica nella solita (antiquata) maniera, questo suona piuttosto fastidioso. A queste persone piacerebbe pensare che, una volta che i fotoni sono stati emessi, essi viaggino come un’onda con un ben definito carattere. Essi sono portati a pensare che, poiché «ogni dato fotone» ha una certa «ampiezza di probabilità» di essere polarizzato lungo x o lungo y, vi dovrebbe essere una certa probabilità di rivelarlo sia nel contatore x sia nel contatore y e che questa probabilità non debba dipendere da quel che qualcun altro fa con un fotone completamente diverso. Essi sostengono che «qualcun altro che fa delle misure, non può essere in grado di cambiare la probabilità che io stesso ottenga un certo risultato». La meccanica quantistica che noi abbiamo imparato dice tuttavia che se si fa una misura sul fotone numero uno, è possibile predire esattamente quale sarà la polarizzazione del fotone numero due, quando questo sarà rivelato. Questo punto di vista non venne mai accettato da Einstein ed egli si preoccupò tanto di questo fatto che esso divenne noto sotto il nome di «paradosso di Einstein-Podolsky-Rosen». Ma quando la situazione viene descritta come noi abbiamo fatto qui, non sembra proprio che ci sia nessun paradosso; in maniera del tutto naturale risulta che quello che viene misurato in un posto è correlato con quello che viene misurato altrove. Il ragionamento che fa risultare tutto ciò paradossale è all’incirca il seguente. 1 Se avete un contatore che vi dice se il vostro fotone ha polarizzazione CD o CL, potete allora predire esattamente quale sarà la polarizzazione (CD o CL) che il vostro amico rivelerà. 2 I fotoni che egli rivelerà dovranno perciò essere polarizzati completamente CD oppure CL, alcuni di un tipo e altri dell’altro tipo. 3 Certamente voi non sarete in grado di alterare la natura fisica dei suoi fotoni cambiando il tipo di osservazioni che voi fate sui vostri fotoni. Indipendentemente dalle misure che voi fate sui vostri, i suoi saranno ancora polarizzati CD o CL. 4 Immaginate ora che il vostro amico cambi il suo apparecchio e separi i suoi fotoni in due fasci polarizzati linearmente per mezzo di un pezzo di calcite, di modo che i suoi fotoni vadano a finire o in un fascio polarizzato lungo x o in un fascio polarizzato lungo y. Secondo la (5)
Noi non abbiamo normalizzato le nostre ampiezze, né le abbiamo moltiplicate per l’ampiezza di disintegrazione in un ben determinato stato finale, ma possiamo ugualmente vedere che questo risultato è giusto perché otteniamo probabilità zero quando consideriamo l’altra alternativa, vedi equazione (18.23).
18.4 • Matrice di rotazione per uno spin qualsiasi
© 978-8808-22107-0
meccanica quantistica, non vi è assolutamente alcun modo di predire in quale fascio andrà a finire un particolare fotone con polarizzazione CD. Si ha il 50% di probabilità che finisca nel fascio x e il 50% che finisca nel fascio y. E, analogamente, per un fotone con polarizzazione CL. 5 Secondo i punti 2 e 3, tutti i fotoni hanno polarizzazione CD o CL, e, di conseguenza, ognuno di essi avrà una probabilità del 50% di finire nel fascio x e altrettanta di finire nel fascio y, e non vi è alcun modo di predire che strada prenderà. 6 Ma la teoria dice che se voi vedete il vostro fotone che passa in un polarizzatore x, allora potete predire con certezza che il fotone del vostro amico andrà nel fascio polarizzato y. Ciò è in contraddizione con il punto 5 e quindi si ha un paradosso. Tuttavia, a quel che sembra, la natura non si accorge del «paradosso», perché gli esperimenti dimostrano che la predizione 6 è, in effetti, verificata. Noi abbiamo già discusso la chiave di questo paradosso, nella nostra primissima lezione sul comportamento quantistico nel cap. 37 del vol. 1(6) . Nella catena di ragionamenti sopra riportati, i punti 1, 2, 4 e 6 sono tutti giusti, ma il punto 3 e la sua conseguenza, punto 5, sono sbagliati; essi non rappresentano una descrizione corretta della natura. Il punto 3 dice che con una misura fatta da voi (e in cui vedete un fotone con polarizzazione CD o CL), potete determinare quale di due possibili alternative si presenterà a quell’altro (se cioè vedrà un fotone con polarizzazione CD o CL), e anche se voi non fate la misura, potete ancora dire che per lui l’evento si produrrà nell’una o nell’altra delle due alternative. Ma questo era precisamente il punto che era stato messo in luce nel cap. 37 del vol. 1, e cioè quello di mettere in chiaro fin dal principio che in natura non avviene così. Il modo con cui essa opera richiede una descrizione che fa uso di ampiezze che interferiscono, e a ogni alternativa è collegata un’ampiezza. Una misura che riveli quale delle due alternative ha effettivamente luogo distrugge l’interferenza, ma se tale misura non viene compiuta, non si può seguitare a dire che «in ogni caso si presenterà l’una o l’altra delle due alternative». Se fosse possibile determinare per ognuno dei vostri fotoni se ha una polarizzazione CD o CL, e anche se è polarizzato lungo x (tutto questo sempre per lo stesso fotone), allora sì che vi sarebbe un paradosso. Ma non è possibile fare una cosa simile: è una cosa vietata dal principio d’indeterminazione. Pensate ancora che ci sia un «paradosso» ? Per essere sicuri che si tratti proprio di un paradosso che riguarda il comportamento della natura, mettete su un’esperienza immaginaria in cui la teoria della meccanica quantistica dia luogo a previsioni in disaccordo tra loro, quando si fa uso di due diversi ragionamenti. Altrimenti il «paradosso» rappresenta solo un conflitto tra la realtà e la vostra idea di quello che la realtà «dovrebbe essere». Pensate allora che non si tratta di un «paradosso», ma che rimane lo stesso una cosa molto peculiare? Su questo siamo tutti d’accordo. È proprio per questo che la fisica è affascinante.
18.4
Matrice di rotazione per uno spin qualsiasi
Vi sarete resi conto ora, almeno lo speriamo, di quanto sia importante il concetto di momento angolare nella comprensione dei processi atomici. Finora abbiamo considerato solo sistemi con spin – ossia «momenti angolari totali» – pari a zero, un mezzo o uno. Vi sono, naturalmente, sistemi atomici che hanno momenti angolari più elevati. Per analizzare questi sistemi, avremmo bisogno di tabelle per le ampiezze di rotazione analoghe a quelle del paragrafo 17.6. Cioè avremmo bisogno di conoscere la matrice delle ampiezze per spin 3/2, 2, 5/2, 3 ecc. Anche se non ci ricaveremo queste tabelle in dettaglio, vogliamo però farvi vedere come si fa, così che sappiate farlo, se mai ne avrete bisogno. Come si è già visto, ogni sistema che abbia uno spin o un «momento angolare totale» pari a j, può esistere in 2 j + 1 stati, in ciascuno dei quali la componente z del momento angolare può assumere uno qualsiasi dei valori discreti facenti parte della sequenza j, j 1, j 2, ..., ( j 1), j (tutti in unità ~ ). Indicando la componente z del (6)
Si veda anche il capitolo 1 di questo volume.
281
282
Capitolo 18 • Il momento angolare
© 978-8808-22107-0
momento angolare di ogni particolare stato con m~, noi possiamo definire un particolare stato di momento angolare dando i valori numerici dei due «numeri quantici del momento angolare» j e m. Questo stato sarà indicato dal vettore di stato | j, mi. Nel caso di una particella di spin un mezzo, i due stati sono quindi | 1/2, 1/2i e | 1/2, 1/2i; o per un sistema di spin uno, gli stati verranno scritti con le notazioni | 1, +1i, | 1, 0i e | 1, 1i. Una particella di spin zero ha, naturalmente, un solo stato, cioè | 0, 0i. Vogliamo ora trovare cosa succede quando si proietta il generico stato | j, mi in una rappresentazione che si riferisce a un sistema di assi ruotato. Per prima cosa, noi sappiamo che j è un numero che caratterizza il sistema, e perciò non potrà cambiare. Quindi, se ruotiamo gli assi, tutto quello che potremo fare sarà di formare una miscela dei vari valori di m appartenenti allo stesso j. In generale, si avrà quindi una certa ampiezza che, nel riferimento con gli assi ruotati, il sistema si trovi nello stato | j, m 0i, dove m 0 indica la nuova componente z del momento angolare. Perciò quello che stiamo cercando sono tutti gli elementi di matrice h j, m 0 | R | j, mi per le varie rotazioni. Noi sappiamo già quello che succede quando ruotiamo di un angolo intorno all’asse z. Il nuovo stato è semplicemente quello vecchio moltiplicato per eim , e ha sempre lo stesso valore di m. Possiamo esprimere questo scrivendo Rz ( ) | j, mi = eim | j, mi
(18.24)
Oppure, se preferite h j, m 0 | Rz ( ) | j, mi =
m,m0 e
im
(18.25)
(dove m,m0 vale 1 se m 0 = m, e zero negli altri casi). Per una rotazione intorno a un qualsiasi altro asse avremo una miscela dei vari stati m. Naturalmente potremmo cercare di valutare gli elementi di matrice per una rotazione arbitraria descritta dagli angoli di Eulero , ↵ e . Ma è più semplice ricordare che la più generale rotazione di questo tipo può essere costruita con tre rotazioni Rz ( ), Ry (↵) e Rz ( ); perciò, se calcoliamo gli elementi di matrice per una rotazione intorno all’asse y, abbiamo tutto quel che ci serve. Come possiamo trovare gli elementi della matrice di rotazione che corrisponde a una rotazione di un angolo ✓ intorno all’asse y per una particella di spin j? Non possiamo ricavare il risultato in generale, partendo da principi fondamentali (con i mezzi che conosciamo). Lo abbiamo già fatto per il caso dello spin un mezzo, facendo uso di complicati ragionamenti basati su considerazioni di simmetria. Lo abbiamo fatto per lo spin uno, considerando il caso particolare di un sistema di spin uno che fosse composto da due particelle di spin un mezzo. Se voi ci seguite e accettate il fatto che nel caso generale la risposta dipenda soltanto dallo spin j, ed è indipendente dalla maniera con cui sono sistemate le interiora dell’oggetto di spin j, noi possiamo estendere i ragionamenti che abbiamo fatto per lo spin uno a uno spin arbitrario. Per esempio, possiamo fabbricarci un sistema artificiale di spin 3/2 a partire da tre oggetti di spin un mezzo. Possiamo anche evitare complicazioni immaginando che si tratti di particelle tutte distinte tra loro, come un protone, un elettrone e un muone. Trasformando ciascuno degli oggetti a spin un mezzo separatamente, possiamo andare a vedere cosa succede all’intero sistema, ricordando che le tre ampiezze sono moltiplicate tra loro per formare lo stato composto. Vediamo ora come vanno le cose in questo caso. Supponiamo di prendere tre oggetti di spin un mezzo, tutti con lo spin «su»; possiamo indicare questo stato con | + + +i. Se consideriamo questo sistema nel riferimento ruotato dell’angolo intorno all’asse z, ciascuno dei più rimane un più, ma viene moltiplicato per ei /2 . Abbiamo tre di questi fattori, e perciò Rz ( ) | + + +i = ei(3 /2) | + + +i (18.26) Evidentemente, lo stato | + + +i è proprio quello che intendiamo per uno stato con m = +3/2, cioè si ha + 3 3 , + = | + + +i 2 2 Se ora ruotiamo questo sistema intorno all’asse y, ciascuno degli oggetti di spin un mezzo avrà una certa ampiezza di probabilità di diventare un più o un meno, perciò il sistema sarà ora una
18.4 • Matrice di rotazione per uno spin qualsiasi
© 978-8808-22107-0
mescolanza delle otto possibili combinazioni: |+ |+ |+ | |+ | | |
+ +i + i +i + +i i + i +i i
È chiaro, però, che queste possono essere divise in quattro gruppi, uno per ogni particolare valore di m. Per primo, abbiamo lo stato | + + +i, per il quale m = 3/2. Poi vi sono i tre stati | + + i, | + +i e | + +i, ciascuno con due più e un meno. Poiché ogni oggetto di spin un mezzo ha la stessa probabilità di diventare un meno per effetto della rotazione, ciascuna di queste tre combinazioni deve essere contenuta in uguale quantità. Prendiamo perciò la combinazione ⌘ 1 ⇣ (18.27) p | + + i + | + +i + | + +i 3 p dove abbiamo posto un fattore 1/ 3 per normalizzare lo stato. Se ruotiamo questo stato intorno all’asse z, otteniamo un fattore ei /2 per ogni più ed e i /2 per ogni meno. Ogni termine nella (18.27) è moltiplicato per ei /2 , che quindi è un fattore comune. Questo soddisfa alla nostra idea di uno stato con m = +1/2; ne concludiamo perciò che + ⌘ 1 ⇣ 3 1 (18.28) p | + + i + | + +i + | + +i = , + 2 2 3
Similmente, possiamo scrivere
1 ⇣ p |+ 3
i+|
+
i+|
+ ⌘ 3 1 +i = , 2 2
(18.29)
che corrisponde a uno stato con m = 1/2. Notate che abbiamo preso solo combinazioni simmetriche, cioè che non si hanno mai combinazioni con il segno meno. Esse corrisponderebbero a stati conplo stesso m, ma con j differente. (È come nel caso dello spin p uno, dove avevamo trovato che (1/ 2)(| + i + | +i) era lo stato | 1, 0i, ma che lo stato (1/ 2)(| + i | +i) era lo stato | 0, 0i.) Infine si ottiene che + 3 3 , =| i (18.30) 2 2
I nostri quattro stati sono riassunti nella TABELLA 18.1. Ora tutto quello che dobbiamo fare è di prendere ciascuno di questi stati, ruotarlo intorno all’asse y e vedere in che quantità produce gli altri stati, sempre facendo uso della matrice di rotazione per le particelle di spin un mezzo che già conosciamo. Possiamo proseguire esattamente nello stesso modo che avevamo seguito per il caso dello spin uno nel paragrafo 12.6. (Ci vuole soltanto un po’ di calcolo algebrico in più.) Noi seguiremo direttamente le idee sviluppate nel capitolo 12, perciò non ripeteremo in dettaglio tutte le spiegazioni. Gli stati del sistema S saranno caratterizzati come nel modo seguente: + 3 3 , + , S = | + + +i 2 2 + ⌘ 3 1 1 ⇣ , + , S = p | + + i + | + +i + | + +i 2 2 3
283
284
Capitolo 18 • Il momento angolare
TABELLA
© 978-8808-22107-0
18.1 3 3 ,+ 2 2
+
+i + |
3 1 + +i = , + 2 2
+
i+|
3 1 +i = , 2 2
+
3 3 , 2 2
+
| + + +i = 1 ⇣ p |+ + 3 1 ⇣ p |+ 3
i+|+ i+|
|
+
⌘ ⌘
i=
e così via. Il sistema T sarà quello ruotato di un angolo ✓ rispetto all’asse y di S. Gli stati di T saranno caratterizzati nel modo seguente: + 3 3 ,+ ,T 2 2 + 3 1 ,+ ,T 2 2 e così via. Naturalmente si ha
+ 3 3 , + , T = | +0 +0 +0i 2 2
dove gli apici si riferiscono sempre al sistema T. Analogamente si ha + ⌘ 3 1 1 ⇣ , + , T = p | +0 +0 0i + | +0 0 +0i + | 0 +0 +0i 2 2 3
e così via. Ogni stato | +0i nel sistema T deriva sia dagli stati | +i sia da quelli | i in S, tramite gli elementi di matrice della TABELLA 12.4. Quando si hanno tre particelle di spin un mezzo, l’equazione (12.47) viene sostituita da ⇣ ⌘ | + + +i = a3 | +0 +0 +0i + a2 b | +0 +0 0i + | +0 0 +0i + | 0 +0 +0i + (18.31) ⇣ ⌘ + ab2 | +0 0 0i + | 0 +0 0i + | 0 0 +0i + b3 | 0 0 0i
Facendo uso della trasformazione della TABELLA 12.4, otteniamo, invece della (12.48), l’equazione + + + p 2 3 1 3 3 3 3 3 ,+ ,S = a ,+ ,T + 3 a b ,+ ,T + 2 2 2 2 2 2 (18.32) + + p 1 3 2 3 3 3 + 3 ab , ,T + b , ,T 2 2 2 2 Questa già ci fornisce diversi dei nostri elementi di matrice h jT | iSi. Per ricavare l’espressione per | 3/2, +1/2, Si, cominciamo con la trasformazione di uno stato con due «+» e un « ». Per esempio |+ +
i = a2 c | +0 +0 +0i + a2 d | +0 +0 + bac |
0
+ b2 c |
0
0
+0 +0i + abd | +0 0
+0i + b2 d |
0
i + abc | +0
0 0
0 0
i + bad |
i
0
+0i +
0
+0
0
i+
(18.33)
18.4 • Matrice di rotazione per uno spin qualsiasi
© 978-8808-22107-0
18.2 Matrice di rotazione per una particella di spin 3/2. (I coefficienti a, b, c e d sono riportati nella TABELLA 12.4.) TABELLA
+
3 1 ,+ ,S 2 2
+
3 1 , ,S 2 2
+
h jT | iSi
3 3 ,+ ,S 2 2
*
3 3 ,+ ,T 2 2
a3
p 2 3a c
p 3ac2
c3
*
3 1 ,+ ,T 2 2
p 2 3a b
a2 d + 2abc
c2 b + 2dac
p 2 3c d
*
3 1 , ,T 2 2
p 3ab2
2bad + b2 c
2cbd + d 2 a
p 3cd 2
*
3 3 , ,T 2 2
b3
p 2 3b d
p
3bd 2
3 3 , ,S 2 2
+
d3
p Sommando due analoghe espressioni per | + +i e per | + +i, e dividendo per 3, otteniamo + + + p 2 3 3 3 1 3 1 2 , + , S = 3 a c , + , T + (a d + 2abc) , + , T + 2 2 2 2 2 2 (18.34) + + p 2 3 3 3 1 2 + (2bad + b c) , , T + 3 b d , , T 2 2 2 2 Continuando il procedimento, possiamo trovare tutti gli elementi h jT | iSi della matrice di trasformazione, che sono riportati in TABELLA 18.2. La prima colonna deriva dall’equazione (18.32); la seconda dalla (18.34). Le ultime due colonne sono state costruite allo stesso modo. Supponiamo ora che il riferimento T fosse ruotato rispetto a S dell’angolo ✓ intorno all’asse y. Allora a, b, c e d avrebbero i valori (vedi (12.54)) a = d = cos
✓ 2
c = b = sen
✓ 2
Facendo uso di questi valori nella TABELLA 18.2, otteniamo le formule che corrispondono alla seconda parte della TABELLA 17.2, ma che ora si riferiscono a un sistema di spin 3/2. I ragionamenti che abbiamo appena svolto possono essere facilmente generalizzati a un sistema di spin qualsiasi j. Gli stati | j, mi possono essere costruiti da un insieme di 2 j particelle, ciascuna di spin un mezzo. (Ve ne sono j + m di esse nello stato | +i e j m nello stato | i.) Bisogna sommare su tutti i possibili modi in cui questo può essere fatto e lo stato viene poi normalizzato moltiplicandolo per un’opportuna costante. Quelli di voi che sono più portati per la matematica saranno forse in grado di dimostrare che si ottiene il seguente risultato(7) : h j, m 0 | Ry (✓) | j, mi = [( j + m)!( j ·
m)!( j + m 0)!( j
m 0)!]1/2 ·
X ( 1)k+m m0 (cos ✓/2)2j+m0 m 2k (sen ✓/2)m m0 +2k (m m 0 + k)!( j + m 0 k)!( j m k)!k! k
(18.35)
dove k assume tutti i valori che danno luogo a termini 0 in tutti i fattoriali. Questa formula è proprio orrenda, ma, facendone uso, potrete controllare la TABELLA 17.2 per j = 1 e costruire voi stessi tabelle per j più elevati. Parecchi degli elementi di matrice hanno (7)
Se volete i dettagli, li troverete in un’appendice di questo capitolo.
285
286
Capitolo 18 • Il momento angolare
© 978-8808-22107-0
una grandissima importanza, e per questo hanno ricevuto dei nomi particolari. Per esempio, gli elementi di matrice per m = m 0 = 0 e j intero sono noti sotto il nome di polinomi di Legendre e sono indicati con Pj (cos ✓): h j, 0 | Ry (✓) | j, 0i = Pj (cos ✓) (18.36) I primi di questi polinomi sono: P0 (cos ✓) = 1
(18.37)
P1 (cos ✓) = cos ✓
(18.38)
1⇣ 3 cos2 ✓ 2 1⇣ P3 (cos ✓) = 5 cos3 ✓ 2 P2 (cos ✓) =
18.5
1
⌘
3 cos ✓
(18.39) ⌘
(18.40)
Misura di uno spin nucleare
Vogliamo ora presentarvi un esempio dell’uso dei coefficienti che abbiamo appena ricavato. Questo esempio è collegato a un recente e interessante esperimento che ora siamo in grado di capire. Alcuni fisici volevano trovare lo spin di un certo stato eccitato del nucleo Ne20 . Per farlo, hanno bombardato un bersaglio di carbonio con un fascio di ioni di carbonio accelerati, producendo così lo stato eccitato del Ne20 che stavano considerando, detto Ne20* , per mezzo della reazione C12 + C12 ! Ne20⇤ + ↵1 dove ↵1 è la particella ↵, cioè He4 . Molti degli stati eccitati del Ne20 , prodotti in questo modo, sono instabili e si disintegrano secondo la reazione Ne20⇤ ! O16 + ↵2 Perciò, sperimentalmente, si vedono due particelle ↵ che vengono prodotte nella reazione. Le chiameremo ↵1 e ↵2 ; poiché esse vengono emesse con energie differenti, possono essere distinte l’una dall’altra. Inoltre, fissando una particolare energia per ↵1 , possiamo selezionare ogni possibile stato eccitato del Ne20 . L’esperimento era stato progettato come mostrato in FIGURA 18.9. Un fascio di ioni di carbonio da 16 MeV veniva inviato contro un sottile foglio di carbonio. La prima particella ↵ veniva conteggiata in un rivelatore a giunzione di silicio ottenuto per diffusione, indicato con ↵1 , predisposto in modo da rivelare le particelle ↵ di energia giusta emesse in avanti (rispetto al fascio incidente di C12 ). La seconda particella ↵ veniva rivelata nel rivelatore ↵2 , posto a un angolo ✓ rispetto ad ↵1 . La frequenza Rivelatore al silicio a giunzione di conteggio dei segnali in coincidenza tra ↵1 e ↵2 veniva misurata in funzione dell’angolo ✓. L’idea che sta sotto a questo esperimento è la seguente. Per prima cosa, dovete sapere che gli spin di C12 , O16 e della particella ↵ sono tutti zero. Se Fascio di C12 indichiamo con +z la direzione del moto iniziale del C12 , sappiamo che il da 16 MeV Ne20* deve avere momento angolare zero rispetto all’asse z. Nessuna delle altre particelle ha spin; il C12 arriva lungo l’asse z e la ↵1 se ne va lungo Foglio di carbonio l’asse z, e quindi esse non possono avere alcun momento angolare rispetto a tale asse. Perciò, qualunque sia lo spin j del Ne20* noi sappiamo che esso si trova in uno stato | j, 0i. Che succede ora quando il Ne20* si disintegra in FIGURA 18.9 Dispositivo sperimentale per 20 un O16 e in una seconda particella ↵? Ebbene, la particella ↵ viene catturata determinare lo spin di certi stati del Ne .
18.6 • Composizione dei momenti angolari
nel contatore ↵2 e, perché l’impulso sia conservato, l’O16 deve dirigersi in direzione opposta(8) . Non ci può essere alcuna componente del momento angolare rispetto al nuovo asse che passi per ↵2 . Lo stato finale ha momento angolare zero rispetto a questo nuovo asse, e quindi il Ne20* può disintegrarsi in questo modo solo se ha una certa ampiezza di probabilità di avere m 0 uguale a zero, dove m 0 è il numero quantico della componente del momento angolare rispetto al nuovo asse. Infatti la probabilità di osservare ↵2 a un angolo ✓ è semplicemente uguale al quadrato dell’ampiezza (cioè dell’elemento di matrice) h j, 0 | Ry (✓) | j, 0i
(18.41)
287
Stato a 5,80 MeV J=1 0,12
[Coincidenze/direz.]CM per steradiante
© 978-8808-22107-0
0,10 0,08 0,06 0,04 0,02 Stato a 5,63 MeV
J=3 Per trovare lo spin del particolare stato del Ne20* in esame, l’intensità della 0,06 seconda particella ↵ veniva riportata in grafico in funzione dell’angolo 0,04 e confrontata con le curve teoriche calcolate per vari valori di j. Come abbiamo detto nel precedente paragrafo, le ampiezze h j, 0 | Ry (✓) | j, 0i so0,02 no proprio le funzioni Pj (cos ✓). Quindi le possibili distribuzioni angolari 20 40 60 80 100 120 140 160 sono le curve di [Pj (cos ✓)]2 . I risultati sperimentali sono mostrati in FIGUAngolo nel centro di massa in gradi RA 18.10, per due degli stati eccitati. Si vede che la distribuzione angolare per lo stato di 5,80 MeV si accorda assai bene alla curva di [P1 (cos ✓)]2 , e quindi deve trattarsi di uno stato di spin uno. I dati per lo stato di 5,63 MeV FIGURA 18.10 Risultati sperimentali sulla angolare delle particelle α dai due stati sono, d’altra parte, completamente diversi; essi si accordano con la curva distribuzione eccitati del Ne20 , prodotte col dispositivo della 2 di [P3 (cos ✓)] . Questo stato ha spin 3. FIGURA 18.9. (Da J.A. Kuehner, Physical Review, Da questo esperimento siamo stati in grado di dedurre il momento Vol. 125, p. 1653, 1962.) angolare di due degli stati eccitati del Ne20* . Questa informazione può essere usata per cercare di comprendere qual è la configurazione dei protoni e dei neutroni all’interno del nucleo e rappresenta perciò un nuovo contributo alla conoscenza delle misteriose forze nucleari.
18.6
Composizione dei momenti angolari
Quando abbiamo studiato la struttura iperfine dell’atomo di idrogeno nel capitolo 12, abbiamo dovuto ricavarci gli stati interni di un sistema composto di due particelle, l’elettrone e il protone, ciascuna di spin un mezzo. Avevamo trovato allora che i quattro possibili stati di spin di un tale sistema potevano essere divisi in due gruppi: un gruppo che aveva una certa energia e che si presentava all’esterno come una particella di spin uno, e un altro gruppo che si comportava come una particella di spin zero. Cioè, mettendo insieme due particelle di spin un mezzo, possiamo formare un sistema il cui «spin totale» è uno, oppure zero. In questo paragrafo discuteremo, con maggiore generalità, gli stati di spin di un sistema costituito da due particelle di spin qualsiasi. Si tratta di un altro problema importante che riguarda il momento angolare dei sistemi quantistici. Riscriviamo prima di tutto i risultati del capitolo 12 per l’atomo d’idrogeno in una forma che sia più facilmente estendibile al caso generale. Cominciamo col considerare due particelle, che chiameremo ora particella a (l’elettrone) e particella b (il protone). La particella a ha spin j a (= 1/2), e la componente z del suo momento angolare, m a , può prendere l’uno o l’altro di una successione di valori (in realtà 2, cioè m a = +1/2 oppure m a = 1/2). Analogamente, lo stato di spin della particella b viene descritto dando il suo spin, jb , e la sua componente z, mb . Si possono formare varie combinazioni degli stati di spin delle due particelle. Per esempio, potremmo avere la particella a con m a = 1/2 e la particella b con mb = 1/2, in modo da formare uno stato | a, +1/2; b, 1/2i. In generale, gli stati ottenuti per combinazione formeranno un sistema in cui lo «spin del sistema», o «spin totale», o «momento angolare totale» J, potrà essere 1, oppure 0. (8) Possiamo trascurare il rinculo del Ne20* nella prima collisione. O meglio, possiamo calcolarlo e fare poi le correzioni dovute a questo fatto.
288
Capitolo 18 • Il momento angolare
TABELLA
18.3
© 978-8808-22107-0
Composizione dei momenti angolari per due particelle di spin 1/2 (j a =1/2, j b =1/2).
1 1 | J = 1, M = +1i = a, + ; b, + 2 2
+
+ + 1 1 1 1 1 | J = 1, M = 0i = p * a, + ; b, + a, ; b, + + 2 2 2 2 2 , + 1 1 | J = 1, M = 1i = a, ; b, 2 2 1 1 1 | J = 0, M = 0i = p * a, + ; b, 2 2 2 ,
+
+ 1 1 + a, ; b, + 2 2 -
E tale sistema potrà avere una componente z del momento angolare, M, che può essere +1, 0 o 1, quando J = 1, oppure 0 quando J = 0. Con questo nuovo linguaggio possiamo riscrivere le formule (12.41) e (12.42) nella forma mostrata nella TABELLA 18.3. In questa tabella la colonna di sinistra descrive lo stato composto per mezzo del suo momento angolare totale J e della sua componente z, M. La colonna di destra fa vedere come questi stati siano costruiti tramite i vari valori di m delle due particelle a e b. Adesso vogliamo generalizzare questo risultato a stati composti da due oggetti a e b di spin arbitrari j a e jb . Cominciamo col considerare un esempio per cui sia j a = 1/2 e jb = 1, cioè l’atomo di deuterio, in cui la particella a è un elettrone (simbolo «e») e la particella b è il nucleo, cioè il deutone (simbolo «d»). Abbiamo allora che j a = je = 1/2. Il deutone è formato da un protone e un neutrone in uno stato in cui lo spin totale è uno, e perciò jb = jd = 1. Studiamo ora la struttura iperfine del deuterio, allo stesso modo usato per l’idrogeno. Poiché il deutone ha tre possibili stati mb = md = +1, 0 e 1, e l’elettrone ne ha due, m a = me = +1/2 e 1/2, vi sono sei possibile stati, che sono i seguenti (usando la notazione | e, me ; d, md i): + 1 e, + ; d, +1 2 + + 1 1 e, + ; d, 0 e, ; d, +1 2 2 (18.42) + + 1 1 e, + ; d, 1 e, ; d, 0 2 2 + 1 e, ; d, 1 2 Noterete che abbiamo raggruppato gli stati a seconda del valore della somma di me e md , elencandoli in ordine decrescente. Ora ci chiediamo: che succede di questi stati se li proiettiamo in un diverso sistema di coordinate? Se il nuovo sistema si ottiene semplicemente con una rotazione dell’angolo intorno a z, allora lo stato | e, me ; d, md i risulta moltiplicato per eime eimd = ei(me +md )
(18.43)
(Si può pensare lo stato come il prodotto | e, me i | d, md i, e ciascun vettore di stato contribuisce indipendentemente col proprio fattore esponenziale.) Il fattore (18.43) è della forma ei M , e quindi lo stato | e, me ; d, md i ha una componente z del momento angolare uguale a M = me + md
(18.44)
18.6 • Composizione dei momenti angolari
© 978-8808-22107-0
La componente z del momento angolare totale è la somma delle componenti z dei momenti angolari delle singole parti. Nella lista (18.42), perciò, lo stato della prima riga ha M = +3/2, i due in seconda riga hanno M = +1/2, i due successivi hanno M = 1/2 e l’ultimo ha M = 3/2. Si vede immediatamente che una possibilità per lo spin J dello stato composto (cioè per il suo momento angolare totale) deve essere 3/2 e questa richiede quattro stati con M = +3/2, +1/2, 1/2 e 3/2. Vi è un solo candidato per M = 3/2, e quindi abbiamo già trovato che + + 3 3 1 J = , M = + = e, + ; d, +1 (18.45) 2 2 2 Ma qual è lo stato | J = 3/2, M = 1/2i? Abbiamo due candidati nella seconda riga della (18.42) e, per di più, qualsiasi loro combinazione lineare avrebbe ancora M = 1/2. Perciò, in generale, ci dobbiamo aspettare di trovare che + + + 3 1 1 1 J = , M = + = ↵ e, + ; d, 0 + e, ; d, +1 (18.46) 2 2 2 2 dove ↵ e sono due numeri. Essi vengono chiamati coefficienti di Clebsch-Gordan. Il nostro prossimo problema consiste nel trovarli. Il nostro compito risulta facile se ci ricordiamo che il deutone è costituito da un neutrone e da un protone, e se scriviamo più esplicitamente gli stati del deutone, seguendo le regole della TABELLA 18.3. Così facendo, otteniamo gli stati elencati nella (18.42), nella forma mostrata nella TABELLA 18.4. Vogliamo ora costruire i quattro stati con J = 3/2, facendo uso degli stati che compaiono nella tabella. Ma noi sappiamo già qual è la risposta perché nella TABELLA 18.1 troviamo gli stati di spin 3/2, costruiti a partire da tre particelle di spin un mezzo. Il primo stato della TABELLA 18.1 ha | J = 3/2, M = +3/2i ed è | + + +i, che, nelle nostre attuali notazioni, equivale a | e, +1/2; n, +1/2; p, +1/2i, cioè al primo stato della TABELLA 18.4. Ma questo stato è anche il primo dell’elenco (18.42), e ciò conferma la nostra affermazione contenuta nella (18.45). La seconda riga della TABELLA 18.1, trasformandola nelle nostre attuali notazioni, ci dice che + 3 1 J = ,M =+ = 2 2 (18.47) + + + 1 * 1 1 1 1 1 1 1 1 1 + =p e, + ; n, + ; p, + e, + ; n, ; p, + + e, ; n, + ; p, + 2 2 2 2 2 2 2 2 2 3 , Il secondo membro può evidentemente essere formato a partire p dai due elementi della seconda riga della TABELLA 18.4 , moltiplicando il primo termine per 2/3 e sommandogli il secondo p moltiplicato per 1/3. In altre parole, l’equazione (18.47) è equivalente a + r + r + 3 1 2 1 1 1 J = ,M =+ = e, + ; d, 0 + e, ; d, +1 (18.48) 2 2 3 2 3 2
Abbiamo così trovato i nostri due coefficienti di Clebsch-Gordan ↵ e r r 2 1 ↵= = 3 3
dell’equazione (18.46):
Seguendo ancora lo stesso procedimento, possiamo trovare che + r + r + 1 1 2 3 1 1 J = ,M = = e, + ; d, 1 + e, ; d, 0 2 2 3 2 3 2 Inoltre, naturalmente,
3 J = ,M = 2
+ + 3 1 = e, ; d, 1 2 2
(18.49)
(18.50)
(18.51)
289
290
Capitolo 18 • Il momento angolare
TABELLA
18.4
© 978-8808-22107-0
Stati del momento angolare di un atomo di deuterio.
3 2 + + 1 1 1 1 e, + ; d, +1 = e, + ; n, + ; p, + 2 2 2 2 M=
M=
1 2
+ + + 1 1 1 1 1 1 1 1 e, + ; d, 0 = p * e, + ; n, + ; p, + e, + ; n, ; p, + + 2 2 2 2 2 2 2 2 , + + 1 1 1 1 e, ; d, +1 = e, ; n, + ; p, + 2 2 2 2 1 2 + + 1 1 1 1 e, + ; d, 1 = e, + ; n, ; p, 2 2 2 2 M=
+ + + 1 1 * 1 1 1 1 1 1 + e, ; d, 0 = p e, ; n, + ; p, + e, ; n, ; p, + 2 2 2 2 2 2 2 2 , 3 2 + + 1 1 1 1 e, ; d, 1 = e, ; n, ; p, 2 2 2 2 M=
Queste sono le regole per la composizione di uno spin 1 e di uno spin 1/2 per formare un totale J = 3/2. Riassumiamo le (18.45), (18.48), (18.50) e (18.51) nella TABELLA 18.5. Tuttavia ora abbiamo solo quattro stati; mentre il sistema che stiamo considerando ha sei stati possibili. Dei due stati della seconda riga della (18.42), ne abbiamo usato una sola combinazione lineare per formare | J = 3/2, M = +1/2i. Vi è un’altra combinazione, ortogonale a quella che abbiamo già preso, che ha ancora M = +1/2, cioè r
1 1 e, + ; d, 0 3 2
r
+
+ 2 1 e, ; d, +1 3 2
(18.52)
Analogamente, i due stati della terza riga della (18.42) possono essere combinati in modo da dar luogo a due stati ortogonali, ciascuno con M = 1/2. La combinazione ortogonale alla (18.52) è r
2 1 e, + ; d, 1 3 2
+
r
+ 1 1 e, ; d, 0 3 2
(18.53)
Questi sono i due stati che ancora ci restano. Essi hanno M = me + md = ±1/2; e devono essere
18.6 • Composizione dei momenti angolari
© 978-8808-22107-0
TABELLA
18.5
Gli stati J = 3/2 per un atomo di deuterio.
+ + 3 3 1 J = , M = + = e, + ; d, +1 2 2 2 + r + r + 3 1 2 1 1 1 J = ,M =+ = e, + ; d, 0 + e, ; d, +1 2 2 3 2 3 2 3 J = ,M = 2
+ r + r + 1 1 1 2 1 = e, + ; d, 1 + e, ; d, 0 2 3 2 3 2
3 J = ,M = 2
+ + 3 1 = e, ; d, 1 2 2
due stati che corrispondono a J = 1/2. Perciò si ha + r + 1 1 1 1 J = ,M =+ = e, + ; d, 0 2 2 3 2 1 J = ,M = 2
+
1 = 2
r
+ 2 1 e, + ; d, 1 3 2
r
+ 2 1 e, ; d, +1 3 2
r
(18.54)
+ 1 1 e, ; d, 0 3 2
Possiamo verificare che questi due stati si comportano davvero come gli stati di un oggetto a spin un mezzo esprimendo quelle parti che si riferiscono al deutone per mezzo degli stati di protone e di neutrone, servendoci della TABELLA 18.4. Il primo stato della (18.52) è r
+ + 1 * 1 1 1 1 1 1 + e, + ; n, + ; p, + e, + ; n, ; p, + 6 , 2 2 2 2 2 2 -
r
2 1 1 1 e, ; n, + ; p, + 3 2 2 2
+
(18.55)
che può essere anche scritto come r
26r 66 1 66 2 4 r 1 + 2
1 3
* e, + 1 ; n, + 1 ; p, 1 2 2 2 ,
* e, + 1 ; n, 1 ; p, + 1 2 2 2 ,
+ +
+ 1 1 1 + e, ; n, + ; p, + + 2 2 2 + 3 1 1 1 + 77 7 e, ; n, + ; p, + 2 2 2 - 77 5
(18.56)
Considerate ora i termini che compaiono tra le prime parentesi tonde, e pensate di raggruppare insieme e e p. Insieme essi formano uno stato di spin zero (vedi l’ultima riga della TABELLA 18.3), e non danno alcun contributo al momento angolare. Resta solo il neutrone, e perciò la prima espressione tra parentesi tonde nella (18.56) si comporta per rotazione come un neutrone, cioè come uno stato con J = 1/2, M = +1/2. Ripetendo lo stesso ragionamento, si vede che nella seconda espressione tra parentesi tonde della (18.56), l’elettrone e il neutrone, presi insieme, producono un momento angolare nullo, così che rimane il solo contributo del protone, con mp = 1/2. Perciò, tutti i termini si comportano come oggetti con J = 1/2, M = +1/2, e quindi, l’intera espressione (18.56) si trasforma come | J = +1/2, M = +1/2i, come doveva essere. Lo stato con M = 1/2 corrispondente alla (18.53) può essere scritto (cambiando gli opportuni +1/2
291
292
Capitolo 18 • Il momento angolare
© 978-8808-22107-0
in 1/2) per ottenere r
26r 66 1 66 2 4 r 1 + 2
1 3
* e, + 1 ; n, 1 ; p, 1 2 2 2 ,
* e, + 1 ; n, 1 ; p, 1 2 2 2 ,
+ +
+ 1 1 1 + e, ; n, ; p, + + 2 2 2 + 3 1 1 1 + 77 7 e, ; n, + ; p, 2 2 2 - 77 5
(18.57)
Potete facilmente controllare che questa espressione è uguale alla seconda riga della (18.54), come deve essere, se i due termini ivi contenuti sono i due stati di un sistema a spin un mezzo. Perciò i nostri risultati sono stati confermati. Un deutone e un elettrone possono esistere in sei stati di spin, quattro dei quali si comportano come gli stati di un oggetto a spin 3/2 (TABELLA 18.5) e gli altri due come un oggetto di spin un mezzo (18.54). I risultati della TABELLA 18.5 e dell’equazione (18.54) sono stati ottenuti servendoci del fatto che il deutone è costituito da un neutrone e un protone. Ma la verità delle affermazioni contenute nelle equazioni non dipende da questa particolare circostanza. Per un qualsiasi oggetto di spin uno, accoppiato a un qualsiasi oggetto di spin un mezzo, le leggi di composizione (e i coefficienti) sono le stesse. L’insieme delle equazioni di TABELLA 18.5 significa che, se le coordinate vengono ruotate, per esempio intorno all’asse y, di modo che gli stati della particella di spin un mezzo e quelli della particella di spin uno cambiano secondo la TABELLA 17.1 e la TABELLA 17.2, allora le combinazioni lineari al secondo membro si trasformano nella maniera propria di un oggetto di spin 3/2. Per effetto della stessa rotazione, gli stati della (18.54) si trasformeranno come gli stati di un oggetto a spin un mezzo. I risultati dipendono soltanto dalle proprietà di rotazione (cioè, dagli stati di spin) delle due particelle originali, ma non dipendono in alcun modo dall’origine dei loro momenti angolari. Noi ci siamo serviti di questo fatto solo per ricavare le formule, scegliendo un caso particolare in cui una delle due parti componenti è a sua volta costituita da due particelle a spin un mezzo che si trovano in uno stato simmetrico. Abbiamo riunito tutti i nostri risultati nella TABELLA 18.6, cambiando la notazione da «e» e «d» in «a» e «b» per mettere in rilievo la generalità delle conclusioni. Supponiamo ora d’avere il problema generale di trovare gli stati che si possono formare quando si combinano due oggetti di spin arbitrario. Uno, per esempio, abbia spin j a (così che la sua componente z, m a , possa assumere uno dei 2 j a + 1 valori, da j a a + j a ), e l’altro abbia spin jb (con componente z, mb , che varia da jb a + jb ). Gli stati composti sono | a, m a ; b, mb i, e ve ne sono (2 j a + 1)(2 jb + 1) differenti. Quali sono ora i possibili stati di spin totale J che sarà possibile trovare? La componente z del momento angolare totale, M, è uguale a m a + mb , e tutti gli stati possono essere elencati secondo il valore di M (come nella (18.42)). Il massimo valore di M è unico; esso corrisponde a m a = j a e mb = jb , e perciò, è semplicemente uguale a j a + jb . Ciò significa che anche il massimo spin totale J è uguale alla somma j a + jb : J = (M)max = j a + jb Per il primo valore di M minore di (M)max , vi sono due stati (sia m a sia mb possono avere un valore inferiore di un’unità al valore massimo). Uno di essi fa parte dell’insieme che ha J = j a + jb , e quello rimasto apparterrà a un nuovo insieme con J = j a + jb 1. Il valore successivo di M, il terzo partendo dalla cima dell’elenco, può essere formato in tre modi. (Con m a = j a 2, mb = jb ; con m a = j a 1, mb = jb 1; e con m a = j a , mb = jb 2.) Due di questi stati appartengono ai gruppi che abbiamo già ricordato; il terzo ci dice che ora dobbiamo includere anche gli stati con J = j a + jb 2. Si può continuare con questi ragionamenti finché non si raggiunge un punto in cui la nostra lista non può più proseguire a diminuire gli m di un’unità, in modo da formare nuovi stati. Sia jb il minore dei due numeri j a e jb (se sono uguali, prendetene uno qualunque dei due); allora, sono necessari solo 2 jb valori di J, che differiscono di un intero da j a + jb fino a j a jb . Cioè, quando due oggetti di spin j a e jb vengono combinati tra loro, il sistema risultante può
18.6 • Composizione dei momenti angolari
© 978-8808-22107-0
TABELLA
18.6
Composizione di una particella a spin 1/2 (j a =1/2) e di una particella a spin 1 (j b =1).
+ + 3 3 1 J = , M = + = a, + ; b, +1 2 2 2 + r + r + 3 1 2 1 1 1 J = ,M =+ = a, + ; b, 0 + a, ; b, +1 2 2 3 2 3 2 3 J = ,M = 2
+ r + r + 1 1 1 2 1 = a, + ; b, 1 + a, ; b, 0 2 3 2 3 2
3 J = ,M = 2
+ + 3 1 = a, ; b, 1 2 2
+ r + 1 1 1 1 J = ,M =+ = a, + ; b, 0 2 2 3 2 1 J = ,M = 2
+ r + 1 2 1 = a, + ; b, 1 2 3 2
r
+ 2 1 a, ; b, +1 3 2
r
+ 1 1 a, ; b, 0 3 2
avere un momento angolare J uguale a uno qualsiasi dei seguenti valori: 8 > ja + > > > > > > ja + > > > > < J = > ja + > > .. > > > . > > > > > | ja :
jb jb jb
1 2
(18.58)
jb |
(Scrivendo | j a jb | invece di j a jb , possiamo evitare l’ulteriore condizione j a jb .) Per ciascuno di questi valori di J, vi sono 2J + 1 stati con differente valore di M, con M che varia da +J a J. Ciascuno di questi è costruito come combinazione lineare degli stati originali | a, m a ; b, mb i, ciascuno moltiplicato per opportuni fattori, cioè per i coefficienti di ClebschGordan di quel particolare termine. Possiamo pensare che questi coefficienti ci determinino «quanto» dello stato | j a, m a ; jb, mb i compare nello stato | J, Mi. Quindi, se si vuole, ogni coefficiente di Clebsch-Gordan ha sei indici che ne identificano la posizione nelle formule del tipo di quelle delle TABELLE 18.3 e 18.6. Quindi, indicando questi coefficienti con C(J, M; j a, m a ; jb, mb ), possiamo esprimere l’uguaglianza della seconda riga della TABELLA 18.6 scrivendo ! r 3 1 1 1 2 C , + ; , + ; 1, 0 = 2 2 2 2 3 ! r 3 1 1 1 1 C ,+ ; , ; 1, +1 = 2 2 2 2 3 Non ci metteremo ora a calcolare qui i coefficienti per gli altri vari casi particolari (9) . Comunque, se ne possono trovare i valori nelle tabelle di molti libri. Forse avreste voglia di provare a farvi (9) Una gran parte del lavoro è ormai già fatta, ora che abbiamo la matrice di rotazione per il caso generale, equazione (18.35).
293
294
Capitolo 18 • Il momento angolare
TABELLA
18.7
© 978-8808-22107-0
Composizione di due particelle a spin 1 (j a =1, j b =1).
| J = 2, M = +2i = | a, +1; b, +1i 1 1 | J = 2, M = +1i = p | a, +1; b, 0i + p | a, 0; b, +1i 2 2 1 1 2 | J = 2, M = 0i = p | a, +1; b, 1i + p | a, 1; b, +1i + p | a, 0; b, 0i 6 6 6 1 1 | J = 2, M = 1i = p | a, 0; b, 1i + p | a, 1; b, 0i 2 2 | J = 2, M = 2i = | a, 1; b, 1i
1 | J = 1, M = +1i = p | a, +1; b, 0i 2 1 | J = 1, M = 0i = p | a, +1; b, 1i 2 1 | J = 1, M = 1i = p | a, 0; b, 1i 2
1 p | a, 0; b, +1i 2 1 p | a, 1; b, +1i 2 1 p | a, 1; b, 0i 2
1 ⇣ | J = 0, M = 0i = p | a, +1; b, 1i + | a, 1; b, +1i 3
| a, 0; b, 0i
⌘
per conto vostro un altro caso. Il prossimo da prendere in esame dovrebbe essere la composizione di due particelle di spin uno. Noi ci limitiamo a riportare il risultato finale nella TABELLA 18.7.
18.7
Nota aggiuntiva 1: deduzione della matrice di rotazione
Il materiale contenuto in questa appendice faceva inizialmente parte della lezione stessa. Ora ci sembra che non sia necessario includere una trattazione così dettagliata del caso generale. Per coloro che desiderassero conoscere i dettagli del calcolo, ricaveremo ora la forma generale della matrice di rotazione per un sistema di spin (cioè di momento angolare totale) j. In effetti, non è molto importante andare a calcolarsi il caso generale: una volta che si siano capiti i concetti, i risultati generali si possono trovare in forma di tabelle in molti libri. D’altra parte, dopo essere arrivati fin qui, vi potrebbe far piacere vedere che siete in grado di capire anche le formule molto complicate della meccanica quantistica, come l’equazione (18.35), che compaiono nella descrizione del momento angolare. Estendiamo ora i ragionamenti del paragrafo 18.4 a un sistema di spin j, che consideriamo composto di 2 j oggetti di spin un mezzo. Lo stato con m = j sarà del tipo | + + + . . . +i (con 2 j segni più). Per m = j 1, vi saranno 2 j termini come | + + + . . . + + i, | + + + . . . + +i e così di seguito. Consideriamo ora il caso generale in cui vi sono r più e s meno, con r + s = 2 j. Per
18.7 • Nota aggiuntiva 1: deduzione della matrice di rotazione
© 978-8808-22107-0
effetto di una rotazione intorno all’asse z, ciascuno degli r più risulterà moltiplicato per e+i Il risultato totale è una variazione totale della fase di (r/2 s/2) . Vedete quindi che r
m=
s 2
/2 .
(18.59)
Come nel caso di J = 3/2, ciascuno stato di m definito deve essere una combinazione lineare con segni positivi di tutti gli stati con gli stessi r e s, cioè stati corrispondenti a ogni possibile disposizione che abbia r più e s meno. Noi pensiamo che vi sia facile immaginare che vi sono (r + s)!/r!s! di tali disposizioni. Per normalizzare lo stato, dividiamolo per la radice quadrata di questo numero. Possiamo scrivere " # 1/2 ( (r + s)! |+ ···+ + · · · }i + | + +{z }| {z r!s! (18.60) r s ) + (tutte le possibili disposizioni) = | j, mi
con
r+s 2
j= m=
r
s
(18.61)
2 Il nostro lavoro risulterà facilitato cambiando ancora una volta la notazione. Una volta definiti gli stati per mezzo dell’equazione (18.60), i due numeri r e s definiscono uno stato altrettanto bene di j e m. Ci sarà utile, per ricordare le varie cose, scrivere | j, mi =
r s
(18.62)
dove, servendoci delle uguaglianze (18.61), r = j+m s=j
m
Poi, scriviamo l’equazione (18.60) con una nuova notazione speciale, nella forma " # +1/2 ( ) r (r + s)! | j, mi = = | +ir | is perm s r!s!
(18.63)
Notate che abbiamo cambiato l’esponente del fattore davanti, mutandolo in più 1/2. Lo abbiamo fatto perché vi sono esattamente N = (r + s)!/r!s! termini all’interno delle parentesi graffe. Confrontando la (18.63) e la (18.60), risulta chiaro che ( ) | +ir | is perm
è semplicemente una maniera abbreviata di scrivere ( ) |+ +··· i + tutte le possibili disposizioni N
dove N è il numero dei termini differenti contenuti fra le parentesi graffe. La ragione per cui questa notazione risulta conveniente è che, ogni volta che si effettua una rotazione, tutti i segni più danno luogo allo stesso fattore, e di conseguenza si ottiene questo fattore elevato alla resima potenza. Analogamente, tutti i segni meno insieme contribuiscono con un certo fattore alla s-esima potenza, qualunque sia la sequenza dei termini. Supponiamo ora di ruotare il nostro sistema di un angolo ✓ intorno all’asse y. Quello che stiamo cercando è Ry (✓) | rs i. Quando Ry (✓) opera su ciascuno dei | +i dà luogo a Ry (✓) | +i = | +i C + | i S
(18.64)
295
296
Capitolo 18 • Il momento angolare
© 978-8808-22107-0
dove C = cos S=
✓ 2
sen
✓ 2
Quando Ry (✓) opera su ciascun | i dà Ry (✓) | i = | i C
| +i S
Perciò, quello che vogliamo è Ry (✓) | rs i
"
# 1/2 ( ) (r + s)! = Ry (✓) | +ir | is = perm r!s! " # 1/2 (⇣ ⌘r ⇣ ⌘s) (r + s)! = Ry (✓) | +i Ry (✓) | i = perm r!s! " # 1/2 (⇣ ⌘r ⇣ ⌘s) (r + s)! = | +i C + | i S | i C | +i S perm r!s!
(18.65)
Bisogna ora eseguire l’elevazione di ciascun binomio alla potenza appropriata e moltiplicare tra loro le due espressioni. Vi saranno dei termini con | +i elevato a tutte le potenze da zero a r + s. Consideriamo i termini che hanno | +i elevato alla potenza r 0. Sono tutti sempre moltiplicati con | i alla potenza s 0, dove s 0 = 2 j r 0. Immaginiamo di riunirli insieme. Per ogni possibile permutazione, essi avranno un qualche coefficiente numerico che conterrà i fattori dello sviluppo binomiale, e inoltre i fattori C e S. Chiamiamo Ar 0 questo fattore. Allora l’equazione (18.65) diverrà r+s ( X 0 0) Ry (✓) | rs i = Ar 0 | +ir | is (18.66) perm
r 0 =0
Dividiamo ora Ar 0 per il fattore [(r 0 + s 0)!/r 0!s 0!]1/2 , e chiamiamo il quoziente Br 0 . L’equazione (18.66) è quindi equivalente a Ry (✓) | rs i =
r+s X
Br 0
r 0 =0
"
(r 0 + s 0)! r 0!s 0!
# 1/2 (
0
| +ir | is
0
)
perm
(18.67)
(Si potrebbe anche dire che questa è proprio l’equazione che definisce Br 0 purché si richieda che la (18.67) sia uguale all’espressione che compare nella (18.65).) Con questa definizione di Br 0 i fattori che ancora restano al secondo membro dell’equazione 0 (18.67) sono semplicemente gli stati | rs0 i. Perciò si ha che Ry (✓) | rs i =
r+s X
r 0 =0
0
Br 0 | rs0 i
(18.68)
con s 0 sempre uguale a r + s r 0. Questo significa, naturalmente, che i coefficienti Br 0 sono proprio gli elementi di matrice che stavamo cercando, cioè 0
h rs0 | Ry (✓) | rs i = Br 0
(18.69)
E ora non ci resta che immergerci nei calcoli algebrici per ricavare i vari Br 0 . Confrontando la (18.65) con la (18.67), e ricordando che r 0 + s 0 = r + s, vediamo che Br 0 non è nient’altro che il 0 0 coefficiente di ar bs nell’espressione seguente: r 0!s 0! r!s!
! 1/2
(aC + bS)r (bC
aS)s
(18.70)
18.8 • Nota aggiuntiva 2: conservazione della parità nell’emissione di un fotone
© 978-8808-22107-0
Si tratta ormai solo di un lavoro noioso, quello di sviluppare le varie espressioni facendo uso del teorema binomiale e di riunire i termini con le stesse potenze di a e di b. Se vi fate tutti questi 0 0 conti, troverete che il coefficiente di ar bs nella (18.70) è "
r 0!s 0! r!s!
# 1/2 X ( 1)k Sr
r 0 +2k
C s+r
k
0
2k
·
(r
r! r 0 + k)!(r 0
· k)! (s
s! k)!k!
(18.71)
La somma è estesa a tutti quegli interi k che danno luogo a termini maggiori o uguali a zero nei fattoriali. Questa espressione è proprio l’elemento di matrice che cercavamo. Infine, possiamo ritornare alle nostre notazioni originali, che fanno uso di j, m e m 0 per mezzo delle formule r = j+m r 0 = j + m0 s=j m s0 = j m0 Una volta fatte queste sostituzioni, si ottiene l’equazione (18.35) del paragrafo 18.4.
18.8
Nota aggiuntiva 2: conservazione della parità nell’emissione di un fotone
Nel paragrafo 18.1 di questo capitolo abbiamo preso in esame l’emissione di luce da parte di un atomo che passa da uno stato eccitato di spin 1 allo stato fondamentale di spin 0. Se lo stato eccitato ha lo spin su (m = +1), esso può emettere un fotone con polarizzazione CD lungo l’asse +z oppure un fotone con polarizzazione CL lungo l’asse z. Chiamiamo questi due stati di fotone | Dsu i e | L giù i. Nessuno dei due ha parità definita. Indichiamo con Pˆ l’operatore di parità, Pˆ | Dsu i = | L giù i e Pˆ | L giù i = | Dsu i. Che fine hanno tatto le nostre precedenti affermazioni che un atomo in uno stato di energia definita deve avere anche parità definita, e che la parità viene conservata nei processi atomici? In questo processo, lo stato finale (cioè quello dopo l’emissione del fotone) non dovrebbe avere una parità definita? Ma esso ha una parità definita se prendiamo in considerazione lo stato finale completo che contiene le ampiezze relative all’emissione di fotoni in qualsivoglia direzione. Nel paragrafo 18.1, noi abbiamo deciso di considerare solo una parte dello stato finale completo. Se così ci piace, possiamo considerare solo stati finali che hanno una parità definita. Per esempio, prendiamo uno stato finale | F i che abbia una certa ampiezza ↵ di essere un fotone con polarizzazione CD che si muove in direzione +z e una certa ampiezza di essere un fotone polarizzato CL in moto lungo z. Possiamo allora scrivere |
Fi
= ↵ | Dsu i +
| L giù i
(18.72)
L’operazione di parità applicata a questo stato dà Pˆ | Questo stato sarà uguale a ±| di parità pari è
Fi
Fi
= ↵ | L giù i +
a seconda che sia
= ↵ oppure
( ) = ↵ | Dsu i + | L giù i
|
+ Fi
|
( i = ↵ | Dsu i F
e uno stato di parità dispari è
| Dsu i
| L giù i
)
(18.73) = ↵. Perciò uno stato finale (18.74) (18.75)
Passiamo poi a considerare il decadimento di uno stato eccitato di parità dispari in uno stato fondamentale di parità pari. Se la parità deve essere conservata, lo stato finale del fotone deve
297
298
Capitolo 18 • Il momento angolare
© 978-8808-22107-0
avere parità dispari. Deve cioè trattarsi dello stato della (18.75). Se l’ampiezza di trovare | Dsu i è ↵, quella di trovare | L giù i è ↵. Notate ora quello che succede quando si effettua una rotazione di 180° intorno all’asse y. Lo stato eccitato iniziale dell’atomo diviene uno stato con m = 1 (e senza cambiamento di segno, in accordo con la TABELLA 17.2). E l’analoga rotazione dello stato finale dà ( ) Ry (180°) | F i = ↵ | Dgiù i | L su i (18.76)
Confrontando questa equazione con la (18.75), si vede che, nell’ipotesi che la parità sia quella che abbiamo detto, l’ampiezza di probabilità di trovare un fotone lungo +z con polarizzazione CL quando lo stato iniziale è m = 1, è uguale e opposta a quella di trovare un fotone con polarizzazione CD a partire dallo stato iniziale con m = +1. E ciò è in accordo con i risultati trovati nel paragrafo 18.1.
L’atomo di idrogeno e il sistema periodico degli elementi 19.1
19
L’equazione di Schrödinger per l’atomo di idrogeno
Il successo più spettacolare della storia della meccanica quantistica è stato la comprensione delle particolarità degli spettri di alcuni atomi semplici e la spiegazione delle periodicità che si riscontrano nella tavola degli elementi chimici. In questo capitolo, finalmente, vedremo come la nostra esposizione della meccanica quantistica ci porti a ottenere questo importante risultato e, più precisamente, come essa ci permetta di giungere alla comprensione dello spettro dell’atomo di idrogeno. Al tempo stesso daremo una spiegazione qualitativa delle misteriose proprietà degli elementi chimici. Tutto ciò lo otterremo studiando nei dettagli il comportamento dell’elettrone dell’atomo di idrogeno e facendo per la prima volta un calcolo particolareggiato di una distribuzione spaziale secondo i concetti che sono stati sviluppati nel capitolo 16. Per una descrizione completa dell’atomo di idrogeno, dovremmo considerare sia il moto del protone sia quello dell’elettrone. In meccanica quantistica è possibile fare ciò in perfetta analogia con la maniera classica di descrivere il moto di ciascuna particella rispetto al centro di gravità; noi tuttavia non faremo così. Ci limiteremo a una trattazione approssimata in cui si considera il protone molto pesante, così da poterlo pensare fisso al centro dell’atomo. Faremo poi un’altra approssimazione, dimenticando che l’elettrone ha uno spin e che dovrebbe essere descritto con le leggi della meccanica relativistica. La nostra trattazione necessiterà quindi di qualche piccola correzione, dovuta al fatto che useremo l’equazione di Schrödinger non relativistica e che trascureremo gli effetti magnetici. Si hanno dei piccoli effetti magnetici perché il protone, considerato dal punto di vista dell’elettrone, è una carica rotante e produce quindi un campo magnetico. In questo campo l’elettrone avrà un’energia diversa a seconda che il suo spin sia in su o in giù. L’energia dell’atomo risulterà quindi un po’ spostata dal valore che noi calcoleremo; ma trascureremo questo piccolo spostamento di energia. Immagineremo anche che l’elettrone sia simile a un piccolo giroscopio che si muove nello spazio mantenendo sempre costante la direzione del proprio asse di rotazione. Poiché ci occuperemo di un solo atomo nello spazio vuoto, il momento angolare totale sarà conservato. Nelle nostre approssimazioni, supporremo che il momento angolare dovuto allo spin dell’elettrone rimanga sempre lo stesso, e, di conseguenza, sarà conservato anche tutto il resto del momento angolare dell’atomo, quello che di solito viene chiamato momento angolare «orbitale». Siccome l’elettrone si muove nell’atomo di idrogeno, con ottima approssimazione, come una particella senza spin, il momento angolare dovuto al moto resta costante. Con queste approssimazioni, l’ampiezza di probabilità di trovare l’elettrone nei diversi punti dello spazio può essere rappresentata da una funzione della posizione e del tempo. Sia (x, y, z, t) l’ampiezza di probabilità di trovare l’elettrone in un certo punto a un certo istante t. Secondo la meccanica quantistica, la derivata di questa ampiezza rispetto al tempo è data dall’effetto dell’operatore hamiltoniano applicato alla funzione stessa. Dal capitolo 16, si ha i~ con ˆ = H
@ ˆ =H @t
(19.1)
~2 2 r + V (r) 2m
(19.2)
300
Capitolo 19 • L’atomo di idrogeno e il sistema periodico degli elementi
© 978-8808-22107-0
Qui m è la massa dell’elettrone e V (r) è l’energia potenziale dell’elettrone nel campo elettrostatico del protone. Ponendo V = 0 a grande distanza dal protone, possiamo scrivere(1)
z
e2 r
V=
P
La funzione d’onda
deve quindi soddisfare l’equazione i~
r
@ = @t
~2 2 r 2m
e2 r
(19.3)
Cerchiamo ora gli stati d’energia definita, e quindi proviamo a vedere se esistono soluzioni della forma O
y
(r, t) = e
(i/~)Et
(19.4)
(r)
La funzione (r) deve quindi essere una soluzione di ~2 2 e2 r = *E + + 2m r ,
x
FIGURA
19.1
Coordinate sferiche r, ✓ ,
del punto P.
(19.5)
dove E è una certa costante, cioè l’energia dell’atomo. Poiché il termine di energia potenziale dipende solo dal raggio, ne segue che è molto più conveniente risolvere questa equazione in coordinate polari piuttosto che in coordinate rettangolari. Il laplaciano in coordinate cartesiane è definito da r2 =
@2 @2 @2 + + @ x 2 @ y 2 @z 2
Noi invece vogliamo servirci delle coordinate r, ✓ e sono legate a x, y e z dalle relazioni
mostrate in
FIGURA
19.1. Queste ultime
x = r sen ✓ cos y = r sen ✓ sen z = r cos ✓ Mettersi a pasticciare con i calcoli algebrici è piuttosto noioso, ma alla fine si dimostra che per ogni funzione f (r) = f (r, ✓, ), si ha ! > > 1 8 1 @ @f 1 @2 f 9 1 @2 < = r f (r, ✓, ) = (r f ) + sen ✓ + 2 2 2 2 > r @r @✓ r : sen ✓ @✓ sen ✓ @ > ; 2
(19.6)
Perciò, l’equazione che (r, ✓, ) deve soddisfare, espressa in coordinate polari, è ! > > 1 @2 1 8 1 @ @ 1 @2 9 < == (r ) + sen ✓ + 2 2 2 2 > r @r @✓ r : sen ✓ @✓ sen ✓ @ > ;
19.2
2m * e2 + E + r ~2 ,
(19.7)
Soluzioni a simmetria sferica
Cominciamo col trovare alcune funzioni molto semplici che soddisfano l’orribile equazione (19.7). Per quanto la funzione d’onda possa in generale dipendere dagli angoli ✓ e , oltre che (1)
Come sempre, e2 = qe2 /4⇡✏0 .
19.2 • Soluzioni a simmetria sferica
© 978-8808-22107-0
dal raggio r, si può cercare di vedere se esista una particolare situazione in cui non dipende dagli angoli. Per una funzione che non dipenda dagli angoli, nessuna delle ampiezze cambierà in alcun modo per una rotazione del sistema di coordinate. Ciò implica che tutte le componenti del momento angolare sono zero. Una tale deve quindi corrispondere a uno stato il cui momento angolare totale sia zero. (In effetti, è solo il momento angolare orbitale che è nullo, perché c’è ancora lo spin dell’elettrone, ma noi stiamo ora trascurando quella parte di momento angolare.) Uno stato che abbia momento angolare orbitale zero viene indicato con un nome speciale. Viene detto uno «stato s», e voi vi potete ricordare che «s sta per stato a simmetria sferica»(2) . Se ora non dipende da ✓ e da , l’intero laplaciano contiene solo il primo termine, e l’equazione (19.7) diventa assai più semplice: 2m * e2 + E + r ~2 ,
1 d2 (r ) = r dr 2
(19.8)
Prima di metterci a risolvere un’equazione come questa, è una buona idea quella di sbarazzarsi di tutte le costanti in più come e2 , m e ~, facendo alcuni cambiamenti di scala. I calcoli algebrici risulteranno così più facili. Se facciamo le seguenti sostituzioni r=
~2 ⇢ me2
me4 ✏ 2~2 l’equazione (19.8) diviene (dopo aver moltiplicato per ⇢): ! d2 (⇢ ) 2 = ✏+ ⇢ ⇢ d⇢2 E=
(19.9) (19.10)
(19.11)
Questi cambiamenti di scala significano che noi misuriamo la distanza r e l’energia E in multipli delle unità atomiche «naturali». Cioè r ⇢= rB dove rB =
~2 me2
è detto «raggio di Bohr» e vale circa 0,528 Å. Analogamente ✏=
E ER
con
me4 2~2 Questo valore dell’energia è detto «rydberg» e vale circa 13,6 eV. Poiché il prodotto compare in entrambi i membri dell’equazione, è più conveniente lavorare direttamente su di esso invece che sulla stessa. Posto ER =
⇢ = f
(19.12)
si ottiene l’equazione dall’aspetto più semplice d2 f = d⇢2
! 2 ✏+ f ⇢
(19.13)
(2) Poiché questi nomi speciali fanno parte del vocabolario corrente della fisica atomica, dovete impararli. Noi, dal canto nostro, vi aiuteremo raggruppandoli in una specie di «dizionarietto», più avanti in questo capitolo.
301
302
Capitolo 19 • L’atomo di idrogeno e il sistema periodico degli elementi
© 978-8808-22107-0
Dobbiamo ora trovare una qualche funzione f che soddisfi l’equazione (19.13), cioè, in altre parole, dobbiamo semplicemente risolvere un’equazione differenziale. Disgraziatamente, non esiste alcun metodo generale che sia molto utile per risolvere una qualsiasi data equazione differenziale. Bisogna gingillarci un po’ attorno. La nostra equazione non è facile, ma si è visto che essa può essere risolta col seguente procedimento. Per prima cosa f , che è una certa funzione di ⇢, viene sostituita dal prodotto di due funzioni f (⇢) = e
↵⇢
(19.14)
g(⇢)
Questo significa semplicemente che è stato messo in evidenza un e ↵⇢ davanti a f (⇢). Ciò è certamente possibile per una qualsiasi f (⇢). Questo sposta semplicemente il nostro problema in quello di trovare la funzione g(⇢). Infilando la (19.14) nella (19.13) si ottiene la seguente equazione per g: ! dg d2 g 2 2 2↵ + +✏ +↵ g =0 (19.15) d⇢ ⇢ d⇢2 Poiché siamo liberi di scegliere ↵ come vogliamo, poniamo ↵2 = ✏ ottenendo così
d2 g d⇢2
2↵
(19.16)
dg 2 + g=0 d⇢ ⇢
(19.17)
Si potrebbe pensare di non essere ora in condizioni migliori di quando si aveva la (19.13), ma la nostra nuova equazione ha la bella proprietà di poter essere facilmente risolta per mezzo di una serie di potenze di ⇢. [In linea di principio, è possibile risolvere anche la (19.13) in questo modo, ma è molto più difficile.] Quello che stiamo affermando è che l’equazione (19.17) è soddisfatta da una g(⇢) che può essere scritta in forma di serie: g(⇢) =
1 X
ak ⇢k
(19.18)
k=1
in cui gli ak sono dei coefficienti costanti. Ora, tutto quello che c’è da fare è trovare un appropriato insieme infinito di coefficienti! Intanto, cominciamo a verificare che un tale tipo di soluzione funziona. La derivata prima di g(⇢) è 1
dg X = ak k ⇢k d⇢ k=1 e la derivata seconda
1
d2 g X = ak k (k d⇢2 k=1
1
1) ⇢k
2
Servendoci di queste espressioni si ha, dalla (19.17), 1 X
k (k
1) ak ⇢k
2
k=1
1 X
2↵kak ⇢k
1
+
k=1
1 X
2ak ⇢k
1
=0
(19.19)
k=1
A questo punto non è ancora ovvio che ce l’abbiamo fatta; ma tiriamo avanti. Tutto si presenta meglio se sostituiamo la prima somma con un’altra a essa equivalente. Poiché il primo termine della somma è nullo, possiamo cambiare ciascun k in k + 1 senza che nulla cambi nella serie infinita; con questa variazione, la prima somma può quindi anche essere scritta come 1 X k=1
(k + 1) kak+1 ⇢k
1
19.2 • Soluzioni a simmetria sferica
© 978-8808-22107-0
Possiamo ora riunire tutte le somme, ottenendo 1 X ⇥ (k + 1) kak+1 k=1
⇤ 2↵kak + 2ak ⇢k
1
=0
(19.20)
Questa serie di potenze si annulla per tutti i possibili valori di ⇢. Ciò può avvenire solo se i coefficienti di ciascuna potenza di ⇢ sono separatamente uguali a zero. Avremo quindi una soluzione per l’atomo d’idrogeno se riusciremo a trovare un insieme di ak per cui (k + 1) kak+1
2 (↵k
1) ak = 0
(19.21)
per tutti i k 1. Ma questo è certamente molto facile da ottenere. Prendete a1 come volete. Poi ricavate tutti gli altri coefficienti dalla relazione ak+1 =
2 (↵k 1) ak k (k + 1)
(19.22)
Troverete così a2 , a3 , a4 e così via, e ciascuna coppia di questi soddisferà certamente la (19.21). Si ottiene così una serie per la g(⇢) che soddisfa la (19.17). Da questa, possiamo poi costruire una che sia soluzione dell’equazione di Schrödinger. Notate il fatto che la soluzione dipende dall’energia (tramite ↵), ma che per ogni ✏ vi è una corrispondente serie. Abbiamo ora una soluzione, ma qual è il suo significato fisico? Possiamo farcene un’idea andando a vedere quel che succede lontano dal protone, per grandi valori di ⇢. A questa distanza, i termini di ordine più alto della serie sono i più importanti, perciò ci dobbiamo occupare di quel che avviene per grandi k. Quando k 1, l’equazione (19.22) è approssimativamente uguale a ak+1 =
2↵ ak k
ak+1 ⇡
(2↵)k k!
che significa (19.23)
Ma questi sono proprio i coefficienti della serie di e+2↵⇢ . La funzione di g è un esponenziale rapidamente crescente. Anche unendola a e ↵⇢ per dar luogo a f (⇢), vedi equazione (19.14), si ha ancora come risultato una soluzione per f (⇢) che varia come e↵⇢ per grandi valori di ⇢. Abbiamo cioè una soluzione matematica, ma senza significato fisico. Essa rappresenta una situazione in cui è molto poco probabile che 1’elettrone sia vicino al protone! È sempre più probabile trovarlo a un grande valore del raggio ⇢. Una funzione d’onda per un elettrone legato deve tendere a zero per grandi valori di ⇢. Dobbiamo allora pensare se esista qualche modo di vincere la partita, ed eccolo qua. State attenti! Se per un caso fortunato ↵ fosse proprio uguale a 1/n, dove n è un intero qualunque, allora, per l’equazione (19.22), si avrebbe an+1 = 0. Tutti i termini di ordine superiore sarebbero zero, e non si avrebbe più una serie infinita, ma un polinomio finito. Qualunque polinomio diverge più lentamente di e↵⇢ , perciò il termine e ↵⇢ finirebbe per avere la meglio, e la funzione f andrebbe a zero per grandi valori di ⇢. Le uniche soluzioni di stato legato sono quelle per cui ↵ = 1/n, con n = 1, 2, 3, 4 e via di seguito. Ritornando all’equazione (19.16), vediamo che possono esistere delle soluzioni corrispondenti a stati legati per l’equazione d’onda a simmetria sferica solo se ✏ = 1,
1 1 1 1 , , , . . ., 2 , . . . 4 9 16 n
I valori permessi dell’energia sono dati semplicemente da queste frazioni, moltiplicate per 1 rydberg me4 ER = 2~2
303
304
Capitolo 19 • L’atomo di idrogeno e il sistema periodico degli elementi
© 978-8808-22107-0
ossia l’energia dell’n-esimo livello è 1 n2
En = ER
(19.24)
Fra l’altro, non vi è niente di misterioso nei valori negativi dell’energia. Le energie sono negative, perché quando decidiamo di scrivere V = e2 /r, noi scegliamo come punto zero l’energia dell’elettrone quando esso si trova lontano dal protone. Quando esso si trova vicino al protone la sua energia è minore, e di conseguenza sarà inferiore a zero. L’energia minima (massimo valore negativo) si ha per n = 1, ed essa poi aumenta verso lo zero all’aumentare di n. Prima ancora che venisse scoperta la meccanica quantistica, già si sapeva, da studi sperimentali sullo spettro dell’idrogeno, che i livelli energetici potevano essere descritti dall’equazione (19.24), dove il valore di ER era stato ricavato sperimentalmente, ed era 13,6 eV. Bohr in seguito ideò un modello che dava luogo alla stessa equazione e predisse che ER dovesse essere uguale a me4 /2~2 . Ma il riuscire a riprodurre questo risultato, partendo da un’equazione fondamentale per il moto dell’elettrone, fu proprio il primo grande successo della teoria di Schrödinger. Ora che abbiamo risolto il problema per il primo dei nostri atomi, consideriamo un po’ le caratteristiche della soluzione che abbiamo ottenuto. Mettendo insieme tutti i pezzi, si vede che tutte le possibili soluzioni si presentano così: n
=
f n (⇢) e ⇢/n = gn (⇢) ⇢ ⇢
dove gn (⇢) =
n X
(19.25)
ak ⇢k
(19.26)
k=1
e ak+1
! k 2 1 n = ak k (k + 1)
(19.27)
Finché il nostro principale interesse è rivolto a conoscere le probabilità relative di trovare l’elettrone nei vari punti dello spazio, possiamo scegliere per a1 il numero che vogliamo. Possiamo anche porre a1 = 1. (Spesso a1 viene scelto in modo che la funzione d’onda sia «normalizzata», cioè in modo che la probabilità totale di trovare l’elettrone in un qualunque punto dello spazio sia uguale a 1. Per ora noi non abbiamo bisogno di farlo.) Per lo stato di minima energia, n = 1, e 1 (⇢)
19.2 Le funzioni d’onda per i primi tre stati con l = 0 dell’atomo di idrogeno. (Le scale sono state scelte in modo che le probabilità totali risultino uguali.)
FIGURA
=e
⇢
(19.28)
n=1 n=3
n=2
r
19.3 • Stati con dipendenza angolare
© 978-8808-22107-0
Per un atomo di idrogeno nello stato fondamentale (quello di minima energia), l’ampiezza di trovare l’elettrone in un certo punto diminuisce esponenzialmente con la distanza dal protone. È più probabile trovarlo nelle immediate vicinanze del protone e la distanza caratteristica su cui esso si distribuisce è circa una unità in ⇢, o un raggio di Bohr, r B . Ponendo n = 2, si ottiene il livello successivo. La funzione d’onda di questo stato avrà due termini. Essa risulta ✓ ⇢ ◆ ⇢/2 e (19.29) 2 (⇢) = 1 2 La funzione d’onda per il livello seguente è ! 2⇢ 2 2 + ⇢ e ⇢/3 (19.30) 3 (⇢) = 1 3 27 Le funzioni d’onda per questi tre primi livelli sono riportate in forma grafica in FIGURA 19.2. Si può vedere qual è l’andamento generale. Tutte le funzioni d’onda vanno rapidamente a zero per grandi ⇢ dopo aver compiuto un piccolo numero di oscillazioni. In effetti, il numero di «gobbe» è proprio uguale a n, o, se preferite, il numero di zeri di n è uguale a n 1.
19.3
Stati con dipendenza angolare
Gli stati descritti da n (r) sono tali che l’ampiezza di probabilità di trovare l’elettrone possiede simmetria sferica, dipendendo solo da r, la distanza dal protone. Questi stati hanno un momento angolare orbitale nullo. Passiamo ora a esaminare quegli stati che possono presentare una qualche dipendenza angolare. Volendo, potremmo semplicemente indagare sul problema matematico di trovare le funzioni di r, ✓ e che soddisfano l’equazione differenziale (19.7), con la condizione supplementare, di carattere fisico, che le uniche funzioni accettabili sono quelle che vanno a zero per grandi valori di r. Troverete questo procedimento svolto in molti libri. Noi qui prenderemo una scorciatoia sfruttando la conoscenza che abbiamo già acquisito sul modo in cui le ampiezze dipendono dagli angoli nello spazio. L’atomo di idrogeno in qualsiasi dato stato è una particella con un certo «spin» j, dove j rappresenta il numero quantico del momento angolare totale. Parte di questo spin proviene dallo spin intrinseco dell’elettrone, e parte dal moto dell’elettrone stesso. Poiché ciascuna di queste due componenti agisce indipendentemente (con un’ottima approssimazione), seguiteremo a ignorare la parte di spin e ci occuperemo solo del momento angolare «orbitale». Anche questo moto orbitale, però, si comporta come uno spin. Per esempio, se il numero quantico orbitale è l, la componente z del momento angolare può essere l, l 1, l 2,... l. (Al solito, usiamo ~ come unità di misura.) Inoltre, seguitano a valere tutte le matrici di rotazione e tutte le altre proprietà che ci siamo ricavati. (D’ora in poi, ignoreremo davvero lo spin dell’elettrone; parlando di «momento angolare» intenderemo soltanto la parte orbitale.) Poiché il potenziale V in cui l’elettrone si muove, dipende solo da r e non da ✓ o , l’hamiltoniana è simmetrica per qualunque rotazione. Ne segue che il momento angolare e tutte le sue componenti sono conservate. (Questo vale per il moto in un qualsiasi «campo centrale», cioè che dipende solo da r, quindi non è una caratteristica particolare del potenziale coulombiano e2 /r.) Consideriamo ora un possibile stato dell’elettrone; la sua struttura angolare interna sarà caratterizzata dal numero quantico l. A seconda dell’«orientazione» del momento angolare totale rispetto all’asse z, la componente z del momento angolare sarà m, che è uno dei possibili valori 2l + 1 tra +l e l. Supponiamo che sia m = 1. Quale sarà l’ampiezza di probabilità di trovare l’elettrone sull’asse z a una certa distanza r? Zero. Un elettrone che si trovi sull’asse z non può avere un momento angolare rispetto a tale asse. Va bene, supponiamo allora che m sia zero, così che l’ampiezza di trovare l’elettrone possa essere diversa da zero a qualunque distanza dal protone. Indicheremo questa ampiezza con Fl (r). Questa dunque rappresenta l’ampiezza di probabilità di trovare l’elettrone a distanza r lungo l’asse z, quando l’atomo si trova nello stato | l, 0i, simbolo col quale indichiamo uno spin orbitale l e una componente z pari a m = 0.
305
306
Capitolo 19 • L’atomo di idrogeno e il sistema periodico degli elementi
z z'
r y'
y
x
x'
19.3
Il punto (r, ✓ , del riferimento x 0 , y 0 , z0 . FIGURA
© 978-8808-22107-0
Se conosciamo Fl (r), sappiamo tutto. Per un qualsiasi stato | l, mi, possiamo infatti ricavare l’ampiezza l,m (r) di trovare l’elettrone in un qualunque punto dell’atomo. Come? State a vedere. Supponendo d’avere l’atomo nello stato | l, mi, qual è l’ampiezza di probabilità di trovare l’elettrone a un angolo ✓, e una distanza r dall’origine? Facciamo passare un nuovo asse z, diciamo z 0, in corrispondenza di quell’angolo (FIGURA 19.3), e chiediamoci con quale ampiezza l’elettrone verrà rivelato a distanza r lungo il nuovo asse z 0. Noi sappiamo che non può trovarsi lungo z 0, a meno che la componente z 0 del suo momento angolare, m 0, sia zero. Quando però m 0 è zero, l’ampiezza di probabilità di trovare l’elettrone lungo z 0 è Fl (r). Perciò la formula finale è il prodotto di due fattori. Il primo è l’ampiezza di probabilità che un atomo nello stato | l, mi rispetto all’asse z si trovi nello stato | l, m 0 = 0i rispetto all’asse z 0. Moltiplicando ancora questa ampiezza per Fl (r) si ottiene l,m (r), che rappresenta l’ampiezza di trovare l’elettrone a (r, ✓, ) rispetto agli assi originali. Scriviamola in dettaglio. Ci siamo già calcolati precedentemente le matrici di trasformazione per le rotazioni. Per passare dal riferimento x, y, z al riferimento x 0, y 0, z 0 di FIGURA 19.3, possiamo ruotare dapprima di un angolo intorno all’asse z, e poi ruotare di un angolo ✓ rispetto al nuovo asse y (y 0). Questa rotazione composta è data dal prodotto
) si trova sull’asse z0
Ry (✓) Rz ( )
L’ampiezza di trovare lo stato l, m 0 = 0 dopo la rotazione è hl, 0 | Ry (✓) Rz ( ) | l, mi
(19.31)
= hl, 0 | Ry (✓) Rz ( ) | l, mi Fl (r)
(19.32)
Il risultato finale è, quindi, l,m (r)
Il moto orbitale può avere solo valori interi di l. (Se l’elettrone può trovarsi in un qualunque punto a r , 0, allora si ha un’ampiezza non nulla d’avere m = 0 in tale direzione. E gli stati con m = 0 esistono solo per gli spin interi.) Le matrici di rotazione per l = 1 sono riportate nella TABELLA 17.2. Per valori più elevati di l, potete usare le formule generali che abbiamo elaborato nel capitolo 18. Le matrici per Rz ( ) e Ry (✓) compaiono separatamente, ma voi sapete già come fare a comporle. Per il caso generale, potete partire dallo stato | l, mi e operare su di esso con Rz ( ) in modo da ottenere il nuovo stato Rz ( ) | l, mi (che è semplicemente eim | l, mi ). Operate poi su di esso con Ry (✓), così da costruire lo stato Ry (✓)Rz ( ) | l, mi. Moltiplicandolo per hl, 0 | si ottiene l’elemento di matrice (19.31). Gli elementi di matrice dell’operatore di rotazione sono funzioni algebriche di ✓ e . Le particolari funzioni che appaiono nella (19.31) si presentano anche in molti tipi di problemi connessi con la presenza di onde con configurazioni geometriche sferiche e hanno perciò ricevuto un nome speciale. Non tutti usano le stesse convenzioni; ma una delle più diffuse è hl, 0 | Ry (✓) Rz ( ) | l, mi ⌘ a Yl,m (✓, )
(19.33)
Le funzioni Yl,m (✓, ) sono dette armoniche sferiche, e a è puramente un fattore numerico che dipende dalla definizione che si è scelta per Yl,m . La definizione usuale è a=
r
4⇡ 2l + 1
(19.34)
Facendo uso di questa notazione, le funzioni d’onda dell’idrogeno si possono scrivere nella forma l,m (r)
= a Yl,m (✓, ) Fl (r)
(19.35)
307
19.3 • Stati con dipendenza angolare
© 978-8808-22107-0
Le funzioni angolari Yl,m (✓, ) sono importanti non solo in meccanica quantistica, ma anche in molti settori della fisica classica in cui compare l’operatore r2 , come per esempio l’elettromagnetismo. Come altro esempio del loro uso in meccanica quantistica, consideriamo la disintegrazione di uno stato eccitato del Ne20 (come quella che abbiamo discusso nell’ultimo capitolo) che decade emettendo una particella e trasformandosi in O16 : 20⇤
Ne
16
!O
z
z
y
y x
x
4
+ He
Supponiamo che lo stato eccitato abbia un certo spin l (necessariamente intero) e che la componente z del momento angolare sia m. Possiamo ora chiederci: dati FIGURA 19.4 Decadimento di uno stato eccitato del Ne20 . l e m, qual è l’ampiezza con cui la particella ↵ sarà emessa in una direzione che forma un angolo ✓ con l’asse z e un angolo con il piano xz, come mostrato in FIGURA 19.4? Per risolvere questo problema, facciamo dapprima la seguente osservazione. Un decadimento in cui la particella ↵ viene emessa proprio lungo l’asse z deve essere avvenuto in uno stato con m = 0. Deve essere così perché sia O16 sia la particella ↵ hanno spin zero, e per effetto del loro moto non possono avere alcun momento angolare lungo l’asse z. Indicheremo questa ampiezza (per unità di angolo solido) con a. Perciò, se vogliamo trovare l’ampiezza per il decadimento in un angolo arbitrario, tutto quello che ci serve sapere è l’ampiezza che lo stato iniziale dato abbia momento angolare zero nella direzione di decadimento. L’ampiezza per il decadimento in ✓ e è quindi a volte l’ampiezza che lo stato | l, mi rispetto all’asse z sia nello stato | l, 0i rispetto a z 0, cioè alla direzione di decadimento. Quest’ultima ampiezza è proprio quella che abbiamo scritto nella (19.31). La probabilità di vedere la particella ↵ a ✓, è P(✓, ) = a2 |hl, 0 | Ry (✓)Rz ( ) | l, mi| 2 Come esempio, consideriamo uno stato iniziale con l = 1 e vari valori di m. Dalla TABELLA 17.2, possiamo ricavare le ampiezze che ci necessitano. Esse sono h1, 0 | Ry (✓)Rz ( ) | 1, +1i =
1 p sen ✓ei 2
h1, 0 | Ry (✓)Rz ( ) | 1, 0i = cos ✓ 1 h1, 0 | Ry (✓)Rz ( ) | 1, 1i = p sen ✓e 2
(19.36) i
Vi sono tre possibili ampiezze di distribuzione angolare, a seconda del valore di m del nucleo iniziale. Ampiezze come quelle nelle (19.36) appaiono con una tale frequenza e sono abbastanza importanti da far sì che abbiano ricevuto diversi nomi. Se l’ampiezza della distribuzione angolare è proporzionale a una di queste tre funzioni o a una combinazione lineare di esse diciamo: «il sistema ha un momento angolare orbitale pari a uno». O potremmo anche dire: «il Ne20* emette una particella ↵ in onda p». O ancora: «la particella ↵ viene messa in uno stato con l = 1». Visto che ci sono tanti modi di dire la stessa cosa, è utile avere un dizionario. Se volete capire quello che gli altri fisici stanno dicendo, bisogna che ne impariate a memoria il linguaggio. Nella TABELLA 19.1, diamo un dizionarietto del momento angolare orbitale. Se il momento orbitale è zero, non si ha alcun cambiamento quando il sistema di riferimento viene ruotato e non si hanno variazioni con l’angolo: la «dipendenza» dall’angolo è una costante, per esempio 1. Questo stato è detto anche «stato s», e vi è uno solo di tali stati, almeno per quanto riguarda la dipendenza angolare. Se il momento angolare orbitale è 1, allora l’ampiezza che esprime la variazione con l’angolo può essere una qualunque delle tre funzioni che abbiamo
308
Capitolo 19 • L’atomo di idrogeno e il sistema periodico degli elementi
TABELLA
19.1
Dizionario del momento angolare orbitale (l = j = numero intero).
Momento angolare orbitale l
Componente z m
Dipendenza angolare delle ampiezze
0
0
1
8 +1 > > > > > > > > > > < 0 > > > > > > > > > > 1 :
1
2
3 4 5 .. .
© 978-8808-22107-0
9 > > > > > = > > > > > ;
8 +2 > > > > > > > > > > > > +1 > > > > > > > > > > < 0 > > > > > > > > > > > 1 > > > > > > > > > > > 2 :
9 > > > > > > > > > > > > = > > > > > > > > > > > > ;
1 p sen ✓ei 2 cos ✓ 1 p sen ✓e 2
i
p 6 sen2 ✓e2i 4 p 6 sen ✓ cos ✓ei 2 1 (3 cos2 ✓ 1) 3 p 6 sen ✓ cos ✓e 2 p 6 sen2 ✓e 2i 4 8 > > > > > < > > > > > :
Numero Nome degli stati
i
9 > > > > > > > > > > > > > > > > > > > > > > > > = > > > > > > > > > > > > > > > > > > > > > > > > ;
hl, 0 | |Ry (✓)Rz ( )| | l, mi = 9 > > > > > = = Yl,m (✓, ) = > > > > m im > = Pl (cos ✓) e ;
Parità orbitale
s
1
+
p
3
–
d
5
+
2l + 1
( 1)l
f g h .. .
scritto, a seconda del valore di m, oppure una loro combinazione lineare. Questi sono detti «stati p», e ve ne sono tre. Se il momento angolare orbitale è 2, vi sono le cinque funzioni contenute nella tabella. Ogni loro combinazione lineare è chiamata ampiezza con «l = 2», o anche «onda d». Bene, ora potete immaginare quale sarà la prossima lettera: cosa verrà dopo s, p, d? Ma naturalmente, f , g, h, e poi avanti con tutto l’alfabeto! Le lettere non hanno alcun significato. (Una volta avevano un qualche significato, indicavano righe «sottili», righe «principali», righe «diffuse» e righe «fondamentali» negli spettri ottici degli atomi. Ma questo succedeva al tempo in cui nessuno sapeva da dove venivano le righe spettrali. Dopo f non vi erano nomi speciali, e quindi noi adesso andiamo avanti con g, h, e così via.) Le funzioni angolari nella tabella hanno diversi nomi e vengono talvolta definite per mezzo di convenzioni leggermente differenti per quel che riguarda i fattori numerici che compaiono davanti a loro. Qualche volta sono chiamate «armoniche sferiche» e sono scritte Yl,m (✓, ). Altre volte sono scritte come Plm (cos ✓)eim , e se m = 0 semplicemente come Pl (cos ✓). Le funzioni Pl (cos ✓) sono chiamate «polinomi di Legendre» di cos ✓, e le funzioni Plm (cos ✓) sono dette «funzioni associate di Legendre». Tavole di queste funzioni si possono trovare in molti libri. Notate, per inciso, che tutte le funzioni corrispondenti a un dato l hanno la proprietà di avere la
309
19.4 • La soluzione generale per l’idrogeno
© 978-8808-22107-0
stessa parità: per l dispari, cambiano segno per un’inversione, per l pari non cambiano. Perciò, possiamo scrivere che la parità di uno stato con momento angolare l è ( 1)l . Come abbiamo visto, queste distribuzioni angolari possono riferirsi a una disintegrazione nucleare o a qualche altro processo, oppure alla distribuzione di ampiezza relativa alla rivelazione di un elettrone in un qualche punto dell’atomo di idrogeno. Per esempio, se un elettrone si trova in uno stato p (l = 1), la sua ampiezza di probabilità di posizione può dipendere dall’angolo in molti modi possibili, ma tutti sono comunque combinazioni lineari delle tre funzioni con l = 1 della TABELLA 19.1. Consideriamo il caso di cos ✓. È piuttosto interessante. In questo caso, l’ampiezza è positiva, diciamo nella parte superiore (✓ < ⇡/2), negativa nella parte inferiore (✓ > ⇡/2) e zero quando ✓ è 90°. Quadrando questa ampiezza, vediamo che la probabilità di trovare l’elettrone varia con ✓ come mostra la FIGURA 19.5 ed è indipendente da . Questa distribuzione angolare è responsabile del fatto che nel legame molecolare, l’attrazione di un elettrone in uno stato con l = 1 per un altro atomo dipende dalla direzione ed è all’origine delle valenze direzionali nei legami chimici.
19.4
Probabilità
La soluzione generale per l’idrogeno
Nell’equazione (19.35) abbiamo scritto le funzioni d’onda per l’atomo di idrogeno nella forma
19.5 Diagramma polare di cos2 ✓ , che rappresenta la probabilità relativa di trovare un elettrone a differenti angoli dall’asse z (per un dato r) in uno stato atomico con l = 1 e m = 0. FIGURA
l,m (r)
= a Yl,m (✓, ) Fl (r)
(19.37)
Queste funzioni d’onda devono essere soluzioni dell’equazione differenziale (19.7). Vediamo cosa ciò significhi. Sostituite la (19.37) nella (19.7); otterrete così ! Yl,m @ 2 @Yl,m @ 2Yl,m Fl Fl @ (r F ) + sen ✓ + = l r @r 2 @✓ r 2 sen ✓ @✓ r 2 sen2 ✓ @ 2 (19.38) 2m * e2 + = E+ Yl,m Fl r ~2 , Moltiplicando tutto per r 2 /Fl e riordinando i vari termini, risulta ! @Yl,m 1 @ 1 @ 2Yl,m sen ✓ + = sen ✓ @✓ @✓ sen2 ✓ @ 2 26 2 37 > 1 d2 > r 8 2m * e2 + 9 7 = = 666 < F (r F ) + E + l l > 77 Yl,m 2 2 > F r r dr ~ 64 l : - ; 75 ,
(19.39)
Il primo membro di questa equazione dipende da ✓ e , ma non da r. Qualunque sia il valore che scegliamo per r, il primo membro non cambia. Questo deve valere anche per il secondo membro. Per quanto l’espressione che compare tra parentesi quadre abbia degli r dappertutto, essa nel suo insieme non può dipendere da r, altrimenti non si avrebbe un’equazione valida per tutti gli r. Come si vede, inoltre, l’espressione tra parentesi quadre non dipende neppure da ✓ e da . Deve quindi essere uguale a una certa costante. Quest’ultima può naturalmente dipendere dal valore di l dello stato che stiamo analizzando, poiché la funzione Fl deve essere proprio quella che si adatta a tale stato; indicheremo questa costante con Kl . L’equazione (19.39) è perciò equivalente alle due equazioni: ! @Yl,m 1 @ 1 @ 2Yl,m sen ✓ + = Kl Yl,m (19.40) sen ✓ @✓ @✓ sen2 ✓ @ 2 2m * e2 + 1 d2 Fl (r F ) + E + Fl = Kl 2 l 2 2 r dr r ~ , r
(19.41)
310
Capitolo 19 • L’atomo di idrogeno e il sistema periodico degli elementi
© 978-8808-22107-0
Considerate ora quello che abbiamo fatto. Per ogni stato descritto da l e m, conosciamo le funzioni Yl,m ; possiamo far uso dell’equazione (19.40) per determinare la costante Kl . Mettendo Kl nell’equazione (19.41), otteniamo un’equazione differenziale per la funzione Fl (r). Se sappiamo risolvere quest’ultima ricavando Fl (r), abbiamo tutti i pezzi che ci servono per inserirli nella (19.37) ottenendo (r). Cos’è Kl ? Per prima cosa, notate che essa è la stessa per tutti gli m (che si accordano a un particolare l), perciò possiamo scegliere il valore di m che vogliamo per Yl,m , inserire quest’ultimo nella (19.40) e determinare Kl . Forse quello che risulta più facile da usare è Yl,l . Dalla (18.24) si ha Rz ( ) | l, li = eil | l, li (19.42) Anche l’elemento di matrice per Ry (✓) risulta molto semplice: hl, 0 | Ry (✓) | l, li = b (sen ✓)l
(19.43)
dove b è un numero(3) . Combinando insieme le ultime due equazioni, si ha Yl,l / eil senl ✓
(19.44)
Inserendo questo fattore nella (19.40) si ottiene Kl = l (l + 1)
(19.45)
Ora che abbiamo determinato Kl , l’equazione (19.41) ci fornisce informazioni sulla funzione radiale Fl (r). Naturalmente, si tratta semplicemente dell’equazione di Schrödinger con la parte angolare sostituita dall’espressione equivalente Kl Fl /r 2 . Riscriviamo la (19.41) nella forma della (19.8), nel modo seguente: 1 d2 (r Fl ) = r dr 2
2m ~2
2 8 >
r :
> l (l + 1) ~2 9 = Fl 2 > 2mr ;
(19.46)
Un misterioso termine è stato aggiunto all’energia potenziale. Nonostante questo termine sia stato ottenuto per mezzo di una specie di girandola matematica, esso ha un’origine fisica molto semplice. Possiamo darvi un’idea della sua provenienza facendo uso di un ragionamento semi-classico. Dopo di che forse non lo troverete più così misterioso. Considerate una particella classica che si muova intorno a un centro di forza. L’energia totale, che è la somma delle energie cinetica e potenziale, è conservata: 1 U = V (r) + mv 2 = cost. 2 In generale, v può essere scomposto in una componente radiale vr e in una componente tangenziale ˙ di conseguenza r ✓; ˙2 v 2 = vr2 + (r ✓) Ma anche il momento angolare mr 2 ✓˙ è conservato; poniamo che esso sia uguale a L. Possiamo allora scrivere mr 2 ✓˙ = L (3)
Con un po’ di lavoro, è possibile dimostrare che questo discende dalla (18.35), ma è anche possibile dedurlo dai principi fondamentali, secondo lo schema del paragrafo 18.4. Uno stato | l, li può essere costruito a partire da 2l particelle di spin un mezzo, tutte con lo spin su; mentre lo stato | l, 0i avrà l spin su e l giù. Quando si effettua una rotazione, l’ampiezza di probabilità che uno spin su resti su è cos ✓/2, e quella che uno spin su si rovesci è sen ✓/2. Ora noi stiamo cercando l’ampiezza di probabilità che gli l spin su restino su e che gli altri l si rovescino. Tale ampiezza è ! ✓ ✓ l cos sen 2 2 che è proporzionale a senl ✓.
19.4 • La soluzione generale per l’idrogeno
© 978-8808-22107-0
ossia r ✓˙ =
L mr
e l’energia è
1 L2 mvr2 + V (r) + 2mr 2 2 Se non ci fosse il momento angolare, si avrebbero semplicemente i primi due termini. L’aggiunta del momento angolare L produce sull’energia esattamente lo stesso effetto dell’aggiunta di un termine L 2 /2mr 2 all’energia potenziale. Ma questo è quasi esattamente il termine in più nella (19.46). L’unica differenza è che il momento angolare è espresso tramite l (l + 1) ~2 invece che tramite l 2 ~2 , come ci si potrebbe aspettare. Ma abbiamo già visto (per esempio, par. 34.7 del vol. 2(4) ) che questa è proprio la sostituzione che bisogna normalmente fare per far sì che un ragionamento semi-classico si accordi con i calcoli quantistici rigorosi. Possiamo dunque interpretare il nuovo termine come uno «pseudopotenziale» che produce il termine di «forza centrifuga» che compare nelle equazioni per il moto radiale di un sistema rotante (vedi la discussione delle «pseudo-forze» nel par. 12.5 del vol. 1.) Siamo ora in grado di risolvere l’equazione (19.46) per Fl (r). Essa è molto simile all’equazione (19.8), e la stessa tecnica usata in quel caso funziona anche qui. Tutto va come prima fino a quando si arriva all’equazione (19.19), che ora avrà il termine aggiuntivo U=
l (l + 1)
1 X
ak ⇢k
2
(19.47)
k=1
Questo termine può anche essere scritto come
1 8 9 > > > a1 X k 1> = l (l + 1) < + a ⇢ (19.48) k+1 > ⇢ > > > k=1 : ; (abbiamo estratto il primo termine e spostato indietro di 1 l’indice corrente k.) Al posto dell’equazione (19.20) abbiamo 1 f X
k (k + 1)
l (l + 1) ak+1
k=1
2(↵k
g 1) ak ⇢k
1
l (l + 1) a1 =0 ⇢
(19.49)
Vi è un solo termine in ⇢ 1 , perciò deve essere zero. Il coefficiente a1 deve essere zero (a meno che non sia l = 0 e si riottiene allora la soluzione precedente). Tutti gli altri termini sono nulli perché l’espressione tra parentesi quadre è zero per ogni valore di k. Questa condizione fa sì che la (19.22) venga sostituita da ak+1 =
2(↵k 1) ak k (k + 1) l (l + 1)
(19.50)
Questo è l’unico cambiamento significativo rispetto al caso a simmetria sferica. Come nel caso precedente, questa serie deve aver termine se vogliamo avere soluzioni che possano rappresentare elettroni legati. La serie avrà termine a k = n se ↵n = 1. Troviamo ancora la stessa condizione su ↵, cioè che deve essere uguale a 1/n, dove n è un numero intero. Tuttavia l’equazione (19.50) ci dà anche una nuova restrizione. L’indice k non può essere uguale a l, poiché il denominatore diventerebbe zero e al+1 infinito. In altre parole, poiché a1 = 0, l’equazione (19.50) implica che tutti i successivi ak sono nulli finché non si arriva ad al+1 , che può essere diverso da zero. Ciò significa che k deve partire da l + 1 e finire a n. Il nostro risultato finale è che per ogni valore di l, vi sono molte possibili soluzioni che chiameremo Fn,l , dove n l + 1. Ciascuna soluzione ha l’energia ! me4 1 En = (19.51) 2~2 n2 (4)
Vedi Appendice di questo volume.
311
312
Capitolo 19 • L’atomo di idrogeno e il sistema periodico degli elementi
© 978-8808-22107-0
La funzione d’onda dello stato relativo a questa energia e con i numeri quantici angolari l e m è n,l,m
(19.52)
= a Yl,m (✓, ) Fn,l (⇢)
con ⇢Fn,l (⇢) = e
↵⇢
n X
ak ⇢k
(19.53)
k=l+1
I coefficienti ak si ottengono dalla (19.50). Finalmente abbiamo a disposizione una descrizione completa degli stati di un atomo di idrogeno.
19.5
Le funzioni d’onda dell’idrogeno
Facciamo un po’ una rassegna di quello che abbiamo scoperto. Gli stati che soddisfano all’equazione di Schrödinger per un elettrone in un campo coulombiano sono caratterizzati da tre numeri quantici, n, l e m, che sono tutti numeri interi. La distribuzione angolare dell’ampiezza dell’elettrone può avere soltanto certe forme che chiamiamo Yl,m . Queste ultime sono distinte da l, numero quantico del momento angolare totale, e m, numero quantico «magnetico», che può variare da l a +l. Per ogni configurazione angolare, vi sono varie possibili distribuzioni radiali Fn,l (r) dell’ampiezza dell’elettrone; queste sono distinte dal numero quantico principale, n, che può variare da l + 1 a 1. L’energia dello stato dipende solo da n, e aumenta all’aumentare di n. Lo stato d’energia minima, o stato fondamentale, è uno stato s. In questo caso, l = 0, n = 1 e m = 0. Si tratta di uno stato «non degenere», in quanto vi è un solo stato di questa energia, e la sua funzione d’onda possiede simmetria sferica. L’ampiezza di trovare l’elettrone è massima al centro e diminuisce in maniera monotòna all’aumentare della distanza dal centro. Possiamo visualizzare l’ampiezza dell’elettrone con la bolla disegnata in FIGURA 19.6a.
z
z
–
+
+
0
x
n
x
E così via 10
1s m=0
2s m=0 (a)
6 5
(b)
z
z
4s
4p
4d
3s
3p
3d
2s
2p
4f
4 3
–
+ +
19.6
I caratteri generali di alcune funzioni d’onda dell’atomo di idrogeno illustrati da alcuni schizzi rappresentativi. Le regioni tratteggiate sono le zone in cui le ampiezze hanno valori grandi. I segni più e meno mostrano il segno relativo dell’ampiezza in ciascuna regione. FIGURA
19.7 Diagramma dei livelli di energia dell’idrogeno. FIGURA
–
x
2
+
2p m=0
3p m=0 (c)
(d)
z
z
–
+ +
– – 3d m=0
x
–
x
+
4d m=0 (e)
+
– +
– +
x –13,6 eV
– (f)
1s
1
s
p
d
f
0
1
2
3
19.5 • Le funzioni d’onda dell’idrogeno
© 978-8808-22107-0
Vi sono anche altri stati s con energie più elevate, per n = 2, 3, 4, ... Per ogni energia, ne esiste una sola versione (m = 0), ed essi sono tutti a simmetria sferica. Questi stati hanno ampiezze che cambiano alternativamente di segno, una o più volte, all’aumentare di r. Vi sono n 1 superfici nodali sferiche, cioè superfici dove si annulla la . Lo stato 2s (l = 0, n = 2), per esempio, si presenterà come mostrato in FIGURA 19.6b. (Le parti scure del disegno indicano le regioni dove si ha una grande ampiezza e i segni più e meno indicano le fasi relative dell’ampiezza.) I livelli energetici degli stati s sono mostrati nella prima colonna della FIGURA 19.7. Ci sono poi gli stati p, quelli con l = 1. Per ogni n, che deve essere maggiore o uguale a 2, vi sono tre stati della stessa energia, per m = +1, m = 0 e m = 1. I tre livelli di energia sono mostrati in FIGURA 19.7. La dipendenza angolare di questi stati è riportata nella TABELLA 19.1. Per esempio, per m = 0, se l’ampiezza è positiva per ✓ vicino a zero, essa sarà negativa per ✓ vicino a 180°. Vi è un piano nodale coincidente col piano x y. Per n > 2, vi sono anche nodi sferici. L’ampiezza con n = 2, m = 0 è schematicamente disegnata in FIGURA 19.6c, e quella con n = 3, m = 0 in FIGURA 19.6d. Si potrebbe pensare che, visto che m rappresenta una specie di «orientazione» nello spazio, vi debbano essere distribuzioni simili con dei picchi dell’ampiezza anche lungo l’asse x, o lungo l’asse y. Sono forse queste ampiezze quelle connesse con gli stati con m = +1 e m = 1? No. Ma siccome noi abbiamo tre stati con la stessa energia, ogni combinazione lineare dei tre sarà ancora uno stato stazionario della stessa energia. Risulta che lo stato «x», corrispondente allo stato «z», cioè a quello con m = 0 di FIGURA 19.6c, è una combinazione lineare degli stati con m = +1 e con m = 1. Il corrispondente stato «y» è un’altra combinazione. Più precisamente, intendiamo dire che «z» = | 1, 0i «x» =
| 1, +1i | 1, 1i p 2
| 1, +1i + | 1, 1i p i 2 Tutti questi stati si presentano allo stesso modo, quando sono riferiti ai particolari assi a cui corrispondono. Gli stati d (l = 2) hanno cinque possibili valori di m per ciascuna energia, e lo stato di energia più bassa ha n = 3. I livelli si susseguono come indicato in FIGURA 19.7. Le dipendenze angolari diventano più complicate. Per esempio, gli stati con m = 0 hanno due nodi conici e quindi la funzione d’onda cambia di fase da + a , e poi ancora a + quando si passa dal polo nord al polo sud. La forma approssimativa dell’ampiezza è disegnata nelle FIGURE 19.6e e 19.6f per gli stati m = 0 con n = 3 e n = 4. Gli n più grandi hanno di nuovo nodi sferici. Non cercheremo di descrivere ulteriormente altri stati fra quelli possibili. Potrete trovare le funzioni d’onda dell’idrogeno descritte con maggiori particolari in molti libri. Due buone referenze sono L. Pauling ed E.B. Wilson, Introduction to Quantum Mechanics, McGraw-Hill (1935); e R.B. Leighton, Principles of Modern Physics, McGraw-Hill (1959). Troverete in essi dei diagrammi di alcune delle funzioni e rappresentazioni grafiche di molti stati. Desideriamo menzionare un’altra caratteristica delle funzioni d’onda con l grande: per l > 0, le ampiezze sono zero al centro. Questo non ci sorprende, perché è difficile che l’elettrone abbia un momento angolare quando il suo braccio è molto piccolo. Per questa ragione, più l è grande più le ampiezze sono «respinte» dal centro. Se guardate come le funzioni radiali Fn,l (r) variano per piccoli r, troverete dalla (19.53) che «y» =
Fn,l (r) ⇡ r l Una tale dipendenza da r significa che più l è grande più bisogna andare lontano da r = 0 per ottenere un’ampiezza apprezzabile. Per inciso, questo comportamento è determinato dal termine di forza centrifuga nell’equazione radiale, e quindi si avrebbe lo stesso risultato per ogni potenziale che vari più lentamente di 1/r 2 per piccoli r, il che avviene per la maggior parte dei potenziali atomici.
313
314
Capitolo 19 • L’atomo di idrogeno e il sistema periodico degli elementi
19.6
© 978-8808-22107-0
Il sistema periodico
Vorremmo ora applicare la teoria dell’atomo di idrogeno in maniera approssimata per ricavarne una certa comprensione del sistema periodico degli elementi che conosciamo dalla chimica. Per un elemento di numero atomico Z, ci sono Z elettroni tenuti insieme dall’attrazione elettrica del nucleo, attenuata da una reciproca repulsione. Per ottenere la soluzione esatta dovremmo risolvere l’equazione di Schrödinger per Z elettroni in un campo coulombiano. Per l’elio, tale equazione è ~ @ = i @t
⌘ ~2 ⇣ 2 2e2 r1 + r22 + * 2m , r1
2e2 e2 + + r2 r 12 -
dove r21 è un laplaciano che opera su r1 , la coordinata di un elettrone; r22 opera su r2 ; e r 12 = |r1 r2 |. (Di nuovo stiamo trascurando lo spin degli elettroni.) Per trovare gli stati stazionari e i livelli di energia, dovremmo riuscire a trovare soluzioni della forma = f (r1, r2 ) e
(i/~)Et
La dipendenza geometrica è contenuta in f , che è una funzione di sei variabili, le posizioni simultanee dei due elettroni. Nessuno è riuscito a trovare una soluzione analitica, anche se con metodi numerici sono state trovate delle soluzioni per gli stati di energia più bassa. Con 3, 4 oppure 5 elettroni, non ci sono speranze di ottenere soluzioni esatte, ed è andare troppo in là l’affermare che la meccanica quantistica ha portato a una precisa comprensione del sistema periodico. È tuttavia possibile, anche con un’approssimazione alla buona – e qualche aggiustamento – capire, almeno da un punto di vista qualitativo, molte proprietà chimiche che appaiono dal sistema periodico. Le proprietà chimiche degli atomi sono determinate principalmente dai loro stati di più bassa energia. Per trovare questi stati e le loro energie si può usare questa teoria approssimata. Per prima cosa, si trascura lo spin dell’elettrone, tranne per quanto riguarda il principio di esclusione, che afferma che un qualsiasi stato fissato elettronico può essere occupato solo da un elettrone. Questo comporta che ogni particolare configurazione orbitale possa avere fino a due elettroni, uno con lo spin su e l’altro con lo spin giù. In secondo luogo, trascuriamo i dettagli dell’interazione fra gli elettroni, in prima approssimazione, e supponiamo che ciascun elettrone si muova in un campo centrale risultante dall’azione combinata dei campi del nucleo e degli altri elettroni. Per il neon, che ha 10 elettroni, diciamo che uno degli elettroni vede un potenziale medio dovuto al nucleo più quello dovuto agli altri nove elettroni. Immaginiamo quindi di porre nell’equazione di Schrödinger di ciascun elettrone, un V (r), che è un campo di tipo 1/r modificato da una densità di carica a simmetria sferica, dovuta agli altri elettroni. In questo modello, ciascun elettrone si comporta come una particella indipendente. La dipendenza angolare delle sue funzioni d’onda sarà esattamente la stessa di quelle corrispondenti dell’atomo d’idrogeno. Ci saranno stati s, stati p, e così via; ed essi avranno tutti i possibili valori di m. Poiché V (r) non varia più come 1/r, la parte radiale della funzione d’onda sarà un po’ diversa, rimanendo però qualitativamente la stessa, in modo che avremo lo stesso numero quantico radiale, n. Le energie degli stati saranno, anch’esse, un po’ differenti. Idrogeno (H) Vediamo che cosa si ottiene da questo schema. Lo stato fondamentale dell’idrogeno ha l = m = 0 e n = 1; si dice che la configurazione dell’elettrone è 1s. L’energia è 13,6 eV. Ciò significa che sono necessari 13,6 eV per tirar fuori l’elettrone dall’atomo. Questa si chiama «energia di ionizzazione», WI . Una grande energia di ionizzazione comporta che è più difficile tirare fuori l’elettrone e, in generale, che il materiale è meno attivo chimicamente. Elio (He) Consideriamo ora l’elio. Tutti e due gli elettroni si possono trovare nello stesso stato d’energia più bassa (uno con lo spin su e l’altro con lo spin giù). In questo stato d’energia minima, l’elettrone si muove in un potenziale che per piccoli r è come un campo coulombiano con z = 2 e per grandi r è
© 978-8808-22107-0
come un campo coulombiano con z = 1. Il risultato è uno stato 1s «tipo idrogeno» con un’energia un po’ più bassa. Entrambi gli elettroni occupano identici stati 1s (l = 0, m = 0). L’energia di ionizzazione osservata (per rimuovere un solo elettrone) è 24,6 eV. Poiché ora lo «strato» 1s è completo (ci possono stare solo due elettroni), praticamente non c’è alcuna tendenza ad attrarre un elettrone da un altro atomo. L’elio è chimicamente inerte.
315
19.6 • Il sistema periodico
n
0
4f
6 4 3
Litio (Li) 4d 4p 3d Il nucleo di litio ha carica 3. Gli stati elettronici saranno ancora di tipo 4s 3p idrogeno, e i tre elettroni andranno a occupare i tre livelli d’energia più 3s bassa. Due andranno negli stati 1s e il terzo in uno stato con n = 2. Ma 2 con l = 0 o con l = 1? Nel caso dell’idrogeno, questi stati hanno la stessa energia, ma non negli altri atomi, per il motivo che segue. Ricorderete che 2p 2s uno stato 2s ha una certa ampiezza di trovarsi in vicinanza del nucleo, mentre ciò non è vero per lo stato 2p. Questo significa che un elettrone 2s risentirà alquanto della tripla carica elettrica del nucleo del Li, mentre un elettrone 2p starà all’esterno dove il campo assomiglia a quello di Coulomb per una sola carica. Questa attrazione supplementare abbassa l’energia dello stato 2s relativamente a quella dello stato 2p. I livelli di energia appariranno grosso modo come nella FIGURA 19.8, che va paragonata al diagramma corrispondente per l’idrogeno in FIGURA 19.7. Quindi, l’atomo di litio avrà due elettroni nello stato 1s e uno nello stato 2s. Poiché l’elettrone 2s ha un’energia più alta di quello 1s, potrà essere rimosso con relativa facilità. 1s 1 L’energia di ionizzazione del litio è di soli 5,4 eV ed esso è chimicamente p d f s molto attivo. Vedete quindi lo schema che va sviluppandosi; abbiamo riportato nella TABELLA 19.2 una lista dei primi 36 elementi, con gli stati occupati dagli FIGURA 19.8 Diagramma schematico dei livelli elettroni nello stato fondamentale di ciascun atomo. La tabella mostra d’energia di un elettrone atomico in presenza di altri l’energia di ionizzazione per l’elettrone meno legato, e il numero di elettroni elettroni. (La scala non è la stessa della FIGURA 19.7.) che occupa ciascuno «strato», con il che s’intendono gli stati con lo stesso n. Poiché gli stati con l diversi hanno diverse energie, ciascun valore di l corrisponde a un sottostrato di 2(2l + 1) stati possibili (che differiscono per m e per lo spin dell’elettrone). Questi hanno tutti la stessa energia, a parte alcuni effetti molto piccoli che stiamo trascurando. Berillio (Be) Il berillio è come il litio, salvo che ha due elettroni nello stato 2s e così pure nello strato 1s completo. Dal boro (B) al neon (Ne) Il boro ha cinque elettroni. Il quinto deve andare in uno stato 2p. Ci sono 2·3 = 6 stati 2p differenti, e quindi possiamo continuare ad aggiungere elettroni fino a un totale di 8. Con ciò si arriva al neon. Man mano che si aggiungono questi elettroni, aumenta anche Z, l’intera distribuzione degli elettroni si spinge sempre più vicina al nucleo e l’energia degli stati 2p va abbassandosi. Quando si arriva al neon, l’energia di ionizzazione è arrivata a 21,6 eV. Il neon non dà via facilmente un elettrone. Inoltre, non ci sono altri posti liberi con bassa energia, e quindi non cercherà di acchiappare un altro elettrone. Il neon è chimicamente inerte. Il fluoro, d’altra parte, ha ancora un posto libero di bassa energia dove un elettrone può andare a finire e quindi è molto attivo nelle reazioni chimiche. Dal sodio (Na) all’argon (Ar) Con il sodio l’undicesimo elettrone deve cominciare un nuovo strato, andando a mettersi in uno stato 3s. Il livello d’energia di questo stato è molto più alto; l’energia di ionizzazione va giù; e il sodio è chimicamente attivo. Dal sodio all’argon gli stati s e p con n = 3 vengono occupati seguendo esattamente lo stesso ordine che dal litio al neon. Le configurazioni angolari degli elettroni negli strati esterni incompleti seguono lo stesso ordine, e la progressione delle energie di ionizzazione è del tutto simile. Potete quindi capire la ragione del ripetersi delle proprietà
316
Capitolo 19 • L’atomo di idrogeno e il sistema periodico degli elementi
TABELLA
19.2
Le configurazioni elettroniche dei primi 36 elementi.
Z
Elemento
Configurazione elettronica
W I (eV) 1s
1
© 978-8808-22107-0
H
idrogeno
13,6
1 2
2s
2p
3s
3p
3d
4s
4p
2
He
elio
24,6
3
Li
litio
5,4
1
4
Be
berillio
9,3
2
5
B
boro
8,3
2
1
6
C
carbonio
11,3
Completo
2
2
Numero di elettroni
7
N
azoto
14,5
(2)
2
3
in ciascuno stato
8
O
ossigeno
13,6
2
4
9
F
fluoro
17,4
2
5
10
Ne
neon
21,6
2
6
11
Na
sodio
5,1
1
12
Mg
magnesio
7,6
2
13
Al
alluminio
6,0
14
Si
silicio
8,1
Completo
2
1
2
2
2
3
2
4
15
P
fosforo
10,5
16
S
zolfo
10,4
17
Cl
cloro
13,0
2
5
15,8
2
6
18
Ar
argon
19
K
potassio
4,3
20
Ca
calcio
6,1
21
Sc
scandio
6,5
22
Ti
titanio
6,8
23
V
vanadio
6,7
24
Cr
cromo
6,8
25
Mn
manganese
7,4
26
Fe
ferro
7,9
27
Co
cobalto
28
Ni
nichel
29
Cu
30
Zn
31 32
(2)
(8)
4d
4f
1 2 1
2
2
2
3
2
5
1
5
2
6
2
7,9
7
2
7,6
8
2
rame
7,7
10
1
zinco
9,4
10
2
Ga
gallio
6,0
Ge
germanio
7,9
33
As
arsenico
9,8
34
Se
selenio
9,7
35
Br
bromo
11,8
36
Kr
kripton
14,0
Completo (2)
(8)
(8)
Completo (2)
(8)
(18)
2
1
2
2
2
3
2
4
2
5
2
6
chimiche al crescere del numero atomico. Il magnesio si comporta chimicamente in modo molto simile al berillio, il silicio come il carbonio, il cloro come il fluoro. L’argon è inerte come il neon. Forse avrete notato una piccola singolarità nella successione delle energie di ionizzazione tra il litio e il neon, e un’altra simile singolarità tra il sodio e l’argon. L’ultimo elettrone è legato all’atomo di ossigeno un po’ meno di quanto ci si aspetterebbe. E analogamente per lo zolfo. Perché deve essere così? Possiamo comprenderlo introducendo appena un po’ degli effetti delle interazioni tra i singoli elettroni. Pensate a ciò che accade quando mettiamo i primi 2p elettroni nell’atomo di boro. Ci sono sei possibilità, tre possibili stati p, ciascuno con due spin. Immaginiamo che l’elettrone si ponga con lo spin su nello stato con m = 0, che abbiamo anche detto stato «z» perché abbraccia l’asse z. Che cosa succederà ora con il carbonio? Ci sono ora
© 978-8808-22107-0
19.6 • Il sistema periodico
due elettroni 2p. Se uno di essi si porta nello stato «z», dove andrà a finire il secondo? Esso avrà un’energia più bassa se sta lontano dal primo elettrone, il che avviene se va nello stato «x» dello strato 2p, per esempio. (Ricordate che questo stato non è altro che una combinazione degli stati con m = +1 e m = 1.) Quando poi si passa all’azoto, i tre elettroni 2p avranno la minima energia di mutua repulsione, se si dispongono rispettivamente nelle configurazioni «x», «y» e «z». Ma per l’ossigeno, il gioco è finito. Il quarto elettrone deve andare in uno degli stati completi, con spin opposto. Esso viene fortemente respinto dall’elettrone che già si trova in quello stato, quindi la sua energia non è così bassa come potrebbe essere altrimenti, e viene rimosso più facilmente. Questo spiega l’irregolarità nella successione delle energie di legame che appare tra l’azoto e l’ossigeno, e tra il fosforo e il silicio. Dal potassio (K) allo zinco (Zn) Dopo l’argon, a prima vista si potrebbe pensare che i nuovi elettroni comincino a riempire gli stati 3d. Ma non è così. Come abbiamo già detto, e illustrato con la FIGURA 19.8, gli stati con più alto momento angolare hanno un’energia sempre più alta. Quando si arriva agli stati 3d, questi sono sospinti a un’energia un po’ più alta dell’energia dello stato 4s. Perciò nel potassio l’ultimo elettrone va a disporsi nello stato 4s. Una volta completato questo strato (con due elettroni), in corrispondenza del calcio, gli stati 3d cominciano a essere riempiti con lo scandio, il titanio e il vanadio. Le energie degli stati 3d e 4s sono molto vicine, e piccoli effetti possono spostare l’equilibrio da una parte o dall’altra. Quando abbiamo finito di mettere quattro elettroni negli stati 3d, la loro repulsione alza l’energia dello stato 4s quanto basta perché la corrispondente energia sia di poco superiore a quella dello stato 3d, e quindi un elettrone si sposta. Per il cromo non si ha una combinazione 4, 2 come ci saremmo aspettati, ma invece una 5, 1. Il nuovo elettrone che va aggiunto per ottenere il manganese, finisce di riempire lo strato 4s, e quindi gli stati dello strato 3d riprendono a essere occupati uno dopo l’altro fino ad arrivare al rame. Ma poiché gli strati più esterni del manganese, del ferro, del cobalto e del nichel hanno le stesse configurazioni, essi tendono tutti ad avere simili proprietà chimiche. (Questo effetto è molto più pronunciato negli elementi delle terre rare, che hanno tutti lo stesso strato esterno, con uno strato interno che va progressivamente riempiendosi e che ha molta meno influenza sulle loro proprietà chimiche.) Nel rame, un elettrone è sottratto dallo strato 4s e va finalmente a completare lo stato 3d. Ma nel rame l’energia della combinazione 10, 1 è così vicina a quella della combinazione 9, 2 che basta la presenza di un altro atomo nelle vicinanze per spostare l’equilibrio. Per questa ragione, gli ultimi due elettroni del rame sono quasi equivalenti, e il rame può avere valenza sia l sia 2. (Qualche volta si comporta come se gli elettroni fossero nella combinazione 9, 2.) Fenomeni del genere succedono anche in altri casi e rendono ragione del fatto che altri metalli, come il ferro, si combinano chimicamente con due possibili valenze. Con lo zinco, sia lo strato 3d sia il 4s sono completi una volta per tutte. Dal gallio (Ga) al krypton (Kr) Dal gallio al kripton, la successione procede di nuovo normalmente riempiendo lo strato 4p. Gli strati esterni, le energie e le proprietà chimiche ripetono lo schema che si era avuto dal boro al neon e dall’alluminio all’argon. Il kripton, come l’argon e il neon, è conosciuto come un «gas nobile». Tutti e tre sono chimicamente «inerti». Questo significa semplicemente che, poiché sono completi gli strati di energia relativamente bassa, ci sono poche situazioni in cui è energeticamente vantaggioso per loro unirsi in semplici combinazioni con altri elementi. Il fatto d’avere uno strato completo non basta. Anche il berillio e il magnesio hanno gli strati s completi, ma l’energia di questi strati è troppo alta per garantirne la stabilità. Analogamente, ci si sarebbe aspettato di trovare un altro elemento «nobile» al posto del nichel, se l’energia dello strato 3d fosse stata più bassa (o il 4s, più alto). D’altra parte, il kripton non è completamente inerte; esso forma un composto debolmente legato con il cloro. Poiché il nostro campionario ha già rivelato le caratteristiche principali del sistema periodico, ci fermiamo all’elemento numero 36, anche se ne rimangono ancora settanta o giù di lì!
317
318
Capitolo 19 • L’atomo di idrogeno e il sistema periodico degli elementi
© 978-8808-22107-0
Vogliamo solo sottolineare ancora un altro punto: che non solo siamo in grado di comprendere entro certi limiti le valenze, ma che possiamo anche dire qualche cosa sulle proprietà direzionali dei legami chimici. Prendiamo un atomo come l’ossigeno che ha quattro elettroni 2p. I primi tre si andranno a disporre negli stati «x», «y» e «z» e il quarto raddoppierà la popolazione di uno di questi stati, lasciando, per esempio, «x» e «y» vuoti. Consideriamo allora quel che avviene in H2 O. Ciascuno dei due idrogeni vuole dividere un elettrone con l’ossigeno, aiutandolo a riempire uno strato. Questi elettroni tenderanno ad andare a occupare i due vuoti in «x» e «y». Quindi nella molecola d’acqua, i due atomi d’idrogeno si disporranno ad angolo retto rispetto al centro dell’ossigeno. Questo angolo è in realtà di 105°. Possiamo anche capire perché l’angolo è maggiore di 90°. Dividendo i loro elettroni con l’ossigeno, i due idrogeni finiscono con l’avere in tutto una carica positiva. La repulsione elettrica «distende» la funzione d’onda e spinge l’angolo fino a 105°. La stessa situazione si verifica per H2 S. Ma, poiché l’atomo di zolfo è più grande, i due atomi di idrogeno sono più lontani, c’è meno repulsione, e l’angolo arriva solo a 93°. Il selenio è ancora più grande e quindi in H2 Se l’angolo è molto vicino a 90°. Possiamo far uso degli stessi ragionamenti per comprendere la geometria dell’ammoniaca, H3 N. L’azoto ha spazio per tre elettroni 2p, uno per ciascuno degli stati di tipo «x», «y» e «z». I tre atomi d’idrogeno si dovranno disporre ad angolo retto uno rispetto all’altro. Gli angoli si trovano essere un po’ maggiori di 90°, ancora a causa della repulsione elettrostatica, ma almeno si capisce come mai la molecola di H3 N non sia piana. Nella fosfina, H3 P, gli angoli sono vicini a 90°, e ancor più lo sono in H3 As. Noi avevamo supposto che la molecola di NH3 non fosse piatta quando l’abbiamo rappresentata come un sistema a due stati. Ed è proprio il fatto che non sia schiacciata che rende possibile il maser ad ammoniaca. Vediamo ora che anche questa sua forma può essere compresa con la nostra meccanica quantistica. L’equazione di Schrödinger ha rappresentato un grande trionfo della fisica. Fornendo la chiave per la comprensione dei meccanismi interni della struttura atomica, ci ha dato la spiegazione degli spettri atomici, della chimica e della natura della materia.
20
Operatori
20.1
Operazioni e operatori
La meccanica quantistica che abbiamo finora studiato avrebbe potuto essere trattata con la sola algebra elementare, anche se ogni tanto abbiamo scritto le grandezze e le equazioni quantistiche in modi un po’ fuori dall’ordinario. Vogliamo ora dire qualcosa di più su alcuni utili e interessanti metodi matematici per trattare gli oggetti quantistici. Ci sono molte maniere di svolgere gli argomenti della meccanica quantistica e la maggior parte dei libri usa un approccio diverso da quello da noi seguito. Se voi cominciaste a leggere altri libri potreste non vedere immediatamente la connessione tra quel che vi trovereste scritto e quello che abbiamo fatto qui. Lo scopo principale di questo capitolo è quello di farvi vedere in quanti modi diversi si può descrivere la stessa fisica, anche se ciò non ci impedirà di trovare qualche interessante risultato. Dopo di che, sarete in grado di capire meglio quel che dicono gli altri. Da quando i fisici hanno cominciato a occuparsi di meccanica classica, le varie equazioni sono sempre state scritte con riferimento alle componenti x, y e z. Poi c’è stato qualcuno che ha fatto notare che tutta la notazione diventava più semplice introducendo il formalismo vettoriale. È vero che quando volete tirar fuori dei numeri, spesso dovete convertire un’altra volta i vettori nelle loro componenti. Ma, generalmente, è assai più semplice vedere quel che succede lavorando con i vettori e anche molti calcoli sono più semplici da fare. In meccanica quantistica, in molti casi, si è guadagnato in semplicità introducendo il concetto di «vettore di stato». Il vettore di stato | i non ha, naturalmente, niente a che fare con i vettori geometrici in tre dimensioni, ma è un simbolo astratto che rappresenta uno stato fisico, identificato dal «simbolo» o «nome». Questo concetto è utile perché le leggi della meccanica quantistica possono essere scritte sotto forma di equazioni algebriche per mezzo di questi simboli. Per esempio, la nostra legge fondamentale secondo la quale ogni stato può essere costruito come combinazione lineare di stati di base è scritta nella forma | i=
X
Ci | ii
(20.1)
i
dove i Ci sono un insieme di puri numeri (complessi); si tratta delle ampiezze Ci = hi | i, mentre | 1i, | 2i, | 3i e così via indicano gli stati di una certa base o rappresentazione. Se prendete uno stato fisico e lo manipolate in qualche modo, per esempio, lo ruotate oppure lasciate passare un tempo t, ottenete uno stato differente. Si può dire che «effettuare un’operazione su di uno stato produce un nuovo stato». Questa stessa idea può essere espressa per mezzo di un’equazione: | i = Aˆ | i
(20.2)
Un’operazione su uno stato produce un altro stato. L’operatore Aˆ sta a indicare una particolare operazione. Quando questa operazione è compiuta su un certo stato, per esempio | i, essa produce un altro stato | i.
320
Capitolo 20 • Operatori
© 978-8808-22107-0
Cosa significa l’equazione (20.2)? Ne diamo una definizione in questo modo. Se si moltiplica l’equazione per hi | e si sviluppa | i secondo l’equazione (20.1), si ottiene X hi | i = hi | Aˆ | jih j | i (20.3) j
(Gli stati | ji appartengono allo stesso insieme di | ii.) Ma questa non è altro che un’equazione algebrica. I numeri hi | i ci dicono quanto di ciascuno stato di base si trova in | i, e questo ci è dato sotto forma di una sovrapposizione lineare delle ampiezze di probabilità h j | i di trovare | i in ciascuno stato di base. I numeri hi | Aˆ | ji sono proprio i coefficienti che ci dicono quanta parte di h j | i entra in ciascuna somma. L’operatore Aˆ è descritto numericamente dall’insieme di numeri, o «matrice», Ai j ⌘ hi | Aˆ | ji (20.4) Così, l’equazione (20.2) è una maniera raffinata per scrivere l’equazione (20.3). In realtà, è qualcosa di più, e implica qualcosa di più. Nell’equazione (20.2) non si fa riferimento a nessun insieme di stati di base. L’equazione (20.3) è l’immagine dell’equazione (20.2) espressa mediante un certo insieme di stati di base. Ma, come ben sapete, si può usare l’insieme di stati che si vuole. E questa idea è contenuta nell’equazione (20.2). La scrittura per mezzo dell’operatore evita di dover fare una particolare scelta. Naturalmente, quando volete fissare le idee, dovete scegliere un certo insieme. Fatta la vostra scelta, userete poi l’equazione (20.3). Perciò, l’equazione operatoriale (20.2) è una maniera più astratta di scrivere l’equazione algebrica (20.3). Questo è analogo alla differenza che c’è tra lo scrivere c= a⇥b invece di
cx = ay bz
az by
cy = az bx
a x bz
cz = a x by
ay bx
Il primo modo è assai più maneggevole. Però, quando volete dei risultati, bisognerà che vi decidiate a scrivere le componenti rispetto a un qualche sistema di assi. Analogamente, se volete ˆ dovete essere capaci di scrivere la matrice Ai j per realmente dire quel che intendete per A, mezzo di un ben definito insieme di stati di base. Purché abbiate in mente un certo insieme | ii, l’equazione (20.2) ha esattamente lo stesso significato dell’equazione (20.3). (Ricordate anche che una volta nota una matrice in una particolare base, potete sempre calcolare la corrispondente matrice in un’altra base. Si può cioè trasformare la matrice da una «rappresentazione» a un’altra.) L’equazione operatoriale (20.2) ci consente anche di ragionare in un modo nuovo. Immagiˆ lo potremo far agire su di uno stato | i per creare un nuovo niamo d’avere un certo operatore A; ˆ stato A| i. Talvolta, lo «stato» che si ottiene in questo modo può essere assai strano – può anche non rappresentare una situazione fisica di quelle che si trovano in natura. (Per esempio, si può ottenere uno stato non normalizzato in modo tale da poter rappresentare un elettrone.) In altre parole, si possono talvolta ottenere degli «stati» che sono matematicamente artificiali. Anche questi però possono essere utili, eventualmente come stadi intermedi in qualche calcolo. Vi abbiamo già fatto vedere molti esempi di operatori quantistici. Abbiamo visto l’operatore di rotazione Rˆ y (✓), che prende uno stato | i e ne produce uno nuovo, che è poi quello vecchio visto da un sistema di coordinate ruotato. Abbiamo visto l’operatore di parità (o di inversione) ˆ che produce un nuovo stato mediante l’inversione di tutte le coordinate. Abbiamo visto gli P, operatori ˆ x , ˆ y e ˆ z per le particelle di spin un mezzo. L’operatore Jˆz è stato definito nel capitolo 17 mediante l’operatore di rotazione per piccoli angoli ✏: i Rˆz (✏) = 1 + ✏ Jˆz (20.5) ~ Naturalmente, questo significa semplicemente che i Rˆz (✏) | i = | i + ✏ Jˆz | i ~
(20.6)
20.2 • Energie medie
© 978-8808-22107-0
In questo esempio, Jˆz | i è ~/i✏ volte lo stato che si otterrebbe ruotando | i di un piccolo angolo ✏ e poi sottraendovi lo stato originale. Esso rappresenta uno «stato» che è la differenza dei due stati. Ancora un esempio. Abbiamo incontrato un operatore pˆx – detto operatore impulso (o meglio, la sua componente x) – definito da un’equazione del tipo della (20.6). Se Dˆ x (L) è l’operatore che sposta lo stato di un tratto L lungo x, allora pˆx è definito da i Dˆ x ( ) = 1 + pˆx ~
(20.7)
dove è un piccolo spostamento. Spostare lo stato | i lungo x di una piccola distanza dà luogo a un nuovo stato | 0i. Quello che stiamo dicendo è che questo nuovo stato è il vecchio stato più un nuovo pezzetto: i pˆx | i ~ Gli operatori di cui stiamo parlando lavorano su un vettore di stato come | i, che è la descrizione astratta di una situazione fisica. Essi sono completamente differenti dagli operatori algebrici che lavorano sulle funzioni matematiche. Per esempio, d/dx è un «operatore» che lavora su f (x) trasformandola in una nuova funzione f 0(x) = d f /dx. Un altro esempio è l’operatore algebrico r2 . Si vede subito perché si usa la stessa parola in entrambi i casi, ma si deve tener presente che i due tipi di operatori sono diversi. Un operatore quantistico Aˆ non lavora sulle funzioni algebriche, ma sui vettori di stato come | i. Entrambi i tipi di operatori si usano in meccanica quantistica, spesso addirittura in tipi di equazioni simili tra loro, come vedremo tra poco. Ma quando s’imparano queste cose per la prima volta, è bene tenere sempre presente questa distinzione. In seguito, raggiunta una maggiore familiarità con queste cose, vi accorgerete che non è poi tanto importante avere delle distinzioni così nette tra i due tipi di operatori. In effetti, vi accorgerete che, in realtà, la maggior parte dei libri usa la stessa notazione per entrambi! Proseguiamo e vediamo cosa si può fare di buono con gli operatori. Prima, però facciamo ˆ la cui matrice in una qualche un’osservazione importante. Supponiamo d’avere un operatore A, base sia Ai j ⌘ hi | Aˆ | ji L’ampiezza di probabilità che lo stato Aˆ | i sia contenuto in qualche altro stato | i è h | Aˆ | i Ha un qualche significato la complessa coniugata di questa ampiezza? Voi stessi dovreste saper dimostrare che h | Aˆ | i⇤ = h | Aˆ † | i (20.8) dove Aˆ † è un operatore (leggi «operatore A dagger») i cui elementi di matrice sono A†i j = (A ji )⇤
(20.9)
Per ottenere l’elemento i, j di A† , prendete l’elemento j, i di Aˆ (invertendo cioè gli indici) e fatene il complesso coniugato. L’ampiezza di probabilità che lo stato Aˆ † | i sia in | i è la complessa coniugata dell’ampiezza che Aˆ | i sia in | i. L’operatore Aˆ † è detto «hermitiano coniugato» di ˆ Molti importanti operatori quantistici godono della speciale proprietà che quando se ne prende A. l’hermitiano coniugato, si riottiene lo stesso operatore. Se Bˆ è un tale operatore, allora Bˆ † = Bˆ e si dice che è un operatore «autoaggiunto» o «hermitiano».
20.2
Energie medie
Finora, ci siamo limitati a ricordarvi cose che già sapevate. Passiamo ora a discutere un nuovo problema. Come si può fare a trovare l’energia media di un sistema; per esempio, un atomo? Se
321
322
Capitolo 20 • Operatori
© 978-8808-22107-0
un atomo si trova in un determinato stato di energia definita e si misura quest’ultima, si trova un certo valore E. Se si seguita a ripetere la misura su ciascuno di una serie di atomi selezionati in modo da essere tutti in quello stesso stato, tutte le misure daranno per risultato E e la «media» delle misure sarà, naturalmente, ancora E. Cosa succede, però, se si effettuano delle misure su un certo stato | i che non sia uno stato stazionario? Poiché il sistema non possiede un’energia definita, una misura darà una certa energia e la stessa misura, compiuta su di un altro atomo nello stesso stato, porterà a un differente valore dell’energia, e così via. Quale sarà il valore medio di tutta una serie di misure di energia? Si può rispondere a questa domanda proiettando lo stato | i sull’insieme di stati di energia definita. Per ricordare che si tratta di un particolare insieme di stati di base, li indicheremo con | ⌘ i i. Ciascuno degli stati | ⌘ i i ha un’energia definita Ei . In questa rappresentazione, X | i= Ci | ⌘ i i (20.10) i
Se si fa una misura di energia, e si trova un certo valore Ei , questo significa che il sistema è nello stato ⌘ i . Ma ogni misura può dare valori differenti. Qualche volta si otterrà E1 , qualche volta E2 , qualche volta E3 ecc. La probabilità di osservare l’energia E1 , altro non è che la probabilità di trovare il sistema nello stato | ⌘ 1 i, che naturalmente è proprio il modulo quadrato dell’ampiezza C1 = h⌘ 1 | i. La probabilità di ottenere ciascuna delle possibili energie Ei è Pi = |Ci | 2
(20.11)
Come sono legate queste probabilità al valore medio dell’intera sequenza di misure di energia? Immaginate di avere una serie di misure come questa: E1 , E7 , E11 , E9 , E1 , E10 , E7 , E2 , E3 , E9 , E6 , E4 e così via. Immaginiamo di continuare per un migliaio di misure. Una volta finito, si sommano tutte le energie e si divide per mille. E questo è ciò che s’intende per media. C’è anche una maniera abbreviata di sommare questi numeri. Si può contare quante volte si ottiene E1 , supponiamo che siano N1 , e poi contare il numero di volte che si ottiene E2 , chiamarlo N2 , e così via. La somma di tutte le energie è certamente uguale a X N1 E1 + N2 E2 + N3 E3 + · · · = Ni Ei i
L’energia media si ottiene dividendo questa somma per il numero totale di misure, che non è altro che la somma di tutti gli Ni , che indicheremo con N: P Ni Ei Emedio = i (20.12) N
Ci siamo quasi. Quello che intendiamo per probabilità che qualcosa avvenga non è altro che il numero di volte che ci aspettiamo che avvenga diviso per il numero totale di prove. Il rapporto Ni /N sarà, per grandi N, assai vicino a Pi , la probabilità di trovare lo stato | ⌘ i i, per quanto non sarà esattamente Pi a causa delle fluttuazioni statistiche. Scriviamo l’energia media predetta («attesa») nella forma hEimedio ; potremo allora dire che X hEimedio = Pi Ei (20.13) i
Gli stessi concetti valgono per ogni tipo di misura. Il valor medio di una quantità misurata A risulterà uguale a X hAimedio = Pi Ai i
dove Ai sono i diversi valori possibili della quantità osservata, e Pi è la probabilità di ottenere quel particolare valore. Torniamo al nostro stato quantistico | i. La sua energia media è X X hEimedio = |Ci | 2 Ei = Ci⇤ Ci Ei (20.14) i
i
20.2 • Energie medie
© 978-8808-22107-0
Guardate ora questo giochetto! Prima di tutto, scriviamo la somma come X h | ⌘ i iEi h⌘ i | i
(20.15)
i
Poi, consideriamo lo stato h | che sta a sinistra come un «fattore» comune. Possiamo portare questo fattore fuori dalla somma, e scrivere ! X h | | ⌘ i i Ei h⌘ i | i i
Questa espressione ha la forma h | i dove | i è uno stato appositamente «cucinato», definito da X | i= | ⌘ i i Ei h⌘ i | i
(20.16)
i
In altre parole, è lo stato che si otterrebbe prendendo ciascuno degli stati di base | ⌘ i i nella quantità Ei h⌘ i | i. Ricordate ora che cosa sono gli stati | ⌘ i i. Si suppone che essi siano stati stazionari – con il che s’intende che per ciascuno di essi Hˆ | ⌘ i i = Ei | ⌘ i i Poiché Ei è solo un numero, il secondo membro equivale a | ⌘ i i Ei , e la somma nell’equazione (20.16) è uguale a X Hˆ | ⌘ i i h⌘ i | i i
Ma l’indice i appare proprio nella famosa combinazione che si riduce all’unità, cosicché X X Hˆ | ⌘ i i h⌘ i | i = Hˆ | ⌘ i i h⌘ i | i = Hˆ | i i
i
Fantastico! L’equazione (20.16) è identica a | i = Hˆ | i
(20.17)
L’energia media dello stato | i può allora essere scritta in modo assai suggestivo come hEimedio = h | Hˆ | i
(20.18)
Per ottenere l’energia media, operate con Hˆ su | i, e poi moltiplicate per h |. Un risultato davvero assai semplice. La nostra nuova formula per l’energia media non è soltanto suggestiva. È anche utile perché ora non c’è più bisogno di riferirsi a un particolare insieme di stati di base. Non c’è neppure bisogno di conoscere tutti i possibili livelli energetici. Quando vorremo fare dei calcoli, dovremo descrivere il nostro stato per mezzo di un certo insieme di stati di base, ma una volta nota la matrice hamiltoniana Hi j per quell’insieme, potremo ricavare l’energia media. L’equazione (20.18) dice che per qualsiasi insieme di stati di base | ii, l’energia media può essere calcolata come X hEimedio = h | ii hi | Hˆ | ji h j | i (20.19) ij
dove le ampiezze hi | Hˆ | ji sono gli elementi di matrice Hi j . Controlliamo questo risultato nel caso specifico in cui gli stati | ii siano stati d’energia definita. Per essi si ha Hˆ | ji = E j | ji
323
324
Capitolo 20 • Operatori
© 978-8808-22107-0
cosicché
hi | Hˆ | ji = E j
e hEimedio =
X
h | ii E j
ij
ij
hj | i =
ij
X
Ei h | ii hi | i
i
il che è giusto. Per inciso, l’equazione (20.19) può essere estesa anche ad altre misure fisiche che si possano esprimere per mezzo di operatori. Per esempio, Lˆ z è l’operatore della componente z del momento angolare L. La media della componente z nello stato | i è hL z imedio = h | Lˆ z | i Una maniera di dimostrarlo è di pensare a qualche situazione in cui l’energia sia proporzionale al momento angolare. In questo caso, tutti i ragionamenti rimangono gli stessi. ˆ il Insomma, se un’osservabile fisica A è connessa a un opportuno operatore quantistico A, valore medio di A nello stato | i è dato da hAimedio = h | Aˆ | i
(20.20)
hAimedio = h | i
(20.21)
| i = Aˆ | i
(20.22)
Con questo s’intende che con
20.3
L’energia media di un atomo
Supponiamo di volere calcolare l’energia media di un atomo nello stato descritto dalla funzione d’onda (r); come fare? Consideriamo dapprima una situazione unidimensionale con uno stato | i definito dall’ampiezza hx | i = (x). Stiamo cioè trattando il caso particolare dell’equazione (20.19) applicata alla rappresentazione delle coordinate. Seguendo il nostro solito procedimento, sostituiamo gli stati | ii e | ji con | xi e | x 0i, e trasformiamo le somme in integrali. Otteniamo così ⌅⌅ hEimedio = h | xi hx | Hˆ | x 0i hx 0 | i dx dx 0 (20.23) Volendo, questo integrale può essere scritto nel seguente modo: ⌅ h | xi hx | i dx con hx | i =
⌅
hx | Hˆ | x 0i hx 0 | i dx 0
(20.24)
(20.25)
L’integrale su x 0 nella (20.25) è lo stesso che si è incontrato nel capitolo 16 (vedi equazione (16.50) ed equazione (16.52)) ed è uguale a ~2 d2 2m dx 2
(x) + V (x) (x)
Possiamo perciò scrivere
Ricordando che
~2 d2 hx | i = * + V (x)+ 2 , 2m dx -
h | xi = hx | i⇤ = ⇤ (x)
(x)
(20.26)
© 978-8808-22107-0
20.3 • L’energia media di un atomo
e usando questa uguaglianza, l’energia media che compare nell’equazione (20.23) può essere scritta come ⌅ 2 2 ⇤ (x) * ~ d + V (x)+ (x) dx hEimedio = (20.27) 2 , 2m dx -
Data una certa funzione d’onda (x), si può ottenere l’energia media calcolando questo integrale. Potete ora cominciare a rendervi conto di come si possa passare dai vettori di stato alle funzioni d’onda, e viceversa. La quantità tra parentesi nell’equazione (20.27) è un operatore algebrico(1) . Noi lo indicheremo ˆ come H: 2 2 ˆ = ~ d + V (x) H 2m dx 2 Con questa notazione, l’equazione (20.23) diviene ⌅ ⇤ (x) H ˆ (x) dx hEimedio = (20.28)
ˆ definito qui non è, naturalmente, identico all’operatore quantistico H. ˆ L’operatore algebrico H Il nuovo operatore opera su una funzione del punto (x) = hx | i per dar luogo a una nuova funzione di x, (x) = hx | i; mentre Hˆ opera su di un vettore di stato | i per dar luogo a un altro vettore di stato | i, senza che in tutto questo sia in qualche modo implicata la rappresentazione delle coordinate o un’altra qualsiasi rappresentazione. ˆ non è esattamente uguale a Hˆ neppure nella rappresentazione delle coordinate. Se deMa H cidiamo di lavorare nella rappresentazione delle coordinate, dobbiamo interpretare Hˆ riferendoci alla matrice hx | Hˆ | x 0i che dipende in qualche modo dai due «indici» x e x 0; cioè, ci aspettiamo – in accordo con l’equazione (20.25) – che hx | i sia connesso per mezzo di un’integrazione a tutte ˆ è un operatore differenziale. Nel paragrafo le ampiezze hx | i. D’altra parte, sappiamo che H ˆ 16.5, abbiamo già ricavato la connessione tra hx | Hˆ | x 0i e l’operatore algebrico H. Dobbiamo fare una precisazione sui nostri risultati. Abbiamo supposto che l’ampiezza (x) = hx | i sia normalizzata. Con questo s’intende che la scala è stata fissata in modo che ⌅ | (x)| 2 dx = 1 cosicché la probabilità di trovare l’elettrone in un posto qualsiasi sia uguale all’unità. Se si volesse lavorare con una (x) non normalizzata, si dovrebbe scrivere ⇤ ⇤ ˆ (x) dx (x) H (20.29) hEimedio = ⇤ ⇤ (x) (x) dx
Non c’è proprio alcuna differenza. Notate la somiglianza formale tra l’equazione (20.28) e l’equazione (20.18). Questi due modi di scrivere lo stesso risultato s’incontrano spesso quando si lavora nella rappresentazione x. Si può passare dalla prima forma alla seconda con ogni Aˆ che sia un operatore locale, dove un operatore locale è tale che in un integrale del tipo ⌅ hx | Aˆ | x 0i hx 0 | i dx 0 può essere sostituito da Aˆ (x), dove Aˆ è un operatore differenziale algebrico. Tuttavia, ci sono degli operatori per i quali questo non è possibile. Per questi, vanno usate le equazioni fondamentali (20.21) e (20.22). Si può facilmente estendere la nostra trattazione al caso a tre dimensioni. Il risultato è(2) ⌅ ⇤ (r) H ˆ (r) dV hEimedio = (20.30) (1)
L’«operatore» V (x) significa «moltiplicato per V (x)». Scriviamo dV per l’elemento di volume. Esso, naturalmente, è uguale a dx dy dz, e l’integrale si estende da 1 a +1 per tutte e tre le coordinate. (2)
325
326
Capitolo 20 • Operatori
© 978-8808-22107-0
con ˆ = H e dove è sottinteso che
⌅
~2 2 r + V (r) 2m | | 2 dV = 1
(20.31)
(20.32)
Le stesse equazioni possono essere estese a sistemi con più elettroni in maniera del tutto ovvia, ma non staremo ad annoiarvi scrivendo i risultati. Per mezzo dell’equazione (20.30) possiamo calcolare l’energia media di uno stato atomico anche senza conoscere i suoi livelli energetici. Tutto quel che ci serve è la funzione d’onda. Questa è una legge assai importante, e ora ne daremo un’interessante applicazione. Supponiamo di voler trovare l’energia dello stato fondamentale di un certo sistema, per esempio l’atomo di elio, ma che ci riesca difficile risolvere l’equazione di Schrödinger per la funzione d’onda, perché ci sono troppe variabili. Tuttavia, potete sempre cercare d’indovinare quale sia la funzione d’onda – anche prendendo la funzione che vi pare – e calcolare l’energia media. Per far questo, si usa l’equazione (20.29) – generalizzata a tre dimensioni – per trovare quale sarebbe l’energia media se l’atomo si trovasse realmente nello stato descritto da quella funzione d’onda. Questa energia sarà certamente maggiore dell’energia dello stato fondamentale, che è la minima energia che l’atomo può avere(3) . Prendete ora un’altra funzione e calcolate la corrispondente energia media. Se questa è minore di quella ottenuta con la prima scelta, vuol dire che vi siete avvicinati di più all’energia dello stato fondamentale. Se seguitate a provare con tutti i possibili tipi di stati ausiliari, otterrete energie sempre più basse che si avvicinano sempre di più all’energia dello stato fondamentale. Se siete furbi, userete delle funzioni che contengano un piccolo numero di parametri aggiustabili. Anche l’energia risulterà espressa in funzione di questi parametri. Variando i parametri per ottenere la minima energia possibile, esaminerete un’intera classe di funzioni in una volta sola. Alla fine, troverete che è sempre più difficile ottenere energie più basse e allora comincerete a convincervi di essere arrivati molto vicini alla minima energia possibile. Il problema dell’atomo di elio è stato risolto proprio in questo modo, non risolvendo un’equazione differenziale, ma costruendo una funzione particolare con una quantità di parametri aggiustabili che venivano poi scelti in modo tale da dare il minimo valore possibile per l’energia media.
20.4
L’operatore di posizione Qual è il valor medio della posizione di un elettrone in un atomo? Per ogni particolare stato | i, qual è il valore medio della coordinata x? Lavoreremo in una sola dimensione lasciando a voi il compito di estendere queste idee al caso a tre dimensioni o a sistemi con più di una particella. Supponiamo d’avere uno stato descritto da (x), e di eseguire ripetutamente la misura di x. Qual è la media delle misure? È ⌅ xP(x) dx
20.1 Una curva per la densità di probabilità che rappresenta una particella localizzata. FIGURA
(3)
dove P(x) è la probabilità di trovare l’elettrone in un piccolo intervallo dx intorno a x. Supponiamo che la densità di probabilità P(x) vari con x come mostrato in FIGURA 20.1. È più probabile trovare l’elettrone vicino al picco della curva. Il valore medio di x si troverà anch’esso nelle vicinanze del picco. Quest’ultimo, infatti, è proprio il baricentro dell’area delimitata dalla curva.
Lo potete vedere anche così. Ogni funzione (cioè, ogni stato) che si scelga può essere scritta come una combinazione lineare di stati di base, ciascuno con un’energia definita. Poiché, in questa combinazione, si ha un miscuglio di stati d’energia più elevata con lo stato di minima energia, l’energia media sarà più grande di quella dello stato fondamentale.
20.4 • L’operatore di posizione
© 978-8808-22107-0
Abbiamo già visto che P(x) è proprio | (x)| 2 = ⇤ (x) (x), così che la media di x si può scrivere come ⌅ ⇤ (x) x (x) dx hximedio = (20.33) La nostra equazione per hximedio ha la stessa forma dell’equazione (20.28). Nel caso dell’energia ˆ a comparire tra le due , mentre nel caso della posizione media, media, è l’operatore energia H vi compare semplicemente x. (Se volete, potete considerare x come l’operatore algebrico che «moltiplica per x».) Possiamo spingere il parallelismo ancora più oltre, esprimendo la posizione media in una forma corrispondente all’equazione (20.18). Supponiamo di scrivere hximedio = h | ↵i
(20.34)
| ↵i = xˆ | i
(20.35)
con e vediamo se ci riesce di trovare un operatore xˆ che generi lo stato | ↵i, in modo da far concordare tra loro l’equazione (20.34) e l’equazione (20.33). Cioè, noi vogliamo trovare un | ↵i, tale che ⌅ h | ↵i = hximedio = h | xi x hx | i dx (20.36) Dapprima sviluppiamo h | ↵i nella rappresentazione x. Si ha ⌅ h | ↵i = h | xi hx | ↵i dx
(20.37)
Confrontiamo gli integrali nelle ultime due equazioni. Si vede subito che nella rappresentazione x si ha hx | ↵i = x hx | i (20.38) Operare su | i con xˆ per ottenere | ↵i è equivalente a moltiplicare (x) = hx | i per x per ottenere ↵(x) = hx | ↵i. Abbiamo così una definizione di xˆ nella rappresentazione delle coordinate(4) . (Non abbiamo creduto opportuno annoiarvi ricavando la matrice associata all’operatore x nella rappresentazione delle coordinate. Chi di voi è ambizioso può mettersi a dimostrare che hx | xˆ | x 0i = x (x
x 0)
(20.39)
E può anche divertirsi a ricavare che xˆ | xi = x | xi
(20.40)
L’operatore xˆ ha quindi l’interessante proprietà che quando agisce sugli stati di base | xi è equivalente a moltiplicarli per x.) Volete conoscere il valore medio di x 2 ? È ⌅ 2 ⇤ (x)x 2 (x) dx hx imedio = (20.41) Oppure, se preferite, si può scrivere hx 2 imedio = h | ↵ 0i con
| ↵ 0i = xˆ 2 | i
(20.42)
Con xˆ 2 intendiamo xˆ x: ˆ i due operatori vengono fatti agire uno dopo l’altro. Ricorrendo alla seconda forma, si può calcolare hx 2 imedio usando una qualsiasi rappresentazione (cioè, un qualunque insieme di stati di base). A questo punto si comprende facilmente come si possa ottenere il valore medio di x n , o di un qualunque polinomio in x. (4)
L’equazione (20.38) non significa che | ↵i = x | i. Non si può «fattorizzare» hx |, perché il fattore x, davanti a hx | i è un numero diverso per ogni stato hx |. Esso è il valore che la coordinata x dell’elettrone assume nello stato | xi. Vedi l’equazione (20.40).
327
328
Capitolo 20 • Operatori
20.5
© 978-8808-22107-0
L’operatore dell’impulso
Ora calcoleremo l’impulso medio di un elettrone e ancora una volta ci limiteremo a una sola dimensione. Sia P(p) dp la probabilità di ottenere in una misura un valore dell’impulso compreso tra p e p + dp. Allora ⌅ hpimedio =
p P(p) dp
(20.43)
Sia ora hp | i l’ampiezza che lo stato | i si trovi in uno stato | pi di impulso definito. Questa è la stessa ampiezza che abbiamo chiamato, himp p | i nel paragrafo 16.3 ed è una funzione di p quanto hx | i lo è di x. In quell’occasione, avevamo deciso di scegliere la normalizzazione dell’ampiezza di modo che 1 P(p) = |hp | i| 2 (20.44) 2⇡~ Abbiamo allora ⌅ dp hpimedio = h | pi p hp | i (20.45) 2⇡~ Questa forma è del tutto simile a quella che abbiamo trovato per hximedio . Volendo, possiamo ripetere esattamente lo stesso gioco che abbiamo fatto con hximedio . Prima di tutto, possiamo scrivere l’integrale qui sopra come ⌅ dp h | pi hp | i (20.46) 2⇡~ In questa equazione si può ora riconoscere lo sviluppo dell’ampiezza h | i, in funzione degli stati di base di impulso definito. L’equazione (20.45) definisce lo stato | i, nella rappresentazione dell’impulso hp | i = p hp | i (20.47) In altri termini, possiamo ora scrivere hpimedio = h | i
(20.48)
| i = pˆ | i
(20.49)
con dove l’operatore pˆ è definito nella rappresentazione p dall’equazione (20.47). (Ancora una volta, se vi va, potete dimostrare che la forma matriciale di pˆ è hp | pˆ | p0i = p (p
p0)
(20.50)
e che pˆ | pi = p | pi
(20.51)
Il tutto si ricava nello stesso modo come per la x.) A questo punto si pone un problema interessante. Si può scrivere hpimedio come si è fatto nelle equazioni (20.45) e (20.48), e ricordare il significato dell’operatore pˆ nella rappresentazione dell’impulso. Ma come si deve interpretare pˆ nella rappresentazione delle coordinate? Infatti, questo è ciò che occorre sapere quando si vuole calcolare l’impulso medio a partire da una certa funzione d’onda (x). Definiamo meglio il problema. Se si parte da hpimedio nella forma data dall’equazione (20.48), si può sviluppare questa relazione nella rappresentazione p per riottenere l’equazione (20.46). Se è data la descrizione p dello stato, cioè l’ampiezza hp | i, che è una funzione dell’impulso p, possiamo ricavare hp | i dall’equazione (20.47) e passare poi a valutare l’integrale. Il problema ora è questo: cosa dobbiamo fare se abbiamo la descrizione dello stato nella rappresentazione x, cioè la funzione d’onda (x) = hx | i? Ebbene, cominciamo a sviluppare l’equazione (20.48) nella rappresentazione x. Si ha ⌅ hpimedio = h | xi hx | i dx (20.52)
20.5 • L’operatore dell’impulso
© 978-8808-22107-0
Ora, però, ci è necessario conoscere lo stato | i nella rappresentazione x. Se riusciamo in questo, sappiamo anche eseguire l’integrale. Perciò il nostro problema è quello di trovare la funzione (x) = hx | i. Questo si può fare nel modo seguente. Nel paragrafo 16.3 abbiamo visto come si possa collegare hp | i a hx | i. Secondo l’equazione (16.24), ⌅ hp | i = e ipx/~ hx | i dx (20.53) Se hp | i è noto, possiamo risolvere questa equazione per hx | i. Quello che vogliamo è, naturalmente, esprimere il risultato in qualche modo in funzione di (x) = hx | i, che noi supponiamo noto. Partiamo dall’equazione (20.47) e usiamo nuovamente l’equazione (16.24) per scrivere ⌅ hp | i = p hp | i = p e ipx/~ (x) dx (20.54) Poiché l’integrazione si effettua su x si può portare p dentro l’integrale e scrivere ⌅ hp | i = e ipx/~ p (x) dx
(20.55)
Confrontiamo ora quest’ultima con la (20.53). Si direbbe che hx | i è uguale a p (x). No, no! La funzione d’onda hx | i = (x) può dipendere solo da x, non da p. Il problema sta tutto qui. Tuttavia, un astuto individuo osservò che l’integrale nella (20.55) poteva essere fatto per parti. La derivata di e ipx/~ rispetto a x è ( i/~)pe ipx/~ , cosicché l’integrale nella (20.55) è equivalente a ⌅ d ⇣ ipx/~ ⌘ ~ e (x) dx i dx Integrando per parti, si ottiene ⌅ +1 ~ ipx/~ ~ d e (x) + e ipx/~ dx i i dx 1 Finché si ha a che fare con stati legati, (x) va a zero per x = ±1; la quantità tra parentesi è dunque nulla e si ha ⌅ ~ d hp | i = e ipx/~ dx (20.56) i dx Questo è il risultato da confrontare con l’equazione (20.53). Si vede allora che hx | i =
~ d i dx
(x)
(20.57)
A questo punto, abbiamo tutto quanto ci serve per completare l’equazione (20.52). La risposta finale è ⌅ ⇤ (x) ~ d (x) dx hpimedio = (20.58) i dx Abbiamo così trovato la forma che l’equazione (20.48) assume nella rappresentazione delle coordinate. Ora dovrebbe cominciare a delinearsi ai vostri occhi uno schema interessante. Quando abbiamo cercato il valore medio dell’energia nello stato | i, abbiamo trovato che essa era hEimedio = h | i con
| i = Hˆ | i
La stessa cosa, nel mondo delle coordinate, è hEimedio =
⌅
⇤ (x) (x) dx
329
330
Capitolo 20 • Operatori
© 978-8808-22107-0
con
ˆ (x) (x) = H
ˆ è un operatore algebrico che agisce su una funzione di x. Quando abbiamo cercato il Qui H valore medio di x, abbiamo trovato che esso poteva essere anche scritto come hximedio = h | ↵i con | ↵i = xˆ | i Nel mondo delle coordinate, le corrispondenti equazioni sono ⌅ ⇤ (x) ↵(x) dx hximedio = con ↵(x) = x (x) Quando abbiamo cercato il valore medio di p, abbiamo scritto hpimedio = h | i con | i = pˆ | i E, nel mondo delle coordinate, le equazioni equivalenti erano ⌅ ⇤ (x) (x) dx hpimedio = con
~ d (x) i dx In ciascuno di questi tre esempi, siamo partiti dallo stato | i e abbiamo prodotto un altro (ipotetico) stato per mezzo di un operatore quantistico. Nella rappresentazione delle coordinate, abbiamo generato la corrispondente funzione d’onda operando sulla funzione d’onda (x) con un operatore algebrico. Si ha la seguente corrispondenza biunivoca (per i problemi unidimensionali): (x) =
~2 d2 + V (x) 2m dx 2
Hˆ
!
ˆ = H
xˆ
!
x
pˆx
!
~ @ Pˆ x = i @x
(20.59)
In questa lista si è introdotto il simbolo Pˆx per l’operatore algebrico (~/i) @/@ x: ~ @ Pˆ x = i @x
(20.60)
e si è inserito l’indice x a Pˆ per ricordarci che abbiamo considerato solo la componente x dell’impulso. Si possono facilmente estendere questi risultati al caso a tre dimensioni. Per le altre componenti dell’impulso si ha: ~ @ pˆy ! Pˆ y = i @y pˆz
!
~ @ Pˆ z = i @z
20.5 • L’operatore dell’impulso
© 978-8808-22107-0
TABELLA
20.1
Corrispondenza tra operatori quantistici e operatori algebrici.
Grandezza fisica
Operatore
Rappresentazione delle coordinate ~2 2 r + V (r) 2m
ˆ = H
Energia
Hˆ
Posizione
xˆ
x
yˆ
y
zˆ
z
pˆx
~ Pˆ x = i ~ Pˆ y = i
Momento
pˆy
@ @x @ @y
~ @ Pˆ z = i @z
pˆz
Volendo, si può anche pensare a un operatore corrispondente al vettore impulso e scrivere ! ~ @ @ @ ˆ pˆ ! P = ex + ey + ez i @x @y @z dove e x , e y ed ez sono vettori unitari nelle tre direzioni. È ancora più elegante scrivere pˆ
!
ˆ = ~r P i
(20.61)
Il nostro risultato generale è che, almeno per alcuni operatori quantistici, esistono dei corrispondenti operatori algebrici nella rappresentazione delle coordinate. Riassumiamo i nostri risultati – estesi al caso tridimensionale – nella TABELLA 20.1. Per ciascun operatore si hanno due forme equivalenti(5) : | i = Aˆ | i (20.62) oppure
(r) = Aˆ (r)
(20.63)
Illustriamo ora brevemente l’uso di questi concetti. Prima di tutto, vogliamo indicare la relazione ˆ Se usiamo due volte Pˆ x , otteniamo che intercorre tra Pˆ e H. @2 Pˆ x Pˆ x = ~2 2 @x Ciò significa che vale l’uguaglianza ⇣ ⌘ ˆ = 1 Pˆ x Pˆ x + Pˆ y Pˆ y + Pˆ z Pˆ z + V (r) H 2m
o anche, usando la notazione vettoriale,
ˆ = 1 P ˆ ·P ˆ + V (r) H 2m
(20.64)
(5) In molti libri viene usato lo stesso simbolo per A ˆ e Aˆ poiché entrambi si riferiscono alla stessa situazione fisica, e perché è conveniente non dover scrivere tipi di lettere diversi. Di solito, si può capire dal contesto di quale si tratta.
331
332
Capitolo 20 • Operatori
© 978-8808-22107-0
(In un operatore algebrico, qualunque termine senza il simbolo di operatore (ˆ) indica solamente la semplice moltiplicazione.) Questa equazione ha il pregio che se uno sa la fisica classica, se la ricorda facilmente. Tutti sanno che (non relativisticamente) l’energia è data semplicemente dalla ˆ è l’operatore di energia totale. somma dell’energia cinetica p2 /2m e dell’energia potenziale, e H Questo risultato ha impressionato tanto i docenti da spingerli a insegnare agli studenti tutta la fisica classica prima della meccanica quantistica. (Ma noi la pensiamo diversamente!) Tuttavia, questi parallelismi sono spesso pericolosi. Per dirne una, quando si hanno degli operatori, l’ordine dei vari fattori è importante; ciò che non è vero per i fattori di un’equazione classica. Nel capitolo 17 abbiamo definito un operatore pˆx con riferimento all’operatore di traslazione Dˆ x (vedi l’equazione (17.27)): ! i 0 | i = Dˆ x ( ) | i = 1 + pˆx | i (20.65) ~ dove è un piccolo spostamento. Vi dimostreremo ora che questo operatore è del tutto equivalente alla nostra nuova definizione. Secondo quello che abbiamo appena detto, questa equazione dovrebbe essere identica a @ 0 (x) = (x) + @x Ma il primo membro è semplicemente lo sviluppo di Taylor di (x + ), che è proprio ciò che si ottiene operando una traslazione sullo stato verso sinistra della quantità (oppure spostando verso destra le coordinate della stessa quantità). Perciò le nostre due definizioni di pˆ vanno perfettamente d’accordo! Serviamoci di questi fatti per ottenere degli altri risultati. Supponiamo d’avere un gruppo di particelle, che numeriamo 1, 2, 3, ..., facenti parte di un qualche sistema complesso. (Per mantenere le cose abbastanza semplici, ci limiteremo a una sola dimensione.) La funzione d’onda che descrive lo stato è una funzione di tutte le coordinate x 1, x 2, x 3, ... Possiamo scriverla come (x 1, x 2, x 3, ...). Ora trasliamo il sistema (a sinistra) di . La nuova funzione d’onda 0
(x 1, x 2, x 3, ...) = (x 1 + , x 2 + , x 3 + , ...)
può essere scritta come 0
8 > @ (x 1, x 2, x 3, ...) = (x 1, x 2, x 3, ...) + < > @x + 1 :
@ + @ x2
9 > @ + ... = > @ x3 ;
(20.66)
Secondo l’equazione (20.65) l’operatore dell’impulso dello stato | i (che chiameremo impulso totale) è uguale a 9 > @ > ~8 @ @ = Pˆ totale = < + + + ... > i > @ x1 @ x2 @ x3 : ; Ma ciò equivale a dire che Pˆ totale = Pˆ x1 + Pˆ x2 + Pˆ x3 + ... (20.67) Gli operatori dell’impulso obbediscono alla regola che l’impulso totale è la somma degli impulsi delle varie parti. Tutto si accorda perfettamente, e le varie cose che abbiamo detto sono coerenti internamente.
20.6
Il momento angolare
Tanto per impratichirci nel gioco, consideriamo un altro operatore, l’operatore momento angolare orbitale. Nel capitolo 17 avevamo definito un operatore Jˆz per mezzo di Rˆz ( ), l’operatore associato a una rotazione di un angolo intorno all’asse z. Consideriamo ora un sistema descritto semplicemente da una singola funzione d’onda (r), funzione delle coordinate soltanto, e che
333
20.6 • Il momento angolare
© 978-8808-22107-0
non tenga conto del fatto che l’elettrone può avere lo spin diretto verso l’alto o verso il basso. Cioè, per il momento, vogliamo trascurare il momento angolare intrinseco e ragionare soltanto sulla parte orbitale. Per rendere chiara questa distinzione, chiameremo l’operatore di momento orbitale Lˆ z , e lo definiremo per mezzo dell’operatore di rotazione di un angolo infinitesimo ✏ come ! i Rˆz (✏) | i = 1 + ✏ Lˆ z | i ~ (Si badi che questa definizione si applica solo a uno stato | i che non ha spin intrinseco, ma dipende solo dalle coordinate r = x, y, z.) Se guardiamo lo stato | i da un nuovo sistema di coordinate, ruotato del piccolo angolo attorno all’asse z rispetto al precedente, esso ci appare come un nuovo stato | 0i = Rˆz (✏) | i
Se decidiamo di descrivere lo stato | i nella rappresentazione delle coordinate, cioè per mezzo della sua funzione d’onda (r), ci aspettiamo di poter scrivere ! i ˆ 0 (r) = 1 + ✏ L (r) (20.68) z ~ ˆ Ebbene, un punto P che si trovi in x e y nel nuovo sistema di Cos’è L? coordinate (in effetti, sarebbe in x 0 e y 0, ma noi sopprimeremo gli apici) si trovava prima in x ✏ y e y + ✏ x, come si può vedere dalla FIGURA 20.2. Poiché per l’elettrone l’ampiezza di trovarsi in P non è cambiata per effetto della rotazione del sistema di coordinate, possiamo scrivere 0
(x, y, z) = (x
✏ y, y + ✏ x, z) = (x, y, z)
✏y
y'
y P
@ @ + ✏x @x @y
(ricordando che ✏ è un angolo piccolo). Ciò significa che ! ~ @ @ ˆ Lz = x y i @y @x
x'
(20.69) x
E questa è la nostra risposta. Ma attenzione! Ciò è equivalente a ˆ z = x Pˆ y L
y Pˆ x
(20.70)
20.2 Rotazione degli assi intorno all’asse z di un piccolo angolo ε. FIGURA
Tornando ora ai nostri operatori quantistici, possiamo scrivere Lˆ z = x Pˆy
y Pˆx
(20.71)
Questa formula si ricorda facilmente perché assomiglia molto alla formula familiare della meccanica classica; infatti, non è altro che la componente z di L=r⇥p
(20.72)
Una delle cose più piacevoli di tutto questo affare di operatori è che molte equazioni classiche possono essere trasferite direttamente in una forma quantistica. Quali sono quelle con cui ciò non è possibile? Ce ne saranno bene alcune che non vanno come si deve, perché se ciò non fosse, non ci sarebbe niente di nuovo nella meccanica quantistica. Non ci sarebbe nulla di fisicamente nuovo. Eccovi un’equazione che si presenta in modo diverso. In fisica classica xpx
px x = 0
xˆ pˆx
pˆx xˆ =?
Cosa diventa in meccanica quantistica?
334
Capitolo 20 • Operatori
© 978-8808-22107-0
Andiamo a calcolarci questa espressione nella rappresentazione x. Per aver chiaro quello che stiamo facendo, introduciamo una certa funzione d’onda (x). Abbiamo allora x Pˆ x (x)
Pˆ x x (x)
cioè
~ @ ~ @ (x) x (x) i @x i @x Ricordatevi ora che le derivate operano su tutto ciò che si trova alla loro destra. Si ottiene allora x
x
~ @ i @x
~ @ x = i @x
~ (x) i
~ (x) i
(20.73)
Il risultato non è zero. L’intera operazione è equivalente alla semplice moltiplicazione per ~/i: xˆ pˆx
pˆx xˆ =
~ i
(20.74)
Se la costante di Planck fosse zero, i risultati classici e quantistici sarebbero gli stessi, e non ci sarebbe alcun bisogno d’imparare la meccanica quantistica! ˆ così: Incidentalmente, se, combinando due operatori qualunque Aˆ e B, Aˆ Bˆ
Bˆ Aˆ
non si ottiene zero, si dice che «gli operatori non commutano». E un’equazione del tipo della (20.74) si chiama «regola di commutazione». Potete verificare che la regola di commutazione per px e y è pˆx yˆ yˆ pˆx = 0 Vi è un’altra regola di commutazione importantissima che è connessa con i momenti angolari, cioè Lˆ x Lˆ y Lˆ y Lˆ x = i~ Lˆ z (20.75) Dimostrandola per conto vostro, vi farete una certa pratica nell’uso degli operatori xˆ e p. ˆ È interessante notare che anche in fisica classica s’incontrano operatori che non commutano tra loro. Ci siamo già trovati in questa situazione quando abbiamo trattato le rotazioni spaziali. Se ruotate qualcosa, per esempio un libro, di 90° intorno a x e poi di altri 90° intorno a y, ottenete un risultato differente che non ruotandolo dapprima di 90° intorno a y e poi di 90° intorno a x. In realtà, è proprio a questa proprietà dello spazio che è dovuta l’equazione (20.75).
20.7
Variazione dei valori medi con il tempo
Passiamo ora a dimostrarvi ancora qualcos’altro. Come variano con il tempo i valori medi? ˆ che non dipenda dal tempo in modo Supponiamo per il momento d’avere un operatore A, esplicito. Ci riferiamo a un operatore come xˆ o p. ˆ (Escludiamo cioè delle grandezze come, per esempio, l’operatore relativo a un qualche potenziale esterno che possa variare col tempo come V (x, t).) Supponiamo di calcolare hAimedio in un certo stato | i, cioè hAimedio = h | Aˆ | i
(20.76)
Come dipenderà hAimedio dal tempo? E perché ne deve dipendere? Una possibile ragione potrebbe essere che l’operatore dipende esso stesso dal tempo esplicitamente, per esempio se si tratta di qualcosa connessa con un potenziale dipendente dal tempo come V (x, t). Ma anche se l’operatore non dipende da t, come, per esempio, l’operatore Aˆ = x, ˆ la sua media può dipendere dal tempo. Certamente, la posizione media di una particella può essere qualcosa che varia. Ma come può una tale variazione risultare da un’equazione come la (20.76) se Aˆ non dipende dal tempo? Ebbene, può essere lo stato | i quello che cambia col tempo. Per stati non stazionari, abbiamo spesso
20.7 • Variazione dei valori medi con il tempo
© 978-8808-22107-0
reso esplicita la dipendenza temporale, scrivendo lo stato nella forma | (t)i. Dimostreremo ora ˆ˙ Ricordate che Aˆ è un che la derivata di hAimedio è data da un nuovo operatore che chiameremo A. operatore, cosicché il mettere un punto sulla A non significa più farne la derivata temporale, ma è semplicemente un modo di scrivere un nuovo operatore Aˆ˙ che è definito da d hAimedio = h | Aˆ˙ | i dt
(20.77)
ˆ˙ Il nostro problema è quello di trovare l’operatore A. Prima di tutto, sappiamo che la variazione di uno stato con il tempo è determinata dall’hamiltoniana. Precisamente, d i~ | (t)i = Hˆ | (t)i (20.78) dt Questo è semplicemente un modo astratto di scrivere la nostra definizione originale di hamiltoniana: dCi X i~ = Hi j C j (20.79) dt j La complessa coniugata della precedente equazione è equivalente a i~
d h (t) | = h (t) | Hˆ dt
(20.80)
Guardate ora quel che succede prendendo la derivata rispetto a t dell’equazione (20.76). Poiché ciascuno stato dipende da t, si ha ! ! d d d ˆ ˆ hAimedio = h | A| i+h | A | i (20.81) dt dt dt Infine, facendo uso delle due equazioni (20.78) e (20.80) per esprimere le derivate, si ottiene d i ⇣ hAimedio = h | Hˆ Aˆ | i dt ~
h | Aˆ Hˆ | i
Quest’ultima equazione può essere anche scritta nella forma d i hAimedio = h | Hˆ Aˆ dt ~
⌘
Aˆ Hˆ | i
Se si confronta quest’ultima equazione con la (20.77), si vede che i ⇣ˆ ˆ Aˆ˙ = HA ~
Aˆ Hˆ
⌘
(20.82)
ˆ Questa nostra interessante proposizione è valida per qualsiasi operatore A. Incidentalmente, se l’operatore Aˆ dipendesse esso stesso dal tempo, si otterrebbe i ⇣ˆ ˆ Aˆ˙ = HA ~
⌘ @ Aˆ Aˆ Hˆ + @t
(20.83)
Controlliamo l’equazione (20.82) su qualche esempio per vedere se, in pratica, dà risultati sensati. Per esempio, che operatore corrisponde a xˆ˙ ? Dovrebbe essere i ⇣ˆ xˆ˙ = H xˆ ~
xˆ Hˆ
⌘
(20.84)
Ma che roba è questa? Un modo per capirlo è di passare nella rappresentazione delle coordinate ˆ In questa rappresentazione, il commutatore è usando l’operatore algebrico che corrisponde a H. ˆ Hx
8 ~2 d2 9 > ˆ => < = xH > 2m dx 2 + V (x) > x : ;
8 9 > ~2 d2 > = x< > 2m dx 2 + V (x) > : ;
335
336
Capitolo 20 • Operatori
© 978-8808-22107-0
Operando con questo su una qualsiasi funzione d’onda (x) e facendo tutte le derivate, dove questo è possibile, dopo un po’ di lavoro, si finisce per trovare ~2 d m dx Ma ciò non è altro che i cosicché si trova infine che Hˆ xˆ
~ ˆ Px m
~ xˆ Hˆ = i pˆx m
(20.85)
ossia che
pˆx xˆ˙ = (20.86) m Questo è proprio un bel risultato. Ci dice che se il valore medio di x cambia col tempo, la velocità del baricentro altro non è che l’impulso medio diviso per m. Esattamente come in meccanica classica. Vediamo un altro esempio. Qual è la variazione col tempo dell’impulso medio di uno stato? Stesso gioco. L’operatore corrispondente è i ⇣ˆ pˆ˙ = H pˆ ~
pˆ Hˆ
⌘
(20.87)
Di nuovo facciamoci i conti nella rappresentazione x. Ricordate che pˆ diviene d/dx, e questo ˆ ma solo nel significa che dovrete fare la derivata dell’energia potenziale V (contenuta in H), secondo termine. Ne risulta che questo è il solo termine che non si elide, e si trova che ˆ Pˆ H
ˆ = i~ dV Pˆ H dx
ossia che
dV (20.88) dx Di nuovo il risultato classico. Il secondo membro è la forza, cosicché abbiamo ricavato la legge di Newton! Ma ricordate, queste sono leggi per gli operatori, che danno quantità medie. Non descrivono affatto quel che succede in dettaglio nell’interno di un atomo. La caratteristica essenziale della meccanica quantistica è che pˆ xˆ non è uguale a xˆ p. ˆ Essi differiscono di poco, del piccolo numero i~. Ma tutte le fantastiche complicazioni di interferenze, onde e tutto il resto, derivano dal semplice fatto che xˆ pˆ pˆ xˆ non è esattamente zero. Anche la storia di quest’idea è interessante. Entro un periodo di pochi mesi nel 1926, Heisenberg e Schrödinger trovarono indipendentemente delle leggi corrette per descrivere la meccanica atomica. Schrödinger inventò la sua funzione d’onda (x) e trovò la sua equazione. Heisenberg, d’altra parte, trovò che la natura poteva essere descritta con equazioni classiche, eccetto che xp px doveva essere uguale a i~, e questo poteva essere realizzato definendo queste grandezze per mezzo di particolari matrici. Nel linguaggio d’oggi, Heisenberg faceva uso della rappresentazione dell’energia, con le matrici corrispondenti. Sia l’algebra delle matrici di Heisenberg sia l’equazione differenziale di Schrödinger riuscivano a spiegare l’atomo di idrogeno. Pochi mesi più tardi, Schrödinger riuscì a dimostrare che le due teorie erano equivalenti, come noi abbiamo visto. Tuttavia, queste due differenti formulazioni matematiche della meccanica quantistica furono scoperte indipendentemente. pˆ˙ =
L’equazione di Schrödinger in un ambito classico: un seminario sulla superconduttività 21.1
L’equazione di Schrödinger in presenza di un campo magnetico
Questa è una lezione fatta un po’ per divertimento. Vorrei provare a fare una lezione in uno stile differente dal solito, tanto per vedere come riesce. Perciò essa non fa parte del corso, nel senso che non è concepita come uno sforzo per insegnarvi qualcosa di nuovo all’ultimo minuto. Piuttosto mi comporterò come se stessi facendo un seminario o una relazione di ricerca su questo argomento a un uditorio più preparato, cioè a gente che già conosce la meccanica quantistica. La principale differenza tra un seminario e una normale lezione è che se si tiene un seminario non si sviluppano tutti i ragionamenti punto per punto e non si eseguono tutti i calcoli. Si dice: «Se fate così e così, ecco che cosa vien fuori», e non si stanno a mostrare tutti i dettagli. Così, in questa lezione, io descriverò con precisione le idee, ma vi darò solo i risultati dei calcoli. Tenete presente che nessuno pensa che voi capiate tutto immediatamente, ma piuttosto che crediate (più o meno) che quel che dico salterebbe fuori facendo passo passo tutto quel che si deve fare. A parte tutto ciò, questo è un argomento di cui voglio parlare. È nuovo e moderno e sarebbe perfettamente legittimo trattarlo durante un seminario di ricerca. Ciò di cui parlerò è l’equazione di Schrödinger in un contesto classico, cioè nel caso della superconduttività. Normalmente la funzione d’onda che appare nell’equazione di Schrödinger si riferisce soltanto a una o due particelle. E la funzione d’onda stessa non è qualcosa che abbia un significato classico, a differenza del campo elettrico, o del potenziale vettore, o altre cose del genere. La funzione d’onda per una particella singola è un «campo» – nel senso che è una funzione della posizione – ma, in generale, non ha alcun significato classico. Vi sono, ciononostante, alcune situazioni in cui la funzione d’onda della meccanica quantistica ha un significato classico, e sono proprio queste che voglio considerare. Il particolare comportamento quantistico della materia su piccola scala non si fa abitualmente sentire su scala macroscopica, a parte che nel produrre nella maniera standard le leggi di Newton, cioè le leggi della cosiddetta meccanica classica. Vi sono però dei casi in cui le peculiarità della meccanica quantistica si rivelano in una maniera particolare anche su grande scala. A bassa temperatura, quando l’energia di un sistema è divenuta molto, molto piccola, invece d’avere un gran numero di stati interessati, se ne hanno solo pochissimi; pochi stati, tutti prossimi allo stato fondamentale. In queste circostanze, il carattere quantistico dello stato fondamentale può rivelarsi su scala macroscopica. Lo scopo di questa lezione è mostrare una connessione tra meccanica quantistica ed effetti su larga scala: badate, non si tratta della solita discussione del modo in cui la meccanica quantistica riproduce in media quella newtoniana, ma invece viene considerata una particolare situazione in cui la meccanica quantistica produce i suoi caratteristici effetti su scala grande o «macroscopica». Comincerò col ricordarvi alcune proprietà dell’equazione di Schrödinger(1) . Mi propongo di descrivere il comportamento di una particella in un campo magnetico usando l’equazione di (1) In realtà, non è vero che ve le ricordo, perché alcune di queste equazioni non ve le ho mai fatte vedere prima; ricordatevi però dello spirito con cui è condotto questo seminario.
21
338
21.1 L’ampiezza corrispondente allo spostamento da a a b lungo il cammino Γ è proporzionale a ⇤b ⇥ ⇤ exp (iq/h) a A · ds . FIGURA
Capitolo 21 • L’equazione di Schrödinger in un ambito classico: un seminario sulla superconduttività
© 978-8808-22107-0
Schrödinger, questo perché i fenomeni superconduttivi sono connessi ai campi magnetici. Un campo magnetico esterno è descritto da un potenziale vettore e il problema è il seguente: quali sono le leggi della meccanica quantistica in presenza di un potenziale vettore? Il principio che descrive il comportamento quantistico in presenza di un potenziale vettore è assai semplice. L’ampiezza relativa a una particella che si sposta da un punto a un altro lungo un certo cammino, in presenza di un campo, è uguale a quella relativa allo spostamento lungo lo stesso cammino, in assenza di campo, moltiplicata per l’esponenziale dell’integrale di linea del potenziale vettore, moltiplicata ancora per la carica elettrica e divisa per la costante di Planck(2) (FIGURA 21.1): 26 ⌅ b 37 iq A · ds 77 hb | aiin A = hb | ai A=0 · exp 66 64 ~ a 75
(21.1)
È questa un’enunciazione fondamentale della meccanica quantistica. Infatti, senza il potenziale vettore, l’equazione di Schrödinger di una particella carica (non relativistica, e senza spin) è ! ! ~ @ 1 ~ ~ ˆ =H = r r +q (21.2) i @t 2m i i dove è il potenziale elettrico, cosicché q è l’energia potenziale(3) . L’equazione (21.1) è equivalente all’affermazione che in presenza di campo magnetico i gradienti che compaiono nell’hamiltoniana vengono sempre sostituiti da gradiente meno q A, così che ora l’equazione (21.2) diviene ! ! ~ @ 1 ~ ~ ˆ =H = r qA r qA +q (21.3) i @t 2m i i
Questa è l’equazione di Schrödinger per una particella non relativistica e senza spin di carica q che si muove in un campo elettromagnetico A, . Per dimostrare che questo è vero, preferisco ricorrere a un esempio semplice in cui, invece di un sistema continuo, si ha una linea di atomi disposti lungo l’asse x, spaziati di un intervallo b e si indica con K l’ampiezza corrispondente al salto di un elettrone da un atomo a un altro in assenza di campo(4) . Ora, secondo l’equazione (21.1), se c’è un potenziale vettore nella direzione x, Ax (x, t), l’ampiezza di transizione risulterà diversa dalla precedente per un fattore exp[(iq/~)Ax b], dove l’esponente è iq/~ volte l’integrale del potenziale vettore esteso da un atomo a quello vicino. Per semplicità, scriveremo (q/~)Ax ⌘ f (x), poiché Ax , in generale, dipenderà da x. Indicando con C(x) ⌘ Cn l’ampiezza di probabilità di trovare l’elettrone sull’atomo «n» situato in x, la derivata di tale ampiezza è data dalla seguente equazione: ~ @ C(x) = E0 C(x) i @t
Ke
ib f (x+b/2)
C(x + b)
K e+ib f (x
b/2)
C(x
b)
(21.4)
Vi sono tre termini. Anzitutto vi è una certa energia E0 che corrisponde alla situazione in cui l’elettrone si trova in x. Come al solito, ciò dà il termine E0 C(x). Poi c’è il termine KC(x + b), che è l’ampiezza corrispondente a un salto indietro di un passo dell’elettrone, a partire dall’atomo «n + 1», situato in x + b. Tuttavia, se questa transizione avviene in presenza di un potenziale vettore, la fase dell’ampiezza deve essere variata, secondo la regola data dall’equazione (21.1). Se Ax non cambia apprezzabilmente nell’intervallo che corrisponde alla spaziatura degli atomi, l’integrale si può semplicemente scrivere come il valore di Ax nel punto medio, moltiplicato per l’intervallo b. Cosicché iq/~ per l’integrale è proprio ib f (x + b/2). Poiché l’elettrone ha compiuto un salto all’indietro, ho scritto questa fase con un segno meno. E così si ottiene il secondo termine. Allo stesso modo vi è una certa ampiezza per compiere un salto dall’altra parte, ma questa volta abbiamo bisogno del potenziale vettore a una distanza b/2 nell’altro senso di x, moltiplicato per la (2)
Paragrafo 15.5 del vol. 2. Da non confondersi con il precedente uso di per indicare uno stato! (4) K è la stessa grandezza che era stata chiamata A nel problema del reticolo lineare senza campo magnetico (vedi capitolo 13). (3)
21.2 • L’equazione di continuità per le probabilità
© 978-8808-22107-0
distanza b. E questo ci dà il terzo termine. La somma dei tre fornisce l’equazione per l’ampiezza in x, in presenza di un potenziale vettore. Noi sappiamo che la funzione C(x) è abbastanza regolare (immaginiamo di considerare il limite per grandi lunghezze d’onda), e, se pensiamo di far avvicinare gli atomi tra loro, l’equazione (21.4) tenderà a rappresentare il comportamento di un elettrone libero. Quindi, il passo successivo consiste nello sviluppare entrambi i membri della (21.4) in potenze di b, supponendo che b sia molto piccolo. Per esempio, se b è zero, il secondo membro è semplicemente (E0 2K)C(x), cosicché, con l’approssimazione zero, l’energia è E0 2K. Dopo verrebbero termini di ordine b. Ma, poiché i due esponenziali hanno segni opposti, sopravvivono solo potenze pari di b. Perciò, se si fa uno sviluppo di Taylor di C(x), di f (x) e degli esponenziali, e si mette in evidenza b2 , si trova ~ @C(x) = E0 C(x) 2KC(x) + i @t (21.5) f g 2 00 0 0 2 K b C (x) 2i f (x)C (x) i f (x)C(x) f (x)C(x)
(Gli «apici» indicano la differenziazione rispetto a x.) Questa orribile combinazione di pezzi si presenta assai complicata. Tuttavia, matematicamente, essa è esattamente la stessa di " #" # ~ @C(x) @ @ 2 = (E0 2K) C(x) K b i f (x) i f (x) C(x) (21.6) i @t @x @x
La seconda parentesi che opera su C(x) dà luogo a C 0(x) più i f (x)C(x). La prima parentesi, operando su questi ultimi due termini dà luogo a un termine C 00 e ad altri termini nelle derivate prime di f (x) e di C(x). Ricordate ora che le soluzioni per campo magnetico nullo(5) rappresentano una particella con una massa effettiva meff data da K b2 =
~2 2meff
Se ponete perciò E0 = 2K, e sostituite nuovamente f (x) = (q/~)Ax , potete facilmente controllare che l’equazione (21.6) è identica alla prima parte dell’equazione (21.3). (L’origine del termine che contiene l’energia potenziale è ben nota, così non mi sono preoccupato di includerlo in questa discussione.) Quindi la proposizione dell’equazione (21.1), che la presenza di un potenziale vettore altera tutte le ampiezze per un fattore esponenziale, è equivalente alla regola che l’operatore dell’impulso, (~/i)r, viene sostituito da ~ r i
qA
come si vede nell’equazione di Schrödinger (21.3).
21.2
L’equazione di continuità per le probabilità
Passo ora a un secondo punto. Un concetto importante nell’equazione di Schrödinger per una particella singola è l’idea che la probabilità di trovare la particella in una certa posizione è data dal modulo quadrato della funzione d’onda. Ed è caratteristico della meccanica quantistica che la probabilità sia conservata in senso locale. Quando la probabilità di trovare un elettrone diminuisce in qualche posto, mentre al tempo stesso essa cresce in un posto diverso (sempre mantenendo inalterata la probabilità totale), vuol dire che qualcosa si trasferisce da un posto all’altro. In altre parole, l’elettrone gode di una specie di continuità, nel senso che, se la probabilità diminuisce in un posto e aumenta da qualche altra parte, allora vi è un qualche flusso tra i due punti. Se, per esempio, (5)
Paragrafo 13.3.
339
340
Capitolo 21 • L’equazione di Schrödinger in un ambito classico: un seminario sulla superconduttività
© 978-8808-22107-0
s’interpone una parete tra i due, la sua influenza si farà sentire e le probabilità non rimarranno le stesse. Quindi la conservazione della probabilità da sola non è un’enunciazione completa della legge di conservazione, così come la sola conservazione dell’energia non è un principio tanto profondo e importante come la conservazione locale dell’energia(6) . Se dell’energia scompare, vi deve corrispondere un flusso di energia. Allo stesso modo, noi vorremmo trovare una «corrente» di probabilità tale che, se c’è un qualche cambiamento di densità di probabilità (cioè della probabilità di posizione per unità di volume), questo possa essere considerato come dovuto al flusso entrante o uscente di una qualche corrente. Questa corrente poi dovrebbe essere un vettore da interpretarsi come segue. La componente x darebbe la probabilità totale per secondo e per unità di superficie che una particella passi nella direzione x attraverso un piano parallelo al piano y-z. Il passaggio nel senso +x è considerato flusso positivo, quello in senso opposto, flusso negativo. Esiste una tale corrente? Bene, voi sapete che la densità di probabilità P(r, t) è espressa attraverso la funzione d’onda da P(r, t) = ⇤ (r, t) (r, t)
(21.7)
Consideriamo una corrente J tale che @P = r·J @t
(21.8)
Io ora chiedo: «Esiste una tale corrente?» Se eseguo la derivata temporale dell’equazione (21.7), ottengo due termini: @P @ @ ⇤ = ⇤ + (21.9) @t @t @t Usiamo ora l’equazione di Schrödinger – equazione (21.3) – per @ /@t; prendiamone la complessa coniugata per ottenere @ ⇤ /@t, con tutte le i cambiate di segno. Si ha così @P = @t
i ~
26 66 ⇤ 1 ~ r 64 2m i 1 2m
~ r i
qA
qA
!
!
~ r i ~ r i
qA
!
+q
!
⇤
qA
⇤
+ 3 ⇤ 77 77 5
q
(21.10)
I termini nel potenziale e un sacco di altra roba se ne vanno. E si vede che quello che resta lo si può proprio mettere sotto forma di una divergenza. Perciò tutta l’equazione è equivalente a 26 @P 1 ⇤ ~ = r · 66 r @t i 64 2m
qA
!
1 + 2m
~ r i
qA
!
3 ⇤ 77 77 5
(21.11)
Questa formula non è poi così complicata come sembra. È una combinazione simmetrica di ⇤ moltiplicato per un certo operatore su , più per l’operatore complesso coniugato su ⇤ . Si tratta quindi di una certa quantità più la sua complessa coniugata, cosicché il tutto risulta reale, come doveva essere. Per ricordare questo operatore, basta tener presente che è semplicemente l’operatore impulso P meno q A. Perciò potrei scrivere la corrente nell’equazione (21.8) come 1 J= 2
26 ˆ 37 8 > > < ⇤ 66 P q A 77 > > 6 m 7 5 : 4
+
26 ˆ 37 ⇤ 9 > P q A 66 77 ⇤ > = > > 64 m 75 ;
(21.12)
Esiste quindi una corrente J che completa l’equazione (21.8). L’equazione (21.11) dimostra che la probabilità è conservata localmente. Se una particella sparisce da una certa regione, essa non può apparire in un’altra senza che qualcosa passi dall’una all’altra. Supponiamo che la prima regione sia circondata da una superficie chiusa abbastanza (6)
Paragrafo 27.1 del vol. 2.
341
21.3 • Due tipi d’impulso
© 978-8808-22107-0
lontana da render nulla la probabilità di trovare l’elettrone sulla superficie. La probabilità totale di trovare l’elettrone in un posto qualsiasi all’interno della superficie è data dall’integrale di volume di P. Ma, per il teorema di Gauss, l’integrale di volume della divergenza di J, è uguale all’integrale di superficie di J. Se è zero alla superficie, l’equazione (21.12) ci dice che J è zero, cosicché la probabilità totale di trovare la particella all’interno non cambia nel tempo. Soltanto se una probabilità non nulla si avvicina al contorno, una parte di essa può sfuggirne al di fuori. Possiamo dire che essa può uscire solo attraversando la superficie, e questo è ciò che s’intende per conservazione locale.
21.3
Due tipi d’impulso
L’equazione per la corrente è piuttosto interessante e talvolta desta un po’ di preoccupazione. Si potrebbe pensare alla corrente come qualcosa tipo la densità di particelle per la velocità. La densità ⇤ , e fin qui va tutto bene. E ciascun termine dell’equazione dovrebbe essere qualcosa come (21.12) si presenta nella forma tipica del valore di aspettazione dell’operatore ˆ P
qA m
(21.13)
cosicché si potrebbe pensare che quest’ultimo rappresenti la velocità di flusso. Sembrerebbe quindi d’avere due possibili relazioni tra velocità e impulso, perché, naturalmente, si potrebbe ˆ anche pensare che l’impulso, diviso per la massa, P/m, sia ancora una velocità. Queste due possibili forme differiscono tra loro per il potenziale vettore. Si dà il caso che queste due possibilità fossero state scoperte anche in fisica classica, dove appunto si era trovato che l’impulso poteva essere definito in due modi(7) . Uno di essi è detto «impulso cinematico», ma per essere assolutamente chiaro in questa lezione, io lo chiamerò «impulso mv ». Questo impulso si ottiene moltiplicando la massa per la velocità. L’altro è un impulso più matematico, più astratto, e talvolta viene chiamato «impulso dinamico», e io lo chiamerò «impulso p». Le due possibilità sono: impulso mv = mv
(21.14)
impulso p = mv + q A
(21.15)
B
I
E q
In meccanica quantistica e in presenza di campi magnetici risulta che è ˆ cosicché ne l’impulso p a essere connesso con l’operatore gradiente P, segue che la (21.13) è l’operatore di velocità. Vorrei fare una breve digressione per mostrarvi come questo avviene, cioè perché in meccanica quantistica ci debba essere qualcosa come l’equazione (21.15). La funzione d’onda cambia col tempo secondo l’equazione I di Schrödinger, equazione (21.3). Se io cambiassi bruscamente il potenziale vettore, al primo istante la funzione d’onda non cambierebbe; cambierebbe solo la sua derivata. Pensate ora a quel che accadrebbe nella seguente circoB stanza. Supponete d’avere un lungo solenoide, in cui si possa produrre un flusso del campo magnetico (il campo B), come mostrato in FIGURA 21.2, e che vi sia una particella carica nelle vicinanze. Supponete che questo flusso FIGURA 21.2 Il campo elettrico all’esterno di venga portato istantaneamente dal valore zero a un certo valore finito. Cioè, un solenoide percorso da una corrente crescente. io parto con un potenziale vettore nullo e poi innesco un potenziale vettore. Quindi io produco improvvisamente un potenziale vettore A lungo delle circonferenze attorno al solenoide. Voi certamente ricorderete che l’integrale di linea di A lungo un circuito chiuso è (7)
Si veda, per esempio, J.D. Jackson, Classical Electrodynamics, John Wiley and Sons, Inc., New York (1962), p. 408.
342
Capitolo 21 • L’equazione di Schrödinger in un ambito classico: un seminario sulla superconduttività
© 978-8808-22107-0
pari al flusso di B attraverso il circuito(8) . Ora, cosa succede se io accendo improvvisamente un potenziale vettore? Secondo le equazioni quantistiche, un brusco cambiamento di A non produce un brusco cambiamento di ; la funzione d’onda rimane la stessa. E così fa anche il gradiente. Ma ricordate quali sono gli effetti elettrici quando si ha una brusca variazione di flusso. Durante il breve tempo in cui il flusso aumenta, si genera un campo elettrico il cui integrale di linea è pari alla variazione del flusso col tempo: E=
@A @t
(21.16)
Se il flusso varia rapidamente, questo campo elettrico è enorme, e produce una forza sulla particella. La forza è uguale alla carica moltiplicata per il campo elettrico, e così, durante il tempo in cui si stabilisce il flusso, la particella riceve un impulso totale (cioè, un cambiamento di mv) pari a q A. In altre parole, se voi accendete bruscamente un potenziale vettore nel punto occupato da una carica, questa carica si prende immediatamente un impulso «mv» uguale a q A. Ma c’è qualcosa che non cambia immediatamente ed è la differenza tra mv e q A. Così la somma p = mv + q A è qualcosa che non varia quando si fa un brusco cambiamento nel potenziale vettore. Questa quantità p è quella che abbiamo chiamato l’impulso p e ha una certa importanza in dinamica classica, ma ha anche un significato diretto in meccanica quantistica. Essa dipende dal carattere della funzione d’onda, ed è quella che deve essere identificata con l’operatore ˆ = ~r P i
21.4
Il significato della funzione d’onda
Quando Schrödinger per primo scoprì la sua equazione, egli scoprì anche la legge di conservazione dell’equazione (21.8), come una conseguenza dell’equazione stessa. Ma, non correttamente, egli immaginò che P fosse la densità di carica dell’elettrone e che J fosse la densità di corrente, e quindi che gli elettroni interagissero col campo elettromagnetico tramite queste cariche e correnti. Quando poi risolse la sua equazione per l’atomo di idrogeno e calcolò , egli non intendeva calcolare nessun tipo di probabilità: a quel tempo non si parlava di ampiezze e l’interpretazione era completamente differente. Il nucleo atomico era supposto stazionario ma vi erano delle correnti che gli circolavano attorno; le cariche P e le correnti J avrebbero dovuto generare i campi elettromagnetici e il tutto avrebbe irradiato della luce. Nel far ciò, egli s’imbatté subito in un certo numero di problemi che non riuscì a risolvere in modo del tutto soddisfacente. Fu a questo punto che Born portò un contributo essenziale alle nostre idee concernenti la meccanica quantistica. Fu infatti Born che (per quanto è a nostra conoscenza) interpretò correttamente la di Schrödinger come un’ampiezza di probabilità, cioè introdusse quel concetto assai difficile che il quadrato dell’ampiezza non è la densità di carica, ma è soltanto la probabilità per unità di volume di trovarvi l’elettrone, e che quando troviamo l’elettrone in qualche posto lo troviamo con tutta la sua carica. Tutte queste idee sono dovute a Born. La funzione d’onda (r) di un elettrone in un atomo non descrive perciò un elettrone, per così dire, diffuso con una densità di carica continua. L’elettrone è qui, o là, o in qualche altro posto, ma dovunque si trovi, esso è sempre una carica puntiforme. D’altra parte, considerate una situazione in cui vi sia un enorme numero di particelle tutte nello stesso stato, con un gran numero di esse aventi esattamente la stessa funzione d’onda. Che succede allora? Una di esse è qui, l’altra ⇤ . Ma là, e la probabilità di trovare una qualsiasi di esse in un dato posto è proporzionale a poiché vi è un numero così grande di particelle, se io considero un qualunque volume dx dy dz, ⇤ dx dy dz. Così, in una situazione in cui è la in generale ne troverò un numero vicino a funzione d’onda di ciascuna di un enorme numero di particelle che si trovano tutte nello stesso (8)
Paragrafo 14.1 del vol. 2.
21.5 • La superconduttività
© 978-8808-22107-0
⇤ può essere interpretata come la densità di particelle. Se, in tale circostanza, ciascuna stato, ⇤ particella porta una carica q, noi possiamo, in effetti, andare ancora oltre e interpretare ⇤ come una densità di elettricità. Normalmente ha le dimensioni di una densità di probabilità, cosicché per avere le dimensioni di una densità di carica bisogna moltiplicare per q. Per i nostri ⇤ stessa come attuali scopi, possiamo assorbire questo fattore costante in , e considerare ˆ un densità di carica. Sottintendendo quanto sopra, J, la corrente di probabilità che ho calcolato, diviene direttamente la densità di corrente elettrica. Allora, nella situazione in cui si possono avere moltissime particelle tutte esattamente nello stesso stato, è possibile una nuova interpretazione della funzione d’onda. La densità di carica e la corrente elettrica possono essere calcolate direttamente a partire dalla funzione d’onda e la funzione d’onda stessa assume un significato fisico che si estende a situazioni classiche, macroscopiche. Qualcosa di simile può avvenire anche con particelle neutre. Quando si ha a che fare con la funzione d’onda di un fotone singolo, questa ci dà l’ampiezza per trovare il fotone in qualche posto. Per quanto noi non la si sia mai scritta, esiste un’equazione per la funzione d’onda del fotone analoga all’equazione di Schrödinger per l’elettrone. L’equazione per il fotone è esattamente uguale alle equazioni di Maxwell per il campo elettromagnetico e la funzione d’onda identica al potenziale vettore A. Anzi, risulta che la funzione d’onda è proprio il potenziale vettore. La fisica quantistica è quindi uguale alla fisica classica, poiché i fotoni sono particelle di Bose non interagenti e molti di essi possono stare nello stesso stato – anzi, come sapete, amano stare nello stesso stato. Dal momento in cui ne avete miliardi nello stesso stato (cioè nella stessa onda elettromagnetica), voi potete allora misurarne direttamente la funzione d’onda, che è il potenziale vettore. Naturalmente le cose sono andate storicamente in maniera diversa. Le prime osservazioni si riferivano a situazioni con molti fotoni nello stesso stato e si riuscì così a scoprire l’equazione corretta per un singolo fotone osservando direttamente con i nostri occhi la natura della funzione d’onda a un livello macroscopico. Il guaio con gli elettroni è che non se ne può mettere più di uno nello stesso stato. Perciò, si pensò a lungo che la funzione d’onda dell’equazione di Schrödinger non avrebbe potuto avere una rappresentazione macroscopica analoga a quella dell’ampiezza per i fotoni. D’altra parte ci si è resi conto ora che il fenomeno della superconduttività ci mette in presenza proprio di una tale situazione.
21.5
La superconduttività
Come sapete, moltissimi metalli diventano superconduttori al di sotto di una certa temperatura(9) – temperatura che è diversa per i vari metalli. Quando la temperatura viene ridotta sufficientemente, i metalli conducono l’elettricità senza alcuna resistenza. Questo fenomeno è stato osservato per un gran numero di metalli, ma non per tutti, e la sua teoria ha dato luogo a un gran numero di difficoltà. Ci è voluto molto tempo per capire cosa succede all’interno dei superconduttori e io mi limiterò a descrivere solo quel che basta per i nostri scopi. Risulta che, a causa delle interazioni degli elettroni con le vibrazioni degli atomi nel reticolo, si ha complessivamente una piccola attrazione efficace tra gli elettroni. Il risultato di ciò è, per dirla in maniera assai rozza e qualitativa, che gli elettroni formano delle coppie legate. Ora, voi sapete che un singolo elettrone è una particella di Fermi. Ma una coppia di elettroni si comporta come una particella di Bose, perché se io scambio entrambi gli elettroni di una coppia, cambio di segno due volte la funzione d’onda, e questo significa che non ho cambiato niente. Una coppia è una particella di Bose. L’energia di accoppiamento – cioè l’attrazione complessiva – è molto, molto piccola. Basta una temperatura bassissima per separare gli elettroni a causa dell’agitazione termica e per convertirli (9)
Fenomeno scoperto per primo da Kamerlingh-Onnes nel 1911; H. Kamerlingh-Onnes, Comm. Phys. Lab., Univ. Leyden, N. 119, 120, 122 (1911). Una bella e aggiornata discussione dell’argomento si può trovare in E.A. Lynton, Superconductivity, John Wiley and Sons, Inc., NewYork, 1962.
343
344
Capitolo 21 • L’equazione di Schrödinger in un ambito classico: un seminario sulla superconduttività
© 978-8808-22107-0
in elettroni «normali». Ma quando la temperatura si fa sufficientemente bassa, essi fanno del loro meglio per andare nel più basso stato d’energia possibile; e allora si raggruppano in coppie. Non vorrei che pensaste che le coppie siano veramente unite molto strettamente come una particella puntiforme. Infatti, originariamente, una delle più grandi difficoltà nel capire questo fenomeno fu che le cose non stanno affatto così. I due elettroni che formano la coppia sono in realtà separati da una distanza considerevole; e la distanza media tra coppie è relativamente più piccola delle dimensioni di una singola coppia. Diverse coppie occupano lo stesso spazio nello stesso tempo. Sia la scoperta della ragione per cui gli elettroni nei metalli formano le coppie, sia la stima dell’energia che si libera nella formazione di una coppia, sono stati un trionfo dei tempi recenti. Il punto fondamentale della teoria della superconduttività fu chiarito per la prima volta nel lavoro di Bardeen, Cooper e Schrieffer(10) , ma questo non è il soggetto del mio seminario. Noi, tuttavia, accetteremo l’idea che gli elettroni, in un modo o nell’altro, lavorino in coppia, che tali coppie si comportino più o meno come particelle, e che si possa perciò parlare della funzione d’onda di una «coppia». L’equazione di Schrödinger per una coppia sarà, più o meno, simile all’equazione (21.3). Ci sarà una differenza, e cioè che la carica q sarà il doppio della carica di un elettrone. Inoltre, non sappiamo qual è l’inerzia – cioè la massa effettiva – della coppia nel reticolo cristallino, cosicché non sappiamo che numero mettere al posto di m. E non possiamo neppure pensare che tale equazione sia esattamente quella corretta a frequenze molto grandi (cioè a piccole lunghezze d’onda), perché l’energia cinetica che corrisponde a una funzione d’onda assai rapidamente variabile potrebbe essere così grande da spezzare la coppia. A temperatura finita, vi è sempre qualche coppia che viene spezzata secondo la normale teoria di Boltzmann. La probabilità che una coppia venga spezzata è proporzionale a exp( Ecoppia /kT). Gli elettroni che non sono accoppiati sono detti «normali» e si muovono nel cristallo in modo ordinario. Comunque io tratterò la situazione a temperatura praticamente nulla e, in ogni caso, trascurerò le complicazioni prodotte da quegli elettroni che non sono accoppiati. Poiché le coppie di elettroni sono bosoni, quando essi sono in gran numero in un dato stato, l’ampiezza di transizione delle altre coppie verso quello stato è particolarmente grande. Così, quasi tutte le coppie saranno bloccate nello stato d’energia più basso, esattamente nello stesso stato, e non sarebbe facile portarne una in uno stato differente. C’è più p probabilità di andare in quello stesso stato che in uno non occupato a causa del famoso fattore n, dove n 1 è il numero di occupazione dello stato più basso. Così ci si aspetta che tutte le coppie si trovino nello stesso stato. Come si presenterà allora la nostra teoria? Chiamerò la funzione d’onda di una coppia nello ⇤ risulterà proporzionale alla densità di carica ⇢, stato d’energia minima. Tuttavia, poiché posso benissimo scrivere come la radice quadrata della densità di carica per un certo fattore di fase: (r) = ⇢1/2 (r)ei✓(r ) (21.17) dove ⇢ e ✓ sono funzioni reali di r. (Naturalmente ogni funzione complessa può essere scritta in questo modo.) È chiaro quello che intendiamo parlando di densità di carica, ma qual è il significato fisico della fase ✓ nella funzione d’onda? Bene, vediamo un po’ cosa succede se sostituiamo (r) nell’equazione (21.12) ed esprimiamo la densità di corrente in funzione delle nuove variabili ⇢ e ✓. Non è nient’altro che un cambiamento di variabili, e io non starò a eseguire i calcoli; quel che viene fuori è ~ ✓ q ◆ J= r✓ A ⇢ (21.18) m ~
Poiché sia la densità di carica sia la densità di corrente hanno un significato fisico diretto per il gas di elettroni superconduttori, sia ⇢ sia ✓ sono delle cose reali. La fase è osservabile esattamente come ⇢; è un termine che compare nella densità di corrente J. La fase assoluta non è osservabile, ma se il gradiente della fase è noto ovunque, la fase è nota a meno di una costante. Si può definire la fase in un punto e allora essa è determinata dappertutto. (10)
J. Bardeen, L.N. Cooper e J.R. Schrieffer, Phys. Rev. 108, 1175 (1957).
21.6 • L’effetto Meissner
© 978-8808-22107-0
Incidentalmente, l’equazione per la corrente può essere analizzata un po’ meglio, se si pensa che la densità di corrente J sia, in realtà, la densità di carica per la velocità del fluido di elettroni, cioè ⇢v. L’equazione (21.18) è allora equivalente a mv = ~ r✓
qA
(21.19)
Notate che vi sono due termini nell’impulso mv; uno è un contributo che viene dal potenziale vettore e l’altro un contributo che viene dal comportamento della funzione d’onda. In altri termini, la quantità ~r✓ è proprio ciò che abbiamo chiamato impulso p.
21.6
L’effetto Meissner
Possiamo ora descrivere alcuni fenomeni legati alla superconduttività. Prima di tutto non vi è resistenza elettrica. Non vi è resistenza perché tutti gli elettroni sono collettivamente nello stesso stato. Nel flusso di corrente ordinario si può spingere un elettrone o l’altro fuori dal flusso regolare, deteriorando così gradualmente l’impulso generale. Ma qui, far fare a un elettrone qualcosa di diverso da quello che tutti gli altri stanno facendo, è assai difficile a causa della tendenza che hanno tutte le particelle di Bose a mettersi nello stesso stato. Una volta partita, la corrente seguita a fluire per sempre. Si capisce anche facilmente che se si ha un pezzo di metallo nello stato superconduttore e si accende un campo magnetico che non sia troppo forte (e non stiamo a entrare nei dettagli per dire quanto forte), il campo magnetico non può penetrare nel metallo. Infatti, se nello stabilire il campo magnetico, una parte di esso penetrasse nel metallo, ci sarebbe una variazione di flusso che produrrebbe un campo elettrico, e un campo elettrico produrrebbe immediatamente una corrente che, per la legge di Lenz, si opporrebbe alla variazione di flusso stessa. Poiché tutti gli elettroni si muovono insieme, anche un campo elettrico infinitesimo genererebbe abbastanza corrente da opporsi completamente a ogni campo magnetico applicato. Così, se si accende il campo dopo aver raffreddato il metallo sino a renderlo superconduttore, esso viene subito escluso. Ancor più interessante è un fenomeno a ciò collegato, scoperto sperimentalmente da Meissner(11) . Se si ha un pezzo di metallo a temperatura abbastanza alta (così che sia un conduttore normale) e si stabilisce in esso un campo magnetico, e successivamente si abbassa la temperatura al di sotto del valore critico (cioè, quando il metallo diviene superconduttore), il campo viene espulso. In altre parole, il metallo produce una sua propria corrente, nella quantità esattamente sufficiente a cacciar fuori il campo. Possiamo trovare la ragione di ciò nelle nostre equazioni, e ora vi spiegherò come. Supponiamo di prendere un campione di materiale superconduttore che sia un unico pezzo. Allora in una situazione stazionaria di qualsiasi tipo, la divergenza della corrente deve essere nulla, perché non c’è alcun posto dove la corrente possa andare a finire. È conveniente scegliere la divergenza di A uguale a zero. (Dovrei spiegare perché questa convenzione non comporta alcuna perdita di generalità, ma non voglio perder tempo.) Prendendo la divergenza dell’equazione (21.18), si ottiene che il laplaciano di ✓ è uguale a zero. Un momento. Cosa si può dire sulla variazione di ⇢? Mi ero dimenticato di menzionare un punto importante. Nel nostro metallo, c’è una base di cariche positive dovute agli ioni atomici del reticolo. Se la densità di carica è uniforme, non vi è carica totale e non vi è campo elettrico. Se ci fosse un qualche accumulo di elettroni in una regione, la carica non sarebbe neutralizzata e vi sarebbe una terribile repulsione che spingerebbe gli elettroni lontani gli uni dagli altri(12) . Così, in circostanze ordinarie, la densità di carica degli elettroni in un superconduttore è quasi perfettamente uniforme, e io considererò ⇢ costante. Allora, l’unico modo di avere r2 ✓ uguale a zero ovunque all’interno del nostro pezzo di metallo è che ✓ sia (11)
W. Meissner e R. Ochsenfeld, Naturwiss. 21, 787 (1933). In realtà, se il campo elettrico fosse troppo forte, le coppie si spezzerebbero e gli elettroni «normali» così creati si muoverebbero per neutralizzare ogni eccesso di carica positiva. Però, per fare gli elettroni normali ci vuole dell’energia, cosicché il punto fondamentale è che una densità ⇢ quasi uniforme è fortemente favorita energeticamente. (12)
345
346
Capitolo 21 • L’equazione di Schrödinger in un ambito classico: un seminario sulla superconduttività
© 978-8808-22107-0
costante. E ciò significa che non vi è contributo a J da parte dell’impulso p. L’equazione (21.18) ci dice allora che la corrente è proporzionale a ⇢ per A. Così ovunque, in un pezzo di materiale superconduttore, la corrente è necessariamente proporzionale al potenziale vettore:
B
J=
⇢
q A m
(21.20)
Poiché ⇢ e q hanno lo stesso segno (negativo), e poiché ⇢ è costante, posso porre q ⇢ = (costante positiva) m quindi J = (costante positiva) A (21.21) Questa equazione fu originariamente proposta da London e London(13) per spiegare le osservazioni sperimentali sulla superconduttività; assai prima che l’origine quantistica di questo effetto fosse messa in luce. Ora possiamo usare l’equazione (21.20) nelle equazioni dell’elettromagnetismo per ottenere le soluzioni per i campi. Il potenziale vettore è legato alla densità di corrente da B
1 J ✏ 0 c2
r2 A =
(21.22)
Usando l’equazione (21.21) per J, abbiamo r2 A = dove
2
2
A
(21.23)
è una nuova costante: 2
r
=⇢
q ✏ 0 mc2
(21.24)
Possiamo ora cercare di risolvere questa equazione per A e vedere in dettaglio quel che succede. Per esempio, in una dimensione, l’equazione (21.23) FIGURA 21.3 (a) Un cilindro superconduttore in un campo magnetico; (b) il campo B in funzione di r. ha soluzioni esponenziale della forma e x ed e+ x . Il significato di queste soluzioni è che il potenziale vettore deve decrescere esponenzialmente andando dalla superficie verso l’interno del materiale. (Non può crescere perché sarebbe espulso.) Se il campione di materiale è assai grande rispetto a 1/ , il campo penetra solo in un piccolo strato alla superficie, uno strato che ha uno spessore uguale a circa 1/ . Tutto il resto dell’interno è privo di campo, come mostra la FIGURA 21.3. E questa è la spiegazione dell’effetto Meissner. Quant’è grande la distanza ? Bene, ricordiamoci che r 0 , il «raggio elettromagnetico» dell’elettrone (2,8 · 10 13 cm), è dato da mc2 =
qe2 4⇡✏ 0 r 0
Ricordiamoci anche che q nell’equazione (21.24) è il doppio della carica dell’elettrone, cosicché q2 8⇡r 0 = 2 qe ✏ 0 mc Scrivendo ⇢ come qe N, dove N è il numero di elettroni per centimetro cubo, si ha 2
= 8⇡Nr 0
(21.25)
In un metallo come il piombo, ci sono circa 3 · 1022 atomi/cm3 , cosicché, se ciascuno di essi contribuisce con un solo elettrone di conduzione, 1/ sarebbe circa 2 · 10 6 cm. E questo vi dà l’ordine di grandezza. (13)
H. London e F. London, Proc. Roy. Soc. (London) A149, 71 (1935); Physica 2, 341 (1935).
21.7
347
21.7 • Quantizzazione del flusso
© 978-8808-22107-0
Quantizzazione del flusso
L’equazione di London (21.21) venne proposta per rendere ragione dei fatti osservati sulla superconduttività, compreso l’effetto Meissner. Più recentemente, tuttavia, sono state fatte alcune predizioni ancora più spettacolari. Una di queste predizioni, fatta da London, sembrava così strana che nessuno ci prestò attenzione, almeno fino a tempi recenti. Discuterò ora questo argomento. Questa volta, invece di considerare un singolo blocco di materiale, supponiamo d’avere un anello il cui spessore sia grande rispetto a 1/ , e cerchiamo di vedere cosa succede partendo con un campo magnetico che attraversi l’anello, raffreddando poi questo fino allo stato superconduttore e rimuovendo infine l’originale sorgente di B. La sequenza di questi eventi è schematizzata in FIGURA 21.4. Nello stato normale, vi sarà un campo nel corpo dell’anello come mostrato nella FIGURA 21.4a. Quando l’anello è reso superconduttore, il campo viene espulso dal materiale (come abbiamo appena visto). Ci sarà però un certo flusso attraverso il foro dell’anello, com’è indicato nella FIGURA 21.4b. Se il campo esterno viene ora rimosso, le linee del campo che attraversano il foro sono «intrappolate» come mostra la FIGURA 21.4c. Il flusso attraverso il centro non può diminuire perché @ /@t deve essere uguale all’integrale di linea di E lungo l’anello, che è zero in un superconduttore. Quando il campo esterno viene rimosso, una supercorrente comincia a fluire lungo l’anello in modo da mantenere costante il flusso attraverso l’anello stesso. (È semplicemente la vecchia storia della corrente indotta, solo con resistenza zero.) Queste correnti, tuttavia, scorreranno tutte vicino alla superficie (fino alla profondità di 1/ ), come può essere dimostrato dallo stesso tipo di analisi che ho fatto per il blocco di materiale solido. Queste correnti sono capaci di mantenere il campo magnetico fuori dal corpo dell’anello e anche di produrre il campo magnetico che resta intrappolato permanentemente. Ora, tuttavia, si ha un’essenziale differenza e le nostre equazioni predicono un effetto sorprendente. L’argomento che avevo portato in precedenza per dimostrare che ✓ deve essere costante in un blocco solido non si applica per un anello, come si può vedere con i seguenti ragionamenti. In profondità, all’interno dell’anello, la densità di corrente J è zero; così l’equazione (21.18) dà
B
(a)
B
(b) B
(21.26)
~ r✓ = q A
Consideriamo ora quel che si ottiene prendendo l’integrale di linea di A lungo una curva , che circoli lungo l’anello presso il centro della sua sezione, così da non avvicinarsi mai alla superficie, come mostra la FIGURA 21.5. Dall’equazione (21.26), ⇥ ⇥ ~ r✓ · ds = q A · ds (21.27) Ma noi sappiamo che l’integrale di linea di A lungo una qualsiasi linea chiusa è uguale al flusso di B attraverso la linea: ⇥ A · ds =
(c)
21.4 Un anello in un campo magnetico: (a) nello stato normale; (b) nello stato superconduttore; (c) dopo la rimozione del campo esterno. FIGURA
L’equazione (21.27) diviene allora ⇥
r✓ · ds =
q ~
(21.28)
348
Capitolo 21 • L’equazione di Schrödinger in un ambito classico: un seminario sulla superconduttività
© 978-8808-22107-0
L’integrale di linea di un gradiente da un punto a un altro (diciamo dal punto 1 al punto 2) è la differenza dei valori della funzione nei due punti, cioè ⌅ 2
1
r✓ · ds = ✓ 2
✓1
Se si fanno riunire i due punti terminali 1 e 2 in modo da formare una curva chiusa, si potrebbe pensare a prima vista che ✓ 2 risulti uguale a ✓ 1 , cosicché l’integrale nell’equazione (21.28) sarebbe zero. Questo sarebbe vero per una curva chiusa all’interno di un pezzo di superconduttore semplicemente connesso, ma non è necessariamente vero all’interno di un superconduttore FIGURA 21.5 La curva Γ nell’interno di un anello superconduttore. a forma di anello. L’unica richiesta fisica che si può fare è che la funzione d’onda abbia un solo valore in ogni punto. Comunque vari ✓ muovendosi lungo l’anello, quando si ritorna al punto di partenza, si deve ottenere lo stesso valore per la funzione d’onda =
p
⇢ei✓
Questo avviene se ✓ varia di 2⇡n, dove n è un intero qualsiasi. Quindi, se si fa un giro completo intorno all’anello, il primo membro dell’equazione (21.27) risulterà uguale a ~·2⇡n. Dall’equazione (21.28) si ottiene allora che 2⇡n~ = q (21.29) Il flusso intrappolato deve essere sempre uguale a un numero intero di volte 2⇡~/q! Se si considerasse l’anello come un oggetto classico con una conduttività perfetta (cioè infinita), si dovrebbe pensare che il flusso si mantiene costante indipendentemente dal suo valore iniziale, o, in altri termini, che può essere imprigionata una quantità arbitraria di flusso. Ma la teoria quantistica della superconduttività dice che il flusso può essere zero, 2⇡~/q, 4⇡~/q, o 6⇡~/q, e così via, ma non un altro valore intermedio. Deve essere un multiplo di un’unità quantistica fondamentale. London(14) predisse che il flusso intrappolato da un anello superconduttore va quantizzato e disse che i possibili valori del flusso sono quelli dati dall’equazione (21.29), con q uguale alla carica dell’elettrone. Secondo London l’unità fondamentale di flusso sarebbe 2⇡~ qe che vale circa 4 · 10 7 gauss/cm2 . Per visualizzare un tale flusso, pensate a un cilindro sottile del diametro di un decimo di millimetro; il campo magnetico nel suo interno, quando è attraversato dal flusso in questione, è circa l’uno per cento del campo magnetico terrestre. Un tale flusso sarebbe osservabile con misure magnetiche sensibili. Nel 1961 questo flusso quantizzato è stato cercato e trovato da Deaver e Fairbank(15) alla Stanford University di e all’incirca nello stesso tempo da Doll e Näbauer(16) in Germania. Nell’esperienza di Deaver e Fairbank, un piccolo cilindro superconduttore veniva ottenuto depositando elettrolicamente un sottile strato di stagno su di un filo di rame lungo un centimetro e del diametro di 1,3 · 10 3 cm. Lo stagno diviene superconduttore sotto 3,8 K, mentre il rame resta un metallo normale. Il filo veniva sottoposto a un debole campo magnetico controllato e la temperatura abbassata fino a quando lo stagno non diventava superconduttore. A quel punto veniva tolta la sorgente del campo esterno. Quel che ci si aspetta è che in tal modo si generi una corrente, per la legge di Lenz, così da mantenere costante il flusso all’interno. Il cilindretto viene perciò ad avere un momento magnetico proporzionale al flusso all’interno. Il momento magnetico veniva misurato muovendo su e giù il filo (come l’ago di una macchina da cucire, ma alla velocità di 100 cicli al secondo) in mezzo a una coppia di piccole bobine poste alle estremità del cilindretto. La tensione indotta nelle bobine era quindi una misura del momento magnetico. (14) (15) (16)
F. London, Superfluids; John Wiley and Sons, Inc., New York, 1950, vol. 1, p. 152. B.S. Deaver, Jr., e W.M. Fairbank, Phys. Rev. Letters 7, 43 (1961). R. Doll e M. Näbauer, Phys. Rev. Letters 7, 51 (1961).
21.8 • La dinamica della superconduttività
© 978-8808-22107-0
Quando l’esperimento venne effettuato da Deaver e Fairbank, essi trovarono che il flusso era quantizzato, ma che l’unità fondamentale era solo la metà del valore predetto da London. Doll e Näbauer ottennero lo stesso risultato. Dapprima ciò apparve assai misterioso,(17) ma ora sappiamo perché doveva essere così. Secondo la teoria della superconduttività di Bardeen, Cooper e Schrieffer, la grandezza q che appare nell’equazione (21.29) è la carica di una coppia di elettroni ed è perciò uguale a 2qe . L’unità fondamentale di flusso è 0
=
⇡~ ⇡ 2 · 10 qe
7
gauss/cm2
(21.30)
ossia la metà della quantità prevista da London. Tutte le cose ora si accordano tra loro e le misure mostrano l’esistenza su larga scala del previsto effetto di natura puramente quantistica.
21.8
La dinamica della superconduttività
L’effetto Meissner e la quantizzazione del flusso sono due conferme delle nostre idee generali. Ma, a scopo di completezza, vorrei ora mostrarvi quali sono le equazioni complete di un fluido superconduttore da questo punto di vista, cosa che è piuttosto interessante. Finora, io mi sono limitato a sostituire l’espressione di nelle equazioni per la densità di carica e di corrente. Sostituendola nell’equazione di Schrödinger completa, ottengo delle equazioni per ⇢ e ✓. È interessante vedere cosa succede, perché qui abbiamo un «fluido» di coppie di elettroni con densità di carica ⇢ e una misteriosa ✓. Vediamo un po’ che razza di equazioni si riescono a ottenere per questo «fluido»! Allora, sostituiamo la funzione d’onda dell’equazione (21.17) nell’equazione di Schrödinger (21.3) e ricordiamo che ⇢ e ✓ sono funzioni reali di x, y, z e t. Separando le parti reale e immaginaria si ottengono quindi due equazioni. Per scriverle in forma abbreviata, secondo l’equazione (21.19), scriverò ~ r✓ m
q A=v m
(21.31)
Una delle equazioni che si ottengono è allora @⇢ = r · ⇢v @t
(21.32)
Poiché ⇢v non è altro che J, questa è una volta di più l’equazione di continuità. L’altra equazione che ottengo dice come varia ✓; essa è ~
@✓ = @t
m 2 v 2
q +
~2 * 1 2 p + p r ⇢ 2m , ⇢ -
(21.33)
Coloro che hanno familiarità con l’idrodinamica (e io sono sicuro che ce ne sono pochi tra voi) avranno riconosciuto questa come l’equazione di moto di un fluido carico elettricamente, qualora s’identifichi ~✓ come il «potenziale di velocità» – a parte l’ultimo termine, che dovrebbe essere l’energia di compressione del fluido, ha una dipendenza piuttosto strana dalla densità ⇢. In ogni caso, l’equazione dice che la velocità di variazione della quantità ~✓ è data da un termine di energia cinetica, mv 2 /2, più un termine d’energia potenziale, q , più un termine addizionale, che contiene il fattore ~2 , che chiameremo «energia quantistica». Abbiamo visto che all’interno di un superconduttore ⇢ è mantenuto pressoché uniforme dalle forze elettrostatiche, cosicché questo termine può essere quasi certamente trascurato in tutte le applicazioni pratiche purché si abbia una sola regione superconduttrice. Se si ha una superficie di separazione tra due superconduttori (o (17) Era stato una volta suggerito da Onsager che questo potesse accadere (vedi Deaver e Fairbank, Ref. 15), per quanto nessun altro mai riuscisse a capire il perché.
349
350
Capitolo 21 • L’equazione di Schrödinger in un ambito classico: un seminario sulla superconduttività
© 978-8808-22107-0
in altre circostanze in cui il valore di ⇢ può cambiare rapidamente) questo termine può diventare importante. Per coloro che hanno molta familiarità con le equazioni dell’idrodinamica, riscriverò l’equazione (21.33) in una forma che rende il significato fisico più evidente, usando l’equazione (21.31) per esprimere ✓ in termini di v. Prendendo il gradiente dell’intera equazione (21.33) ed esprimendo r✓ in termini di A e di v per mezzo della (21.31), si ottiene ! @v q @A ~2 1 p = r v ⇥ (r ⇥ v) (v · r) v + r 2 * p r2 ⇢+ (21.34) @t m @t ⇢ 2m , Cosa significa questa equazione? Prima di tutto ricordate che r
@A =E @t
(21.35)
Poi osservate che, se si prende il rotore dell’equazione (21.31), si ottiene q r⇥ A m
r⇥v =
(21.36)
poiché il rotore di un gradiente è sempre zero. Ma r ⇥ A è il campo magnetico B, quindi i primi due termini possono essere scritti come q (E + v ⇥ B) m Infine si può capire che @v/@t rappresenta la derivata della velocità del fluido in un certo punto. Se considerate per il momento una sola particolare particella, la sua accelerazione è la derivata totale di v (o, come viene talvolta chiamata nella dinamica dei fluidi, l’«accelerazione sostanziale»), che è connessa a @v/@t da(18) dv dt
sostanziale
=
@v + (v · r) v @t
(21.37)
Questo termine in più appare anche come terzo termine al secondo membro dell’equazione (21.34). Portandolo al primo membro, possiamo scrivere l’equazione (21.34) nel modo seguente: m
dv dt
sostanziale
= q (E + v ⇥ B) + r
Abbiamo anche dall’equazione (21.36) che r⇥v =
q B m
~2 * 1 2 p + p r ⇢ 2m2 , ⇢ -
(21.38)
(21.39)
Queste due equazioni sono le equazioni di moto del fluido superconduttore di elettroni. La prima equazione non è altro che la legge di Newton per un fluido carico in un campo elettromagnetico. Ci dice che l’accelerazione di ogni particella del fluido la cui carica è q proviene dall’ordinaria forza di Lorentz q (E + v ⇥ B) più una forza addizionale, che è il gradiente di un qualche misterioso potenziale quantistico, cioè una forza che non è molto grande eccetto che alla superficie di separazione di due superconduttori. La seconda equazione dice che il fluido è «perfetto» – il rotore di v ha divergenza zero (la divergenza di B è sempre zero). Questo significa che la velocità può essere espressa in termini di un potenziale di velocità. Di solito si scrive che r ⇥ v = 0 per un fluido perfetto, ma per un fluido perfetto carico in un campo magnetico questa espressione viene modificata nell’equazione (21.39). Così l’equazione di Schrödinger per le coppie di elettroni in un superconduttore ci dà le equazioni di moto di un fluido perfetto carico. La superconduttività è identica al problema dell’idrodinamica di un liquido carico. Se volete risolvere un qualunque problema sui superconduttori, (18)
Vedi paragrafo 40.2 del vol. 2.
21.9 • La giunzione di Josephson
© 978-8808-22107-0
prendete queste equazioni per il fluido (o la coppia equivalente di equazioni (21.32) e (21.33)) e combinatele con le equazioni di Maxwell per ottenere i campi. (Le cariche e le correnti che userete per ottenere i campi devono, naturalmente, includere sia quelle superconduttrici sia quelle provenienti da sorgenti esterne.) Incidentalmente, credo che l’equazione (21.38) non sia del tutto corretta, ma dovrebbe avere un termine in più contenente la densità. Questo nuovo termine non dipende dalla meccanica quantistica, ma proviene dall’ordinaria energia associata alle variazioni di densità. Così come in un fluido ordinario, ci dovrebbe essere una densità d’energia potenziale proporzionale al quadrato della deviazione di ⇢ da ⇢0 , la densità imperturbata (che qui è anche uguale alla densità di carica del reticolo cristallino). Poiché ci saranno delle forze proporzionali al gradiente di questa energia, ci dovrebbe essere un altro termine nell’equazione (21.38) della forma: (cost.)r(⇢ ⇢0 )2 . Questo non è comparso nella nostra analisi perché esso proviene dall’interazione tra particelle, che abbiamo trascurato usando un’approssimazione a particelle indipendenti. Tuttavia è proprio quella forza cui ho accennato quando ho enunciato qualitativamente il fatto che le forze elettrostatiche tendono a mantenere ⇢ quasi costante all’interno di un superconduttore.
21.9
La giunzione di Josephson
Vorrei ora discutere una situazione interessante, rilevata da Josephson(19) Isolante analizzando ciò che può accadere alla superficie di separazione tra due superconduttori. Supponiamo d’avere due superconduttori connessi da uno strato sottile di materiale isolante come in FIGURA 21.6. Un tale sistema è ora chiamato «giunzione di Josephson». Se lo strato isolante è spesso, 2 1 gli elettroni non lo possono attraversare: ma se è abbastanza sottile, vi può essere una non disprezzabile ampiezza di probabilità quantistica per gli elettroni di saltare dall’altra parte. E questo è un altro esempio della penetrazione quantistica di una barriera. Josephson studiò questo problema e scoprì che si poteva produrre una serie di strani fenomeni. Superconduttore Nell’analisi del comportamento di questa giunzione, chiamerò 1 l’ampiezza di probabilità di trovare un elettrone da una parte e 2 l’ampiezza di trovarlo dall’altra. Nello stato superconduttore, la funzione d’onda 1 è la FIGURA 21.6 Due superconduttori separati da funzione d’onda comune a tutti gli elettroni da un lato, e 2 è la corrispon- un sottile strato isolante. dente funzione dall’altro lato. Potrei trattare questo problema per differenti tipi di superconduttori, ma lasciatemi considerare il caso molto semplice in cui il materiale è lo stesso da entrambe le parti cosicché la giunzione è semplice e simmetrica. Inoltre, per il momento, supponiamo che non vi sia campo magnetico. Allora le due ampiezze sono correlate nel modo seguente: @ 1 i~ = U1 1 + K 2 @t @ 2 i~ = U2 2 + K 1 @t La costante K è caratteristica della giunzione. Se K fosse zero, queste due equazioni descriverebbero semplicemente lo stato d’energia più bassa – d’energia U – di ciascun superconduttore. Ma i due lati sono accoppiati dall’ampiezza K così che ci può essere un trasferimento da un lato all’altro. (Questa è proprio l’ampiezza di «flip-flop» per un sistema a due stadi.) Se i due lati fossero identici, U1 sarebbe uguale a U2 e sarebbe possibile eliderli. Ma supponiamo ora di connettere le due regioni superconduttrici ai terminali di una batteria in modo da avere una differenza di potenziale V attraverso la giunzione. Allora avremo U1 U2 = qV . Per convenienza, (19)
B.D. Josephson, Physics Letters 1, 251 (1962).
351
352
Capitolo 21 • L’equazione di Schrödinger in un ambito classico: un seminario sulla superconduttività
© 978-8808-22107-0
possiamo definire lo zero dell’energia a metà di questo valore, e allora le due equazioni diventano @ 1 qV = @t 2 @ 2 qV i~ = @t 2 i~
1
+K
2
(21.40) 2+K
1
Queste sono le consuete equazioni per due stati quantistici accoppiati. Analizziamo ora queste equazioni in un altro modo. Facciamo le sostituzioni 1
=
p
⇢1 ei✓1
2
=
p
⇢2 ei✓2
(21.41)
dove ✓ 1 e ✓ 2 sono le fasi ai due lati della giunzione e ⇢1 e ⇢2 sono le densità degli elettroni in questi due punti. Ricordate che in pratica ⇢1 e ⇢2 sono quasi esattamente le stesse e sono uguali a ⇢0 , densità normale degli elettroni nel materiale superconduttore. Se ora sostituite le equazioni per 1 e 2 nella (21.40), ottenete quattro equazioni uguagliando le parti reali e immaginarie in entrambi i casi. Posto (✓ 2 ✓ 1 ) = , per brevità, ne risulta che 2 p ⇢˙ 1 = + K ⇢2 ⇢1 sen ~
(21.42)
⇢˙ 2 =
2 p K ⇢2 ⇢1 sen ~
✓˙1 =
K ~
r
⇢2 cos ⇢1
✓˙2 =
K ~
r
⇢1 qV cos + ⇢2 2~
qV 2~
(21.43)
Le prime due equazioni dicono che ⇢˙ 1 = ⇢˙ 2 . «Ma», direte voi, «devono essere entrambe zero se ⇢1 e ⇢2 sono tutte e due costanti e uguali a ⇢0 ». Non è del tutto vero. Queste equazioni non ci dicono tutto. Esse ci dicono quel che sarebbero ⇢˙ 1 e ⇢˙ 2 se non ci fossero altre forze elettriche dovute a uno squilibrio tra il fluido degli elettroni e il sottofondo di ioni positivi. Esse ci dicono come le densità comincerebbero a cambiare e quindi descrivono qual è il tipo di corrente che comincerebbe a fluire. Questa corrente, proveniente dal lato 1 verso il lato 2, sarebbe proprio ⇢˙ 1 (oppure ⇢˙ 2 ), ossia 2K p J= ⇢1 ⇢2 sen (21.44) ~ Questa corrente finirebbe presto per rendere carico il lato 2, se non fosse che ci siamo dimenticati d’aver connesso con dei fili i due lati della giunzione a una batteria. La corrente che fluisce non caricherà allora la regione 2 (e non scaricherà la regione 1) perché vi sarà un flusso di corrente che provvederà a mantenere costante il potenziale. Queste ultime correnti, che derivano dalla presenza della batteria, non sono state incluse nelle nostre equazioni. Una volta incluse, si trova che ⇢1 e ⇢2 in realtà non cambiano, ma la corrente che attraversa la giunzione è ancora data dall’equazione (21.44). Poiché ⇢1 e ⇢2 rimangono costanti e uguali a ⇢0 , poniamo 2K ⇢0 /~ = J0 e scriviamo J = J0 sen
(21.45)
J0 , così come K, è quindi un numero caratteristico della particolare giunzione. L’altra coppia di equazioni (21.43) si riferisce a ✓ 1 e ✓ 2 . Quello che c’interessa è la differenza = ✓ 2 ✓ 1 in modo da poter usare l’equazione (21.45); si ottiene ˙ = ✓˙2
qV ✓˙1 = ~
(21.46)
21.9 • La giunzione di Josephson
© 978-8808-22107-0
Ciò significa che possiamo scrivere (t) =
0+
q ~
⌅
V (t) dt
(21.47)
dove 0 è il valore di a t = 0. Ricordate anche che q è la carica di una coppia, cioè, q = 2qe . Nelle equazione (21.45) e (21.47) è contenuto un importante risultato, ovvero la teoria generale della giunzione di Josephson. Quali ne sono ora le conseguenze? Prima di tutto, inserite una tensione continua. Se inserite una tensione continua, V0 , l’argomento del seno diviene 0 + (q/~)V0 t. Poiché ~ è un numero piccolo (rispetto alle tensioni e ai tempi ordinari) il seno oscilla piuttosto rapidamente e la corrente complessiva è nulla. (In pratica, poiché la temperatura non è zero, si avrebbe una piccola corrente dovuta alla conduzione degli elettroni «normali».) D’altra parte, se alla giunzione fosse applicata una tensione zero, si avrebbe una corrente! Senza tensione applicata, la corrente può assumere un qualsiasi valore compreso tra +J0 e J0 (a seconda del valore di 0 ). Ma quando cercate di applicare una qualche tensione alla giunzione, la corrente va a zero. Questo strano comportamento è stato recentemente osservato sperimentalmente(20) . C’è un altro modo di ottenere una corrente: quello di applicare una tensione a frequenza molto alta in aggiunta a quella continua. Poniamo V = V0 + v cos !t dove v ⌧ V . Allora (t) è 0
+
q v q V0 t + sen !t ~ ~ !
E, per piccoli x, sen(x + x) ⇡ sen x + x cos x Usando questa approssimazione per sen , si ha " ✓ ◆ q v ✓ q J = J0 sen 0 + V0 t + sen !t cos ~ ~ !
◆ q V0 t 0+ ~
#
Il primo termine è in media nullo, ma il secondo non lo è se !=
q V0 ~
Ci dovrebbe essere quindi una corrente se la tensione alternata ha esattamente questa frequenza. Shapiro(21) dice di aver osservato un tale effetto di risonanza. Se guardate i lavori scritti su questo argomento troverete spesso la formula per la corrente scritta nella forma ! ⌅ 2qe J = J0 sen 0 + A · ds (21.48) ~ dove l’integrale deve essere fatto attraverso la giunzione. La ragione per la quale si fa questo è che quando c’è un potenziale vettore attraverso la giunzione, l’ampiezza di flip-flop è modificata in fase nella maniera che abbiamo già spiegato. Se ci si porta dietro questa fase in più, il risultato è quello che abbiamo scritto qui sopra. Per finire, descriverò un esperimento molto spettacolare e interessante che è stato compiuto recentemente sull’interferenza delle correnti provenienti da due giunzioni. In meccanica quantistica, siamo abituati all’interferenza tra ampiezze provenienti da due diverse fenditure. Adesso ci occuperemo dell’interferenza fra due giunzioni causata dalla differenza di fase all’arrivo di due correnti che hanno percorso due diversi cammini. In FIGURA 21.7 si vedono due differenti giunzioni «a» e «b», connesse in parallelo. I terminali, P e Q, sono connessi agli strumenti elettrici che misurano un eventuale passaggio di corrente. La corrente esterna, Jtotale , sarà la somma delle (20) (21)
P.W. Anderson e J.R. Rowell, Phys. Rev. Letters 10, 230 (1963). S. Shapiro, Phys. Rev. Letters 11, 80 (1963).
353
354
Capitolo 21 • L’equazione di Schrödinger in un ambito classico: un seminario sulla superconduttività
Circuito
a
correnti attraverso le due giunzioni. Siano Ja e Jb le correnti attraverso le due giunzioni, e a e b le loro fasi. Ma la differenza di fase delle funzioni d’onda tra P e Q deve essere la stessa passando dall’una o dall’altra strada. Lungo il cammino attraverso la giunzione «a», la differenza di fase tra P e Q è a più l’integrale di linea del potenziale vettore lungo il cammino superiore: ⌅ 2qe fase P!Q = a + A · ds (21.49) ~ sopra
Isolante
Jtotale
Q
P
Perché? Perché la fase è legata ad A dall’equazione (21.26). Se si integra questa equazione lungo un qualche cammino, il primo membro ci dà il cambiamento di fase, che è proprio proporzionale all’integrale di linea di A, come si è scritto. Il cambiamento di fase lungo il cammino inferiore può similmente essere scritto ⌅ 2qe = b+ A · ds (21.50) ~ sotto
b Superconduttore
FIGURA
21.7
© 978-8808-22107-0
Due giunzioni di Josephson in parallelo.
fase P!Q
I due primi membri devono essere uguali; sottraendo le equazioni, si ottiene che la differenza delle delta è uguale all’integrale di linea di A lungo il circuito: ⇥ 2qe A · ds b a = ~ L’integrale è fatto lungo la linea chiusa di FIGURA 21.7 che attraversa entrambe le giunzioni. L’integrale di A è il flusso magnetico attraverso il circuito. Così le due devono differire di 2qe /~ volte il flusso magnetico che passa attraverso i due rami del circuito: b
=
a
2qe ~
(21.51)
Si può regolare questa differenza di fase variando il campo magnetico nel circuito ed è quindi possibile aggiustare le differenze di fase e vedere se la corrente totale che fluisce attraverso le due giunzioni presenta o meno una qualche interferenza tra le due parti. La corrente totale sarà la somma di Ja e Jb . Per comodità, scriveremo a
=
0
b
=
0
+
qe ~ qe ~
Allora ( ✓ Jtotale = J0 sen
0+
qe ~
◆
+ sen
✓
0
qe ~
◆)
= 2J0 sen
0 cos
qe ~
(21.52)
Ma noi non sappiamo niente su 0 e la natura può fare tutto quel che vuole a seconda delle circostanze. In particolare, 0 dipenderà dalla tensione esterna applicata alla giunzione. Qualunque cosa si faccia, tuttavia, sen 0 non può mai diventare maggiore di 1. Cosicché, la corrente massima per ogni dato è data da qe Jmax = 2J0 cos ~ Questa corrente massima varia a sua volta con e avrà essa stessa dei massimi ogniqualvolta che =n
⇡~ qe
355
21.9 • La giunzione di Josephson
© 978-8808-22107-0
FIGURA
Corrente di Josephson (unità arbitrarie)
–500
–400
–300
–200
–100
0
100
200
300
400
500
Campo magnetico (milligauss)
dove n è intero. Questo equivale a dire che la corrente assume i suoi valori massimi quando il flusso concatenato ha proprio quei valori quantizzati che si sono trovati con l’equazione (21.30)! La corrente di Josephson attraverso una doppia giunzione è stata recentemente misurata(22) in funzione del campo magnetico nella superficie delimitata dalle giunzioni. I risultati sono mostrati in FIGURA 21.8. Si ha una corrente di fondo costante che proviene da vari effetti che abbiamo trascurato, ma le rapide oscillazioni della corrente al variare del campo magnetico sono dovute al termine di interferenza cos qe /~ dell’equazione (21.52). Una questione intricata in meccanica quantistica riguarda l’esistenza del potenziale vettore in una zona in cui non vi sia campo(23) . L’esperimento che ho appena descritto è stato effettuato anche con un piccolo solenoide posto tra le due giunzioni, cosicché la sola regione in cui il campo magnetico B è sensibile è nell’interno del solenoide e ce n’è solo una quantità trascurabile nei fili superconduttori stessi. Ancora una volta, si vede che la quantità di corrente dipende in modo oscillatorio dal flusso del campo magnetico nell’interno del solenoide anche se il campo non raggiunge mai i fili; altra dimostrazione questa della «realtà fisica» del potenziale vettore(24) . Io non so cosa verrà fuori da tutto questo. Ma vediamo qualche possibilità di sviluppo. Prima di tutto, osservate che l’interferenza tra due giunzioni può essere usata per costruire un magnetometro assai sensibile. Se si costruisce una coppia di giunzioni che racchiuda un’area diciamo di 1 mm2 , i massimi della curva di FIGURA 21.8 risulterebbero separati da 2 · 10 6 gauss. È certamente possibile giudicare se ci si trova a 1/10 della distanza tra due picchi; cosicché sarebbe possibile usare una di queste giunzioni per misurare campi magnetici deboli quanto 2 · 10 7 gauss, o per misurare con questa precisione campi più intensi. Ma si potrebbe andare ancora più in là. Per esempio, supponiamo di porre un gruppo di 10 o 20 giunzioni una accanto all’altra e ugualmente spaziate. Allora, si potrebbe realizzare un’interferenza analoga a quella tra 10 o 20 fenditure e ottenere massimi e minimi molto stretti al variare del campo magnetico. Invece di un’interferenza a due fenditure, si potrebbe avere un interferometro a 20 o forse a 100 fenditure per misurare campi magnetici. Forse si può arrivare a predire che – usando gli effetti d’interferenza quantistica – le misure di campo magnetico possano anche arrivare a divenire precise quasi quanto le misure di lunghezza d’onda della luce. Queste dunque sono alcune illustrazioni di ciò che si può fare in tempi moderni – il transistor, il laser e ora queste giunzioni, le cui definitive applicazioni pratiche sono ancora sconosciute. La meccanica quantistica, che fu scoperta nel 1926, ha avuto circa 40 anni di sviluppo e ora, in maniera piuttosto improvvisa, ha cominciato a essere utilizzata in molti modi pratici ed effettivi. Stiamo cominciando a dominare la natura a un livello di meravigliosa delicatezza. Mi dispiace dirvi, signori, che per partecipare a questa avventura è assolutamente necessario che impariate la meccanica quantistica al più presto possibile. La nostra speranza in questo corso è stata quella di trovare un modo di rendervi comprensibile quanto prima i misteri di questa parte della fisica. (22) (23) (24)
R.C. Jaklevic, J. Lambe, A.H. Silver e J.E. Mercereau, Phys. Rev. Letters 12, 159 (1964). R.C. Jaklevic, J. Lambe, A.H. Silver e J.E. Mercereau, Phys. Rev. Letters 12, 274 (1964). Paragrafo 15.5 del vol. 2.
21.8
Registrazione della corrente che attraversa una coppia di giunzioni di Josephson in funzione del campo magnetico presente nella regione compresa tra le due giunzioni (vedi FIGURA 21.7). (Questa registrazione è stata fornita da R.C. Jaklevic, J. Lambe, A.H. Silver e J.E. Mercereau dello Scientific Laboratory, Ford Motor Company.)
Parole conclusive di Feynman
Ebbene, vi ho fatto lezione per due anni e adesso sto per lasciarvi. In un certo senso vorrei scusarmi, e in un altro, no. Spero – in realtà lo so – che due o tre dozzine di voi siano riusciti a seguire tutto ciò che ho detto con grande entusiasmo e che si siano addirittura divertiti. Ma so anche che «ciò di cui è capace l’insegnamento è di assai scarsa efficacia, all’infuori di quelle felici circostanze in cui è praticamente superfluo». Così, per le due o tre dozzine che hanno capito tutto, potrei dire di non aver fatto altro che far loro vedere come stavano le cose. Per gli altri, se ho fatto loro odiare questa materia, ne sono dispiaciuto. Non avevo mai insegnato la fisica elementare prima d’ora e ne chiedo scusa. Spero solo di non avervi messo in guai seri e che voi non abbandoniate questi studi entusiasmanti. Spero anche che qualcun’altro possa insegnarvi tutto ciò in modo tale da non farvi venire l’indigestione e che scopriate un giorno che, dopotutto, la Fisica non è cosi orribile come sembra. Infine, vorrei aggiungere che lo scopo principale del mio insegnamento non è stato quello di prepararvi a un esame, né quello di mettervi in condizioni di lavorare per l’industria o per l’esercito. Più d’ogni altra cosa ho voluto farvi apprezzare un po’ la bellezza del mondo, e quella maniera di guardarlo che è caratteristica dei fisici, che a mio parere è una parte assai importante della vera cultura dei tempi moderni. (Ci sono probabilmente professori di altre materie che troverebbero da obiettare su questo, ma io credo che siano completamente in errore.) Può darsi che voi non vi limitiate ad apprezzare questo tipo di cultura; può darsi che vogliate partecipare alla più grande avventura che la mente umana abbia mai affrontato.
Appendice DAL VOLUME 2 Capitolo 34 Il magnetismo della materia Capitolo 35 Paramagnetismo e risonanza magnetica
Gran parte del contenuto di questo volume si basa su nozioni relative al magnetismo atomico che sono trattate nei capitoli 34 e 35 del volume 2. Per convenienza di quei lettori che non avessero a portata di mano il volume 2, abbiamo qui riportato questi due capitoli.
Il magnetismo della materia
34.1
34
Diamagnetismo e paramagnetismo
In questo capitolo parleremo delle proprietà magnetiche dei materiali. Il materiale che ha le più Ripasso: vol. 2, singolari proprietà magnetiche è naturalmente il ferro. Proprietà simili sono condivise anche par. 15.1, Le forze su dagli elementi nichel, cobalto e – a temperature abbastanza basse (inferiori a 16 ) – gadolinio, una spira di corrente. come anche da diverse leghe speciali. Questo tipo di magnetismo, chiamato ferromagnetismo, è Energia di un dipolo abbastanza singolare e complicato perché lo si debba discutere in uno speciale capitolo. Tuttavia, tutte le sostanze ordinarie mostrano effettivamente degli effetti magnetici, benché molto piccoli: da mille a un milione di volte più piccoli degli effetti nei materiali ferromagnetici. Qui descriveremo il magnetismo ordinario, vale a dire il magnetismo delle sostanze diverse da quelle ferromagnetiche. Questo debole magnetismo è di due tipi. Certi materiali sono attratti verso i campi magnetici; altri ne sono respinti. A differenza degli effetti elettrici sulla materia, i quali fanno sì che i dielettrici vengano sempre attratti, negli effetti magnetici si hanno due segni. Questi due segni si possono far vedere facilmente con l’aiuto di un forte elettromagnete che ha un’espansione polare a forma di punta mentre l’altra è piatta, come è mostrato nella FIGURA 34.1. Il campo magnetico è molto più forte vicino al polo a punta che vicino al polo piatto. Se un pezzetto di materiale è fissato a un lungo filo ed è sospeso fra i poli, ci sarà in generale una piccola forza su di esso. Questa piccola forza si può vedere dal leggero spostamento del materiale sospeso quando il magnete viene eccitato. I pochi materiali ferromagnetici sono attratti molto fortemente verso il polo appuntito; tutti gli altri materiali subiscono soltanto una forza molto debole. Alcuni sono debolmente attratti dal polo appuntito, mentre altri ne sono debolmente respinti. L’effetto si vede nel modo migliore con un piccolo cilindro di bismuto, che è respinto dalla regione dove il campo è intenso. Sostanze che sono respinte in questo modo sono chiamate diamagnetiche. Il bismuto è Filo uno dei più forti materiali diamagnetici, ma anche in questo caso l’effetto è molto debole. Il diamagnetismo è sempre molto debole. Se fra i poli si sospende un pezzetto d’alluminio c’è ugualmente una debole forza, Pezzetto di materiale ma verso il polo a punta. Sostanze come l’alluminio sono chiamate paramagnetiche. (In simili esperienze, nascono delle forze dovute a correnti vorticose quando S N si eccita o si diseccita il magnete e queste possono dar luogo a forti impulsi. Si deve stare attenti a considerare lo spostamento complessivo dopo che l’oggetto Linee di B sospeso si è fermato.) Vogliamo ora descrivere in breve il meccanismo di questi due effetti. In primo luogo, in molte sostanze Poli di un forte elettromagnete gli atomi non hanno momenti magnetici permanenti, o meglio tutti i magneti all’interno di ciascun atomo si equilibrano in modo che il momento complessivo FIGURA 34.1 Un cilindretto di bismuto è debolmente respinto dal polo appuntito; dell’atomo sia nullo. Gli spin e i moti orbitali degli un pezzetto d’alluminio è attratto.
362
Capitolo 34 • Il magnetismo della materia
© 978-8808-22107-0
elettroni si equilibrano tutti esattamente così che ciascun atomo non ha alcun momento magnetico medio. In queste circostanze, quando si crea un campo magnetico, delle piccole correnti extra vengono generate per induzione negli atomi. Secondo la legge di Lenz, queste correnti hanno direzione tale da opporsi all’aumento del campo, perciò i momenti indotti negli atomi sono diretti in senso opposto al campo magnetico. Questo è il meccanismo del diamagnetismo. Ci sono poi delle sostanze i cui atomi possiedono invece un momento magnetico permanente, nei quali gli spin e le orbite degli elettroni hanno una corrente circolante complessiva che non è zero. Perciò oltre all’effetto diamagnetico (che è sempre presente) c’è anche la possibilità di allineare i momenti magnetici individuali. In questo caso i momenti tendono ad allinearsi col campo magnetico (nello stesso modo in cui i dipoli permanenti di un dielettrico vengono allineati dal campo elettrico) e il magnetismo indotto tende a intensificare il campo magnetico. Queste sono le sostanze paramagnetiche. Il paramagnetismo in generale è piuttosto debole perché le forze che producono l’allineamento sono relativamente piccole in confronto alle forze dei moti termici che tendono a scompaginare l’ordine. Ne segue inoltre che il paramagnetismo è di solito sensibile alla temperatura. (Il paramagnetismo che proviene dagli spin degli elettroni di conduzione nei metalli costituisce un’eccezione. Qui non staremo a discutere questo fenomeno.) Nel paramagnetismo ordinario, l’effetto è tanto più forte quanto più bassa è la temperatura. C’è un maggiore allineamento alle basse temperature quando gli effetti di scompaginamento delle collisioni sono minori. Il diamagnetismo, d’altra parte, è più o meno indipendente dalla temperatura. In qualunque sostanza con dei momenti magnetici intrinseci, c’è un effetto diamagnetico così come c’è quello paramagnetico, ma di solito l’effetto paramagnetico domina. Nel capitolo 11 abbiamo descritto un materiale ferroelettrico nel quale tutti i dipoli elettrici vengono allineati per effetto dei mutui campi elettrici. È possibile immaginare anche l’analogo magnetico della ferroelettricità, in cui tutti i momenti atomici si allineano e restano bloccati. Se si fa il calcolo di come questo dovrebbe succedere, si trova che, siccome le forze magnetiche sono tanto più deboli di quelle elettriche, i moti termici distruggerebbero questo allineamento anche a temperature di pochi decimi di kelvin. Perciò è impossibile, a temperatura ordinaria, avere un qualsiasi allineamento permanente dei magneti. D’altra parte questo è proprio ciò che accade nel ferro: qui i momenti si allineano. C’è fra i momenti magnetici di atomi di ferro diversi una forza efficace che è molto, molto più grande dell’interazione magnetica diretta. Si tratta di un effetto indiretto che può essere spiegato soltanto dalla meccanica quantistica. Esso è circa diecimila volte più forte dell’interazione magnetica diretta ed è quello che allinea i momenti nei materiali ferromagnetici. Discuteremo questa speciale interazione in un capitolo successivo. Ora che abbiamo provato a darvi una spiegazione qualitativa del diamagnetismo e del paramagnetismo, ci dobbiamo correggere e dire che non è possibile spiegare in alcun modo corretto, dal punto di vista classico, gli effetti magnetici dei materiali. Tali effetti magnetici sono un fenomeno completamente quantistico. È però possibile impostare dei ragionamenti classici fasulli e così avere qualche idea di come vadano le cose. Si potrebbe riassumere la situazione così. Si possono svolgere dei ragionamenti classici e indovinare qualcosa sul comportamento dei materiali, ma questi ragionamenti non sono in alcun senso «legittimi», perché è un fatto assolutamente essenziale che la meccanica quantistica sta alla base di ciascuno di questi fenomeni magnetici. D’altra parte ci sono situazioni, come in un plasma oppure una regione dello spazio con molti elettroni liberi, in cui gli elettroni obbediscono alle leggi della meccanica classica. In quelle circostanze alcuni dei teoremi del magnetismo classico hanno la loro utilità. Inoltre i ragionamenti classici hanno un certo valore per ragioni storiche. Quelli che riuscirono per primi a capire qualcosa sul significato del comportamento dei materiali magnetici adoperavano ragionamenti classici. Infine, come abbiamo già spiegato, la meccanica classica ci può fornire delle utili congetture su cosa può succedere, anche se la maniera veramente corretta di studiare questo argomento sarebbe quella di imparare prima la meccanica quantistica e poi spiegare il magnetismo per mezzo di questa. D’altra parte non vogliamo aspettare di aver imparato la meccanica quantistica da cima a fondo per capire una cosa tanto semplice come il diamagnetismo. Ci dovremo appoggiare alla meccanica classica per avere una specie di mezza spiegazione di ciò che avviene, pur sapendo
363
34.2 • Momenti magnetici e momento angolare
© 978-8808-22107-0
che i ragionamenti non sono veramente corretti. Stabiliremo perciò una serie di teoremi sul magnetismo classico che vi confonderanno perché provano cose diverse. Eccetto l’ultimo, questi teoremi saranno tutti sbagliati. Per giunta saranno tutti sbagliati come descrizione del mondo fisico, perché la meccanica quantistica viene ignorata.
34.2
Momenti magnetici e momento angolare
Il primo teorema che vogliamo provare in base alla meccanica classica è il seguente. Se un elettrone si muove su un’orbita circolare (per esempio ruotando intorno a un nucleo per effetto di una forza centrale), c’è un rapporto preciso fra il momento magnetico e il momento angolare. Chiamiamo J il momento angolare e µ il momento magnetico dell’elettrone sull’orbita. Il modulo del momento angolare è la massa dell’elettrone, per la velocità, per il raggio (FIGURA 34.2). Esso è diretto perpendicolarmente al piano dell’orbita. Si ha J = mvr (34.1)
J
r m, q
v
(Questa naturalmente è una formula non relativistica, ma è una buona approssimazione negli atomi perché per gli elettroni di cui si tratta v/c è in FIGURA 34.2 Il momento magnetico � di un’orbita circolare è il prodotto di q/2m per il momento generale dell’ordine di e2 /~c = 1/137, ossia circa l’1%.) angolare J. Il momento magnetico della stessa orbita è dato dalla corrente per l’area (vedi paragrafo 14.5). La corrente è la carica per unità di tempo che passa per un punto qualunque dell’orbita, ossia è la carica q per la frequenza di rotazione. La frequenza è la velocità divisa per la circonferenza dell’orbita; perciò è v I=q 2⇡r L’area è ⇡r 2 e quindi il momento magnetico è µ=
qvr 2
(34.2)
Anche questo è diretto perpendicolarmente al piano dell’orbita. Perciò J e µ hanno la stessa direzione: q µ= J (orbita) (34.3) 2m Il loro rapporto non dipende né dalla velocità né dal raggio. Per qualsiasi particella che si muove in un’orbita circolare il momento magnetico è uguale a q/2m volte il momento angolare. Per un elettrone la carica è negativa e la possiamo chiamare qe ; perciò per un elettrone si ha µ=
qe J (orbita dell’elettrone) 2m
(34.4)
Questo è ciò che ci si aspetterebbe classicamente e, fatto piuttosto miracoloso, è vero anche quantisticamente. È una delle cose che tornano. Però se si continua con la fisica classica, si trovano altri casi in cui ci dà risposte sbagliate ed è un gran bel gioco cercare di ricordare cos’è giusto e cos’è sbagliato. È meglio dirvi subito che cosa è vero in generale in meccanica quantistica. Primo, l’equazione (34.4) è vera per il moto orbitale, ma questo non è il solo magnetismo che esista. L’elettrone ha anche la rotazione di spin intorno al proprio asse (qualcosa di simile alla Terra che ruota intorno al suo asse) e come risultato di questo moto rotatorio possiede sia un momento angolare sia un momento magnetico. Ma per ragioni che sono puramente quantistiche – non c’è alcuna spiegazione classica – il rapporto µ/J per lo spin dell’elettrone è due volte più grande che per il moto orbitale del medesimo elettrone: µ=
qe J (spin elettronico) m
(34.5)
364
Capitolo 34 • Il magnetismo della materia
© 978-8808-22107-0
In qualsiasi atomo ci sono, parlando in generale, diversi elettroni e c’è una certa combinazione di rotazioni di spin e orbitali che determina il momento angolare totale e il momento magnetico totale. Benché non ci sia nessuna ragione classica perché debba essere così, è sempre vero in meccanica quantistica che (per un atomo isolato) la direzione del momento magnetico è esattamente opposta a quella del momento angolare. Il rapporto fra i due non è necessariamente qe /m oppure qe /2m, ma qualcosa di intermedio, perché c’è una mescolanza di contributi dalle orbite e dagli spin. Possiamo scrivere ✓q ◆ e µ= g J (34.6) 2m
dove g è un fattore caratteristico dello stato dell’atomo. Sarebbe 1 per un momento orbitale puro, 2 per un momento di spin puro ed è un numero intermedio per un sistema complesso com’è un atomo. Questa formula naturalmente non ci dice molto. Dice che il momento magnetico è parallelo al momento angolare, ma può avere un modulo qualunque. La forma dell’equazione (34.6) è comoda, però, perché g – chiamato «fattore g di Landé» – è una costante adimensionale il cui valore è dell’ordine di uno. È uno dei compiti della meccanica quantistica predire il fattore g per ogni particolare stato atomico. Potrebbe interessarvi anche ciò che accade nei nuclei. Nei nuclei ci sono protoni e neutroni che si muovono in giro secondo certe orbite e nello stesso tempo – come l’elettrone – hanno uno spin intrinseco. Anche qui il momento magnetico è parallelo al momento angolare. Soltanto che ora l’ordine di grandezza del rapporto dei due è quello che ci si aspetterebbe per un protone che si muove in circolo, con m nell’equazione (34.3) uguale alla massa del protone. Perciò si usa scrivere per i nuclei qe + µ = g* J (34.7) , 2mp dove mp è la massa del protone e g – chiamato «fattore g nucleare» – è un numero vicino a 1, da determinarsi per ogni nucleo. Un’altra importante differenza nel caso dei nuclei è che il momento magnetico di spin del protone non ha un fattore g uguale a 2, come l’elettrone. Per un protone si ha g = 2 · 2,79. Cosa piuttosto sorprendente, anche il neutrone ha un momento magnetico di spin e il rapporto fra questo e il momento angolare è 2 · ( 1,93). Il neutrone, in altre parole, non è esattamente «neutro» dal punto di vista magnetico. È come un magnetino, e ha il tipo di momento magnetico che dovrebbe avere una carica rotante negativa.
34.3
La precessione dei magneti atomici
Una delle conseguenze di avere il momento magnetico proporzionale al momento angolare è che un magnete atomico posto in un campo magnetico subisce una precessione. Ragioniamo dapprima classicamente. Supponiamo di avere un momento magnetico µ sospeso liberamente in un campo magnetico uniforme. Esso subirà un momento di forza ⌧ uguale a µ ⇥ B che tende ad allinearlo con la direzione del campo. Ma il magnete atomico è un giroscopio: ha un momento angolare J. Perciò il momento di forza non avrà per effetto di allineare il magnete. Invece il magnete subirà una precessione, come si è visto quando abbiamo analizzato il giroscopio, nel cap. 20 del vol. 1. Il momento angolare – e con esso il momento magnetico – precede intorno a un asse parallelo al campo magnetico e si può trovare la velocità di precessione con lo stesso metodo visto nel cap. 20 del vol. 1. Supponiamo che in un piccolo intervallo di tempo t il momento angolare cambi da J a J 0, come mostrato nella FIGURA 34.3, conservando sempre lo stesso angolo ✓ con la direzione del campo magnetico B. Chiamiamo !p la velocità angolare della precessione così che nel tempo t l’angolo di precessione sia !p t. Dalla geometria della figura vediamo che il cambiamento del momento angolare nel tempo t è J = (J sen ✓)(!p t)
365
34.4 • Il diamagnetismo
© 978-8808-22107-0
Perciò il cambiamento del momento angolare nell’unità di tempo è dJ = !p J sen ✓ dt
(34.8)
che deve essere uguale al momento di forza ⌧ = µB sen ✓
(34.9)
La velocità angolare della precessione è dunque !p =
µ B J
J
(34.10)
J'
Sostituendo µ/J per mezzo dell’equazione (34.6) si vede che per un sistema atomico si ha qe B !p = g (34.11) 2m cioè la frequenza di precessione è proporzionale a B. È utile ricordare che per un atomo (o un elettrone) si ha fp =
!p = (1,4 megacicli/gauss)gB 2⇡
B
(34.12)
34.3 Un oggetto con un momento angolare J e un momento magnetico parallelo � posto in un campo magnetico B precede con la velocità angolare ωp . FIGURA
e per un nucleo fp =
!p = (0,76 kilocicli/gauss)gB 2⇡
(34.13)
(Le formule per gli atomi e i nuclei sono diverse soltanto per la diversa convenzione per g nei due casi.) Secondo la teoria classica, dunque, le orbite elettroniche – e gli spin – di un atomo dovrebbero precedere in un campo magnetico. Questo è vero anche in meccanica quantistica? È essenzialmente vero, ma il significato della «precessione» è diverso. In meccanica quantistica non si può parlare della direzione del momento angolare nello stesso senso che si adopera classicamente; ciò nonostante c’è un’analogia molto stretta, così stretta che si continua a parlare di «precessione». Ne discuteremo più avanti, quando parleremo del punto di vista quantistico.
34.4
Il diamagnetismo
Vogliamo ora considerare il diamagnetismo dal punto di vista classico. Lo si può ricavare in diverse maniere, ma una delle più eleganti è la seguente. Supponiamo di creare lentamente un campo magnetico in prossimità di un atomo: mentre il campo magnetico varia, un campo elettrico viene generato per induzione magnetica. Secondo la legge di Faraday l’integrale di linea di E intorno a qualunque cammino chiuso è la variazione per unità di tempo del flusso magnetico attraverso il cammino. Supponiamo di scegliere come cammino un cerchio di raggio r concentrico col centro dell’atomo, come mostra la FIGURA 34.4. Il campo elettrico tangenziale medio E intorno a questo cammino è dato da d E 2⇡r = (B⇡r 2 ) dt e quindi c’è un campo elettrico circolante la cui intensità è E=
r dB 2 dt
Il campo elettrico indotto agendo su un elettrone dell’atomo produce un momento di forza uguale a qe Er, che deve uguagliare la variazione per unità di tempo del momento angolare, cioè dJ/dt: dJ qe r 2 dB = dt 2 dt
∆J
ωp
(34.14)
366
Capitolo 34 • Il magnetismo della materia
© 978-8808-22107-0
Integrando rispetto al tempo a partire dal campo nullo, si trova che la variazione del momento angolare dovuta all’introduzione del campo è
B
J= Percorso Γ r q F
FIGURA
34.4
in un atomo.
Le forze elettriche indotte sugli elettroni
qe r 2 B 2
(34.15)
Questo è il momento angolare extra che viene dalla spinta data agli elettroni quando si inserisce il campo. Questo momento angolare in più produce un momento magnetico extra che, trattandosi d’un moto orbitale, non è che il prodotto di qe /2m per il momento angolare. Il momento diamagnetico indotto è dunque qe 2m
µ=
J=
qe2 r 2 B 4m
(34.16)
Il segno meno (si può vedere che è quello giusto ricorrendo alla legge di Lenz) vuol dire che il momento in più è opposto al campo magnetico. Desideriamo scrivere l’equazione (34.16) in un modo un po’ diverso. Il simbolo r 2 che vi appare è il raggio misurato a partire da un asse che attraversa l’atomo parallelamente a B; perciò se B giace nella direzione z, r 2 vale x 2 + y 2 . Se consideriamo atomi a simmetria sferica (oppure prendiamo la media sugli atomi coi loro assi naturali orientati in tutte le direzioni) la media di x 2 + y 2 è i 2/3 della media del quadrato della distanza radiale vera dal punto centrale dell’atomo. Perciò è di solito più conveniente scrivere l’equazione (34.16) nella forma µ=
qe2 2 hr im B 6m
(34.17)
Abbiamo trovato che in ogni caso c’è un momento atomico indotto proporzionale al campo magnetico B e opposto a esso. Questo è il diamagnetismo della materia. È questo effetto magnetico la causa della piccola forza che un pezzetto di bismuto subisce in un campo magnetico non uniforme. (La forza si potrebbe calcolare andando a cercare l’energia del momento indotto nel campo e vedendo come questa energia cambia quando il materiale è introdotto nella regione del campo intenso o rimosso da questa.) Abbiamo ancora un problema: qual è il raggio quadratico medio hr 2 im ? La meccanica classica non ci può dar risposta. Dobbiamo tornare indietro e ricominciare con la meccanica quantistica. In un atomo non possiamo in realtà dire dove si trova un elettrone, ma conosciamo soltanto la probabilità che si trovi in un certo posto. Se interpretiamo hr 2 im come la media del quadrato della distanza dal centro per la data distribuzione di probabilità, il momento diamagnetico dato dalla meccanica quantistica è proprio lo stesso della formula (34.17). Questa equazione dà naturalmente il momento dovuto a un elettrone: il momento totale è dato dalla somma su tutti gli elettroni dell’atomo. La cosa sorprendente è che il ragionamento classico e quello quantistico diano la stessa risposta, benché – come vedremo – il ragionamento classico che dà l’equazione (34.17) non sia veramente valido in meccanica classica. Lo stesso effetto diamagnetico si presenta anche quando un atomo ha un momento permanente. Il sistema allora precede nel campo magnetico. Mentre l’atomo tutto intero precede, esso acquista una piccola velocità angolare addizionale e questa lenta rotazione dà una piccola corrente che rappresenta una correzione del momento magnetico. Questo non è che l’effetto diamagnetico rappresentato in un modo diverso. Ma non dobbiamo veramente preoccuparci di questo quando trattiamo il paramagnetismo. Se si calcola prima l’effetto diamagnetico, come qui abbiamo fatto, non c’è bisogno di occuparsi del fatto che c’è una piccola corrente extra dovuta alla precessione: ciò è stato già incluso nel termine diamagnetico.
34.5
Il teorema di Larmor
Possiamo già concludere qualcosa dai risultati fin qui ottenuti. Prima di tutto, nella teoria classica il momento µ è sempre proporzionale a J, con una data costante di proporzionalità per un
34.5 • Il teorema di Larmor
© 978-8808-22107-0
certo atomo. Non c’è lo spin degli elettroni e la costante di proporzionalità è sempre qe /2m; vale a dire che nell’equazione (34.6) si dovrebbe porre g = 1. Il rapporto tra µ e J sarebbe indipendente dal moto interno degli elettroni. Perciò, secondo la teoria classica, tutti i sistemi di elettroni avrebbero la stessa velocità angolare di precessione. (Questo non è vero in meccanica quantistica.) Questo risultato è connesso a un teorema di meccanica classica che ora vorremmo dimostrare. Supponiamo di avere un gruppo di elettroni tenuti insieme dall’attrazione verso un punto centrale, come gli elettroni atomici sono attratti dal nucleo. Questi elettroni interagiranno anche fra loro e potranno in generale possedere dei moti complicati. Immaginiamo di aver risolto le equazioni del moto in assenza di campo magnetico e di voler conoscere quale sarebbe il moto in presenza di un debole campo magnetico. Il teorema dice che il moto in un debole campo magnetico coincide sempre con una delle soluzioni in assenza del campo, con l’aggiunta di una rotazione intorno all’asse del campo con la velocità angolare !L = qe B/2m. (Questa coincide con !p se si pone g = 1.) Ci sono naturalmente molti moti possibili. L’interessante è che per ogni moto senza il campo magnetico c’è un moto corrispondente nel campo, che è il moto originario, più una rotazione uniforme. Questo è chiamato teorema di Larmor e !L è detta frequenza di Larmor. Faremo vedere come il teorema può essere provato, ma lasceremo a voi di elaborare i dettagli. Prendiamo dapprima un elettrone in un campo di forza centrale. Sia F(r) la forza su di esso, diretta verso il centro. Se ora introduciamo un campo magnetico uniforme, ci sarà una forza in più, qv ⇥ B; perciò la forza totale sarà F(r) + qv ⇥ B
(34.18)
Ora consideriamo lo stesso sistema dal punto di vista di un riferimento che ruota con la velocità angolare ! intorno a un asse parallelo a B passante per il centro di forza. Questo non è più un riferimento inerziale e perciò dobbiamo introdurre le pseudoforze appropriate, cioè la forza centrifuga è quella di Coriolis, di cui si è parlato nel cap. 19 del vol. 1. Abbiamo trovato che in un riferimento che ruota con la velocità angolare !, c’è una forza tangenziale apparente, proporzionale a vr , cioè alla componente radiale della velocità: Ft = 2m!vr
(34.19)
E c’è anche una forza radiale apparente che è data da Fr = m!2 r + 2m!vt
(34.20)
dove vt è la componente tangenziale della velocità, misurata nel riferimento rotante. (La componente radiale vr è la stessa nei due riferimenti.) Ora, per velocità angolari molto piccole (cioè per !r ⌧ vt ) si può trascurare il primo termine (centrifugo) nell’equazione (34.20) in confronto al secondo (Coriolis). Allora le equazioni (34.19) e (34.20) possono essere riunite scrivendo F = 2m! ⇥ v
(34.21)
Se ora combiniamo rotazione e campo magnetico, dovremo aggiungere la forza data dall’equazione (34.21) a quella dell’equazione (34.18). La forza totale sarà F(r) + qv ⇥ B + 2mv ⇥ !
(34.22)
(l’ultimo termine si ottiene invertendo il prodotto vettoriale e il segno dell’equazione (34.21)). Esaminando questo risultato vediamo che se è 2m! = qB i due termini a destra si compensano e nel riferimento rotante l’unica forza è F(r). Il moto dell’elettrone è perciò proprio lo stesso che senza il campo magnetico e, naturalmente, senza rotazione. Abbiamo provato il teorema di Larmor per un elettrone. Siccome la prova postula
367
368
Capitolo 34 • Il magnetismo della materia
© 978-8808-22107-0
che ! sia piccola, questo vuol dire che il teorema è vero soltanto per campi magnetici deboli. L’unica cosa che si potrebbe chiedere come ulteriore miglioramento è di considerare il caso di molti elettroni che interagiscono mutuamente fra loro, tutti però sottoposti al medesimo campo centrale, e provare di nuovo il teorema. Dunque, per quanto un atomo sia complesso, se c’è in esso un campo centrale, il teorema è vero. Ma qui la meccanica classica raggiunge il suo limite, perché di fatto non è vero che la precessione abbia luogo in questo modo. La frequenza di precessione !p dell’equazione (34.11) è uguale a !L soltanto se g è per caso uguale a 1.
34.6
La fisica classica non prevede né il diamagnetismo né il paramagnetismo
Desideriamo ora dimostrare che secondo la meccanica classica non ci può essere né diamagnetismo né paramagnetismo. Può sembrare pazzesco: prima abbiamo provato l’esistenza di paramagnetismo, diamagnetismo, orbite in precessione e così via, e ora vogliamo provare che è tutto sbagliato. Si! Proveremo che se si segue la meccanica classica abbastanza a fondo, tali effetti magnetici non ci sono: essi si eliminano per compensazione. Se si comincia un ragionamento classico a un certo punto e non lo si porta abbastanza lontano, si può ottenere il risultato che si vuole. Ma l’unica prova legittima e corretta mostra che non ci sono effetti magnetici di alcun tipo. È una conseguenza della meccanica classica che se si ha un sistema di qualunque tipo – un gas di elettroni, protoni e quant’altro – chiuso in una scatola in modo che il tutto non può girare, non ci sarà alcun effetto magnetico. È possibile avere un effetto magnetico se si ha un sistema isolato – come una stella, che è tenuta insieme da se stessa – che può prendere a ruotare quando si applica il campo magnetico. Ma se si ha una porzione di materiale che è mantenuta ferma, così che non può mettersi a girare, allora non ci sono effetti magnetici. Quello che si intende dicendo che la rotazione deve essere impedita si può riassumere in questo modo: si suppone che a una data temperatura ci sia un solo stato di equilibrio termico. Allora il teorema dice che se si introduce un campo magnetico e si aspetta che il sistema raggiunga l’equilibrio termico, non ci sarà né paramagnetismo né diamagnetismo; non ci sarà alcun momento magnetico indotto. Prova: secondo la meccanica statistica la probabilità che un sistema si trovi in un dato stato – qualunque – di moto, è proporzionale a e U/kt , dove U è l’energia di quel moto. Ora, qual è l’energia del moto? Per una particella che si muove in un campo magnetico costante, l’energia è l’ordinaria energia potenziale più (1/2) mv 2 , senza che il campo magnetico ci aggiunga nulla. (Sapete che la forza dovuta al campo elettromagnetico è q(E + v ⇥ B), e la potenza F · v è semplicemente qE · v, che non è alterata dal campo magnetico.) Perciò l’energia di un sistema, che si trovi o meno in un campo magnetico, è sempre data dall’energia cinetica, più l’energia potenziale. Siccome la probabilità di qualunque moto dipende soltanto dall’energia – cioè dalla velocità e dalla posizione – essa è la medesima sia che si abbia o no un campo magnetico. Per l’equilibrio termico, perciò, il campo magnetico non ha effetto. Se abbiamo un sistema in una scatola e poi un altro sistema in una seconda scatola, questa volta con un campo magnetico, la probabilità di avere un qualunque valore assegnato della velocità in qualunque punto della prima scatola è la stessa che nella seconda. Se nella prima scatola la corrente media circolante è nulla (come deve essere se c’è equilibrio con le pareti immobili) non si può avere un momento magnetico medio. Siccome nella seconda scatola tutti i moti sono i medesimi, nemmeno in questa c’è un momento magnetico. Dunque, se la temperatura viene mantenuta costante e si ristabilisce l’equilibrio termico dopo che si è introdotto il campo, non ci può essere – secondo la meccanica classica – alcun momento magnetico indotto dal campo. Soltanto dalla meccanica quantistica si può ottenere una comprensione soddisfacente dei fenomeni magnetici. Disgraziatamente, non si può supporre che abbiate una completa comprensione della meccanica quantistica, perciò non si può dire che questo sia il momento adatto per discutere tale argomento. D’altra parte non è detto che si debba sempre imparare qualcosa imparando prima le regole esatte e poi imparando come si applicano nei diversi casi. Quasi tutti gli argomenti che abbiamo preso in considerazione in questo corso sono stati trattati in un modo diverso. Nel caso
34.7 • Il momento angolare nella meccanica quantistica
© 978-8808-22107-0
dell’elettricità si sono scritte le equazioni di Maxwell alla «pagina uno» e poi se ne sono dedotte tutte le conseguenze. Questo è un metodo. Ma ora non vogliamo cercare di cominciare una nuova «pagina uno», scrivendo le equazioni della meccanica quantistica e deducendo tutto da quelle. Semplicemente, ci tocca dirvi alcune delle conseguenze della meccanica quantistica prima che abbiate imparato da dove vengono. Perciò andiamo avanti.
34.7
Il momento angolare nella meccanica quantistica
Vi è stata già data la relazione fra momento magnetico e momento angolare. Questo va benissimo. Ma il momento magnetico e il momento angolare cosa vogliono dire in meccanica quantistica? In meccanica quantistica risulta che è meglio definire certe cose, come i momenti magnetici, per mezzo di altri concetti, come l’energia, allo scopo di essere sicuri che si sa quello che si vuol dire. Ora, è facile definire un momento magnetico per mezzo dell’energia, perché l’energia di un momento in un campo magnetico è, nella teoria classica, µ · B. Perciò in meccanica quantistica si è adottata la seguente definizione: se si calcola l’energia di un sistema in un campo magnetico e si trova che è proporzionale all’intensità del campo (per campi piccoli), il coefficiente viene chiamato componente del momento magnetico in direzione del campo. (Per il nostro lavoro attuale non c’è bisogno di essere così eleganti; possiamo sempre pensare al momento magnetico nel senso ordinario, parzialmente classico.) Desideriamo ora discutere l’idea di momento angolare in meccanica quantistica, o piuttosto discutere le caratteristiche di ciò che in meccanica quantistica viene chiamato momento angolare. Vedete: quando si passa a nuovi tipi di leggi non si può semplicemente supporre che ciascuna parola continuerà a significare esattamente la stessa cosa. Potete pensare, mettiamo: «Oh! lo so cos’è il momento angolare. È quella cosa che cambia per effetto di una coppia». Ma una coppia cos’è? In meccanica quantistica dobbiamo avere definizioni nuove per grandezze vecchie. Sarebbe perciò meglio – a rigore – chiamarlo con qualche altro nome, come «momento quantangolare» o qualcosa di simile, perché si tratta del momento angolare come lo definisce la meccanica quantistica. Ma se si può trovare una grandezza della meccanica quantistica che è identica alla nostra vecchia idea di momento angolare quando il sistema diventa abbastanza grande, non c’è alcuna utilità a inventare una parola extra. Si potrebbe altrettanto bene chiamarla appunto momento angolare. Con questo sottinteso, questa cosa strana che stiamo per descrivere è il momento angolare. È quella cosa che, in un grande sistema, riconosciamo essere il momento angolare della meccanica classica. Prendiamo in primo luogo un sistema in cui il momento angolare si conserva, per esempio un atomo che se ne sta per conto suo nello spazio vuoto. Ora, un tale oggetto (come la Terra che ruota sul suo asse) potrebbe, nel senso ordinario, ruotare intorno a qualunque asse si volesse scegliere. E per un dato spin, ci potrebbero essere tanti «stati» diversi, tutti con la stessa energia, ciascuno «stato» corrispondente a una particolare direzione dell’asse del momento angolare. Dunque nella teoria classica, per un dato momento angolare, c’è un infinito numero di stati possibili, tutti con la stessa energia. Risulta però che in meccanica quantistica accadono parecchie cose strane. In primo luogo, il numero di stati nei quali un sistema può esistere è limitato, ce n’è soltanto un numero finito. Se il sistema è piccolo, tale numero finito è molto piccolo e se il sistema è grande il loro numero diventa molto, molto grande. In secondo luogo non si può descrivere uno «stato» dando la direzione del suo momento angolare, ma soltanto dando la componente del momento angolare rispetto a una certa direzione: diciamo la direzione z. Classicamente un oggetto con un certo momento angolare totale J potrebbe avere per la componente z qualsiasi valore da +J a J. Ma in meccanica quantistica la componente z del momento angolare può avere soltanto certi valori discreti. Qualunque dato sistema – un determinato atomo, un nucleo o qualunque cosa – con una data energia, possiede un numero caratteristico j e la sua componente z del momento angolare può essere soltanto uno del seguente gruppo di valori: j~ ( j
1) ~ ( j
2) ~
...
(j
2) ~
(j
1) ~
j~
(34.23)
369
370
Capitolo 34 • Il magnetismo della materia
© 978-8808-22107-0
La più grande componente z è j volte ~; quella immediatamente inferiore è minore di un ~, e così via fino a j~. Il numero j è chiamato «spin del sistema». (Qualcuno lo chiama «numero quantico del momento angolare totale», ma noi lo chiameremo «spin».) Forse vi dà pensiero che quello che si è detto possa essere vero soltanto per qualche asse z «speciale». Ma non è così. Per un sistema il cui spin è j, la componente del momento angolare rispetto a qualunque asse può avere soltanto i valori indicati in (34.23). Benché la cosa sia del tutto misteriosa, vi si chiede di accettarla, semplicemente – per il momento. Ci torneremo e discuteremo la questione più avanti. Per lo meno vi farà piacere sentire che la componente z va da un certo numero a meno lo stesso numero, così che almeno non dobbiamo decidere qual è la direzione positiva dell’asse z. (Certo se si fosse detto che va da + j a meno un diverso valore, questo sarebbe infinitamente misterioso perché non si sarebbe potuto definire l’asse z diretto nel senso opposto.) Se la componente z del momento angolare deve scendere per valori interi da + j a j, allora j dovrà essere intero. No! Non del tutto; il doppio di j deve essere un intero: è soltanto la differenza fra + j e j che deve essere un intero. Perciò in generale lo spin j è intero oppure semi-intero, a seconda se 2 j è pari o dispari. Prendiamo per esempio un nucleo come il litio che ha uno spin di tre mezzi, j = 3/2. Allora il momento angolare rispetto all’asse z, in unità di ~, deve avere uno dei seguenti valori: +3/2 + 1/2 1/2 3/2 Ci sono quattro possibili stati, ciascuno con la medesima energia se il nucleo si trova nello spazio vuoto, senza campi esterni. Se abbiamo un sistema il cui spin è due, allora la componente z del momento angolare, in unità ~, ha soltanto i valori 2
1
0
1
2
Se si conta quanti stati ci sono per un dato j, si hanno 2 j + 1 possibilità. In altre parole se mi dite qual è l’energia e anche lo spin j, risulta che ci sono esattamente 2 j + 1 stati con quell’energia, ciascuno dei quali corrisponde a uno dei diversi valori possibili della componente z del momento angolare. Desideriamo aggiungere un altro fatto. Se si sceglie a caso un atomo qualunque il cui j è noto e si misura la componente z del momento angolare, si può ottenere uno qualunque dei valori possibili e ciascun valore è ugualmente probabile. Tutti questi stati sono infatti degli stati singoli e ciascuno va altrettanto bene come qualsiasi altro. Ciascuno ha lo stesso «peso» nell’universo. (Si suppone che non si sia fatto nulla per selezionare uno speciale campione.) Incidentalmente, questo fatto ha il suo semplice analogo classico. Se si pone lo stesso problema classicamente – se cioè si chiede la probabilità di un particolare valore per la componente z del momento angolare se si prende a caso un campione di sistemi, tutti con lo stesso momento angolare totale – la risposta è che tutti i valori dal massimo al minimo sono ugualmente probabili. (Potete ricavarlo facilmente.) Questo risultato classico corrisponde all’uguale probabilità delle 2 j + 1 possibilità della meccanica quantistica. Da quello che si è ottenuto fin qui si può trarre un’altra conclusione interessante e un po’ sorprendente. In certi calcoli classici, la grandezza che figura nel risultato finale è il quadrato del modulo del momento angolare J, in altre parole J · J. Risulta che è spesso possibile indovinare la formula quantistica corretta usando il calcolo classico e la seguente semplice regola: sostituire J 2 = J · J con j( j + 1)~2 . Questa regola viene usata comunemente e di solito dà il risultato corretto, ma non sempre. Si può fare il seguente ragionamento per mostrare perché ci si può aspettare che questa regola funzioni. Il prodotto scalare J · J può essere scritto J · J = Jx2 + Jy2 + Jz2 Siccome è uno scalare, dovrebbe essere lo stesso per ogni orientazione dello spin. Mettiamo di prendere dei campioni a caso di un qualunque sistema atomico e di fare delle misure di Jx2 , Jy2 o Jz2 , il valore medio dovrebbe essere lo stesso per tutte e tre le grandezze. (Non c’è alcuna speciale distinzione per nessuna delle tre direzioni.) Perciò la media di J · J non è che il triplo della media
34.8 • L’energia magnetica degli atomi
© 978-8808-22107-0
del quadrato di una qualunque componente, mettiamo Jz2 : hJ · Jim = 3 hJz2 im Ma siccome J · J è lo stesso per tutte le orientazioni, la sua media, naturalmente, non è che il suo valore costante; abbiamo dunque J · J = 3 hJz2 im (34.24) Se ora diciamo di voler usare la stessa equazione in meccanica quantistica, possiamo facilmente trovare hJz2 im . Basta infatti sommare 2 j + 1 possibili valori di Jz2 e dividere per il loro numero: hJz2 im =
j2 + ( j
1)2 + ... + ( j + 1)2 + ( j)2 2 ~ 2j + 1
(34.25)
Per un sistema con uno spin di 3/2 risulta: hJz2 im =
(3/2)2 + (1/2)2 + ( 1/2)2 + ( 3/2)2 2 5 2 ~ = ~ 4 4
Concludiamo che è J · J = 3 hJz2 im = 3
! 5 2 3 3 ~ = + 1 ~2 4 2 2
Lasciamo a voi di dimostrare che l’equazione (34.25) insieme con l’equazione (34.24) dà il risultato generale J · J = j( j + 1) ~2 (34.26) Benché classicamente si possa pensarep che il valore più grande possibile della componente z di J sia proprio il modulo di J – cioè J · J – quantisticamente il massimo di Jz è sempre un p po’ meno di tanto, perché j~ è sempre minore di j( j + 1) ~. Il momento angolare non è mai «completamente nella direzione z».
34.8
L’energia magnetica degli atomi
Vogliamo ora tornare a parlare del momento magnetico. S’è detto che in meccanica quantistica il momento magnetico di un dato sistema atomico può essere scritto in funzione del momento angolare per mezzo dell’equazione (34.6), cioè ✓q ◆ e µ= g J (34.27) 2m
dove qe e m sono la carica e la massa dell’elettrone. Un magnete atomico posto in un campo magnetico esterno avrà un’energia magnetica extra che dipende dalla componente del suo momento magnetico nella direzione del campo. Sappiamo che si ha Umag = µ · B (34.28) e scegliendo l’asse z nella direzione di B: Umag = µz B
(34.29)
Usando l’equazione (34.27) abbiamo Umag = g
✓q ◆ e Jz B 2m
La meccanica quantistica dice che Jz può avere soltanto certi valori: j~, ( j 1)~, ..., j~. Perciò l’energia magnetica di un sistema atomico non è arbitraria; può avere soltanto certi valori. Il suo massimo valore, per esempio, è ✓q ◆ e g ~jB 2m
371
372
Capitolo 34 • Il magnetismo della materia
34.5 Le possibili energie magnetiche di un sistema atomico con spin 3/2 in un campo magnetico B.
© 978-8808-22107-0
FIGURA
34.6 I due possibili stati d’energia di un elettrone in un campo magnetico B.
Umag
Umag Jz = +(3/2)
FIGURA
Jz = +(1/2)
Jz = +(1/2) 0
0
B
B Jz = –(1/2)
Jz = –(1/2) Jz = –(3/2)
La grandezza qe ~/2m si chiama di solito «magnetone di Bohr» e viene indicata con µB : µB =
qe ~ 2m
I valori possibili dell’energia magnetica di solito sono Umag = g µB B
Jz ~
dove Jz /~ assume i valori possibili j, ( j 1), ( j 2), ..., ( j + 1), j. In altre parole, l’energia di un sistema atomico, quando questo viene messo in un campo magnetico, cambia di una quantità proporzionale al campo e proporzionale a Jz . Si dice che l’energia di un sistema atomico è «scissa in 2 j + 1 livelli» del campo magnetico. Per esempio un atomo la cui energia è U0 quando è fuori dal campo magnetico e il cui j è 3/2, avrà quattro possibili energie quando lo si pone in un campo. Possiamo indicare queste energie con un diagramma dei livelli energetici come quello mostrato in FIGURA 34.5. Qualunque atomo singolo può avere soltanto una delle quattro possibili energie in un generico campo dato B. Questo è ciò che la meccanica quantistica dice sul comportamento di un sistema atomico in un campo magnetico. Il più semplice sistema «atomico» è un elettrone singolo. Lo spin dell’elettrone è 1/2 e perciò ci sono due possibili stati: ( +~/2 Jz = ~/2 Per un elettrone in quiete (cioè in assenza di moto orbitale) il momento magnetico dello spin ha 2 come valore di g, così che l’energia magnetica può essere ±µB B. Le energie possibili in un campo magnetico sono indicate in FIGURA 34.6. Parlando alla buona, si dice che l’elettrone ha il suo spin «su» (nella direzione del campo) oppure «giù» (opposto al campo). Per sistemi con spin più alto ci sono più stati. Si può pensare al loro spin come «su» o «giù» o puntato secondo un «angolo» intermedio, a seconda del valore di Jz . Useremo questi risultati quantistici per discutere le proprietà magnetiche dei materiali nel prossimo capitolo.
35
Paramagnetismo e risonanza magnetica
35.1
Stati magnetici quantizzati
Nel capitolo precedente si è descritto come avviene che in meccanica quantistica il momento angolare di un oggetto non abbia una direzione arbitraria, ma la sua componente rispetto a un dato asse possa prendere soltanto certi valori discreti, ugualmente spaziati. È una cosa urtante e singolare. Potreste pensare che forse non si dovrebbe entrare in certi argomenti finché le vostre menti non siano più evolute e pronte ad accettare questo tipo d’idea. Di fatto, le vostre menti non diventeranno mai più evolute nel senso di essere capaci di accettare facilmente una simile cosa. Non c’è alcun modo descrittivo di renderla intelligibile che non sia così sottile ed evoluto nella sua forma da rendere la spiegazione più complicata della cosa che si tenta di spiegare. Il comportamento della materia a una scala molto piccola – come si è osservato più volte – è diverso da quello a cui siamo abituati ed è davvero molto strano. Mentre andiamo avanti con la fisica classica, è una buona idea cercare di acquisire una sempre maggiore conoscenza del comportamento delle cose a una scala piccolissima, dapprima come una sorta di esperienza, senza alcuna profonda comprensione. La comprensione di queste cose arriva molto lentamente, se mai arriva. Naturalmente si acquista una migliore capacità di sapere che cosa accadrà in una situazione quantistica – se questo è ciò che s’intende per comprensione – ma non si riesce mai ad acquistare la sensazione soddisfacente che queste regole quantistiche siano «naturali». Naturalmente lo sono, ma esse non sono naturali per la nostra personale esperienza a livello ordinario. Occorre spiegare che l’atteggiamento che prenderemo riguardo a questa regola sul momento angolare è del tutto diverso da molte delle altre cose di cui si è parlato. Non ci metteremo a «spiegarla», ma almeno dovremo dirvi che cosa accade; sarebbe disonesto descrivere le proprietà magnetiche dei materiali senza ricordare il fatto che la descrizione classica del magnetismo – anzi del momento angolare e dei momenti magnetici – non è corretta. Uno degli aspetti più sconvolgenti della meccanica quantistica è che se si prende la componente del momento angolare nella direzione di qualunque asse prescelto, si trova che è sempre un numero intero o semi-intero di ~. Questo avviene qualunque asse si scelga. Le sottigliezze implicite in questo fatto curioso – che cioè si può prendere qualunque «altro» asse e trovare che la componente rispetto a esso è ancora vincolata allo stesso gruppo di valori – le lasceremo a un capitolo successivo, quando avrete la soddisfazione di vedere come in definitiva si risolve questo apparente paradosso. Per ora accetteremo semplicemente il fatto che per ogni sistema atomico c’è un numero j, chiamato spin del sistema, che deve essere un numero intero o semi-intero e che la componente del momento angolare rispetto a qualunque asse si scelga deve avere uno dei seguenti valori fra + j~ e j~ : Jz = uno dei valori j, j
1, j
2, . . . , j + 2, j + 1, j ~
(35.1)
Abbiamo anche ricordato che ogni sistema atomico semplice ha un momento magnetico che ha la stessa direzione del momento angolare. Questo non è vero soltanto per gli atomi e i nuclei, ma anche per le particelle fondamentali. Ciascuna particella fondamentale ha il suo valore caratteristico di j e il suo momento magnetico. (Per alcune particelle tutti e due sono nulli.)
Ripasso: vol. 2, cap. 11, Dentro ai dielettrici
374
Capitolo 35 • Paramagnetismo e risonanza magnetica
© 978-8808-22107-0
j=1
j = 1/2
Jz = +(3/2)
U
U
U
Jz = +
j = 3/2 Jz = +(1/2)
Jz = +(1/2) ωp Jz = 0
U0
U0
B
U0
ωp B
B ωp
Jz = –(1/2)
Jz = –(1/2) Jz = – Jz = –(3/2)
(a)
(c)
(b)
35.1 Un sistema atomico con spin j in un campo magnetico B ha (2j + 1) valori possibili dell’energia. La separazione di questi valori è, per campi piccoli, proporzionale a B. FIGURA
Per «momento magnetico», in questa asserzione, s’intende che l’energia del sistema in un campo magnetico, avente – mettiamo – la direzione z, può essere scritta µz B per campi magnetici piccoli. Dobbiamo mettere la condizione che il campo non sia troppo grande, perché altrimenti potrebbe disturbare i moti interni del sistema e l’energia non sarebbe più una misura del momento magnetico che era presente prima che il campo fosse applicato. Se questo è sufficientemente debole, però, esso produce un cambiamento d’energia dato da U = µz B
(35.2)
sottintendendo che in questa equazione si deve sostituire µz con µz = g
✓ q ◆ Jz 2m
(35.3)
dove Jz ha uno dei valori dati dall’equazione (35.1). Mettiamo di avere un sistema con spin j = 3/2. Senza il campo magnetico il sistema ha quattro diversi stati possibili, corrispondenti ai diversi valori di Jz , i quali tutti hanno esattamente la stessa energia. Ma dal momento che si applica il campo magnetico, c’è un’energia d’interazione in più che separa questi stati in quattro livelli energetici leggermente diversi. Le energie di questi livelli sono date da un certo fattore proporzionale a B, moltiplicato per ~ e per i valori di Jz : 3/2, 1/2, 1/2 e 3/2. La scissione dei livelli energetici per sistemi atomici con spin 1/2, 1 e 3/2 è indicata nei diagrammi della FIGURA 35.1. (Ricordate che per ogni sistemazione degli elettroni, il momento magnetico è sempre diretto all’opposto del momento angolare.) Noterete dai diagrammi che il «centro di gravità» dei livelli energetici è lo stesso con o senza campo. Noterete inoltre che gli intervalli fra un livello e il successivo sono sempre uguali per una data particella in un dato campo magnetico. Scriveremo l’intervallo d’energia per un dato campo magnetico B nella forma ~!p – ciò che è semplicemente una definizione di !p . Adoperando le equazioni (35.2) e (35.3), abbiamo q ~!p = g ~B 2m ossia q !p = g B (35.4) 2m La grandezza g(q/2m) non è che il rapporto fra il momento magnetico e il momento angolare; essa è una proprietà della particella. L’equazione (35.4) è la stessa formula che è stata trovata nel capitolo 34 per la velocità angolare di precessione in un campo magnetico per un giroscopio il cui momento angolare è J e il cui momento magnetico è µ.
35.2
375
35.2 • L’esperienza di Stern e Gerlach
© 978-8808-22107-0
L’esperienza di Stern e Gerlach
Il fatto che il momento angolare è quantizzato è una cosa così sorprendente che vogliamo parlarne un poco anche dal punto di vista storico. Fu una cosa sensazionale, dal momento in cui fu scoperta (benché fosse prevista teoricamente). Fu osservata per la prima volta in un’esperienza fatta nel 1922 da Stern e Gerlach. Se si vuole, si può considerare l’esperienza di Stern e Gerlach come una giustificazione diretta del fatto che si crede nella quantizzazione del momento angolare. Stern e Gerlach inventarono un esperimento per misurare il momento magnetico di atomi singoli d’argento. Essi producevano un fascio di atomi d’argento evaporando l’argento in un fornetto caldissimo e facendo uscire un certo numero di atomi attraverso una serie di forellini. Questo fascio veniva fatto passare fra le estremità polari di un apposito magnete, come si vede nella FIGURA 35.2. L’idea era la seguente. Se l’atomo d’argento ha un momento magnetico µ, allora in un campo magnetico B esso ha l’energia µz B, dove z è la direzione del campo magnetico. Secondo la teoria classica µz sarebbe uguale al prodotto del momento magnetico per il coseno dell’angolo fra il momento e il campo magnetico, così che l’energia extra nel campo sarebbe U = µB cos ✓
(35.5)
Naturalmente quando gli atomi escono dal forno i loro momenti magnetici sono diretti in ogni possibile direzione, così che per ✓ si presenterebbero tutti i valori. Se ora il campo magnetico varia molto rapidamente con z – se c’è un forte gradiente del campo – allora l’energia magnetica varierà anche con la posizione e ci sarà una forza sui momenti magnetici la cui direzione dipenderà dall’essere il cos ✓ positivo o negativo. Gli atomi saranno tirati in su o in giù da una forza proporzionale alla derivata dell’energia magnetica. Dal principio dei lavori virtuali si ottiene Fz =
@U @B = µ cos ✓ @z @z
(35.6)
Stern e Gerlach costruirono il loro magnete con uno spigolo molto accuminato in una delle estremità polari, allo scopo di produrre una variazione molto rapida del campo magnetico. Il fascio degli atomi d’argento era diretto proprio lungo questo spigolo, in modo che gli atomi subissero una forza verticale per effetto del campo inomogeneo. Su un atomo d’argento col momento magnetico diretto orizzontalmente non ci sarebbe alcuna forza ed esso avrebbe oltrepassato il magnete senza deviare. Un atomo il cui momento magnetico fosse esattamente verticale subirebbe una forza che lo spingerebbe in su verso lo spigolo accuminato del magnete. Un atomo il cui momento puntasse in giù subirebbe una spinta in giù. Perciò, uscendo dal magnete, gli atomi si sarebbero sparpagliati a seconda delle componenti verticali dei loro momenti magnetici. Nella teoria classica tutti gli angoli sono possibili e perciò quando gli atomi d’argento vengono raccolti per deposizione su una lastra di vetro ci si dovrebbe aspettare una macchia d’argento lungo una linea verticale. L’altezza della linea dovrebbe essere proporzionale al modulo del momento magnetico.
Forno Foro Vuoto
Magnete
Lastra di vetro FIGURA
35.2
L’esperienza di Stern e Gerlach.
376
Capitolo 35 • Paramagnetismo e risonanza magnetica
© 978-8808-22107-0
Il miserevole fallimento delle idee classiche si rivelò completamente quando Stern e Gerlach videro ciò che effettivamente accadeva. Essi trovarono sul vetro due macchie distinte. Gli atomi d’argento avevano formato due fasci. Che un fascio di atomi, i cui spin dovrebbero manifestamente essere orientati a caso, subisca una scissione in due fasci separati è davvero miracoloso. Come fa il momento magnetico a sapere che gli è consentito prendere soltanto certe componenti nella direzione del campo magnetico? Ebbene, questo fu veramente il principio della scoperta della quantizzazione del momento angolare e, invece di cercare di darvi una spiegazione teorica, diremo soltanto che vi tocca accettare il risultato di questa esperienza proprio come i fisici di quei tempi dovettero accettarlo quando l’esperienza fu eseguita. È un fatto sperimentale che l’energia di un atomo in un campo magnetico assuma una serie di valori particolari. Per ciascuno di questi valori l’energia è proporzionale all’intensità del campo. Perciò in una regione dove il campo varia, il principio dei lavori virtuali ci dice che la possibile forza magnetica sugli atomi avrà una serie di valori separati; tale forza è diversa per ciascuno stato e perciò il fascio degli atomi viene scisso in un piccolo numero di fasci separati. Dalla misura della deflessione di questi fasci si può trovare il valore del momento magnetico.
35.3
Il metodo di Rabi dei raggi molecolari
Desideriamo ora descrivere un’apparecchiatura più perfezionata per la misura dei momenti magnetici che fu elaborata da I.I. Rabi e dai suoi collaboratori. Nell’esperienza di Stern e Gerlach la deflessione degli atomi è molto piccola e la misura del momento magnetico non è molto precisa. La tecnica di Rabi permette una precisione fantastica nella misura dei momenti magnetici. Il metodo è basato sul fatto che l’energia originaria degli atomi viene scissa, in un campo magnetico, in un numero finito di livelli energetici. Che l’energia di un atomo nel campo magnetico possa avere solo certi valori discreti, non è in realtà più strano del fatto che gli atomi in generale hanno soltanto certi livelli energetici discreti, una cosa che è stata spesso ricordata nel volume 1. Perché la stessa cosa non dovrebbe essere vera per gli atomi nel campo magnetico? Lo è. Ma è il tentativo di collegare questo fatto con l’idea di un momento magnetico orientato che mette in evidenza alcuni degli strani aspetti impliciti nella meccanica quantistica. Quando un atomo ha due livelli le cui energie differiscono di U, può compiere una transizione dal livello superiore al livello inferiore emettendo un quanto di luce di frequenza ! tale che ~! = U
(35.7)
La stessa cosa può succedere agli atomi nel campo magnetico. Solo che in tal caso le differenze d’energia sono così piccole che la frequenza non corrisponde a onde luminose, ma a microonde o radiofrequenze. Transizioni dal livello d’energia inferiore a quello superiore di un atomo possono aver luogo con assorbimento di luce, oppure, nel caso degli atomi in un campo magnetico, per assorbimento di energia nel campo delle microonde. Perciò se si ha un atomo in un campo magnetico possiamo produrre transizioni fra uno stato e l’altro applicando un ulteriore campo elettromagnetico di frequenza appropriata. In altre parole, se abbiamo un atomo in un forte campo magnetico e lo «solletichiamo» con un debole campo variabile; c’è una certa probabilità di sbalzarlo in un altro livello se la frequenza è vicina alla ! data dall’equazione (35.7). Per un atomo in un campo magnetico questa frequenza non è che quella che abbiamo in precedenza chiamato !p ed è messa in relazione col campo magnetico dall’equazione (35.4). Se l’atomo viene solleticato con una frequenza sbagliata la probabilità di produrre la transizione è molto piccola. Perciò nella probabilità di produrre una transizione c’è un’acuta risonanza al valore !p della frequenza. Misurando la frequenza di questa risonanza in un campo magnetico noto B, si può misurare la grandezza g(q/2m), e quindi il fattore g, con grande precisione. È interessante che si arrivi alla stessa conclusione da un punto di vista classico. Secondo il quadro classico, quando si mette un piccolo giroscopio con un momento magnetico µ e un momento angolare J in un campo magnetico esterno, il giroscopio subisce una precessione
© 978-8808-22107-0
35.3 • Il metodo di Rabi dei raggi molecolari
377
intorno a un asse parallelo al campo magnetico (FIGURA 35.3). Mettiamo B di chiederci: come possiamo alterare l’angolo che il giroscopio classico fa col campo, cioè l’angolo rispetto all’asse z? Il campo magnetico produce un momento di forza diretto secondo un asse orizzontale. Tale momento si potrebbe pensare che tenti di allineare il magnete col campo, ma riesce soltanto a produrne la precessione. Se vogliamo alterare l’angolo del giroscopio rispetto all’asse z, gli si deve applicare un momento diretto seJ condo l’asse z. Se si applica un momento di forza che ha la stessa direzione ω della precessione, l’angolo del giroscopio cambierà nel senso di diminuire p la componente di J nella direzione z. Nella FIGURA 35.3 l’angolo fra J e l’asse z crescerebbe. Se si tenta di ostacolare la precessione, J si avvicina alla verticale. Per l’atomo che precede in un campo magnetico uniforme, come do- FIGURA 35.3 La precessione classica di un atomo vrà essere applicata una coppia del tipo che vogliamo? La risposta è: per avente un momento magnetico � e un momento mezzo di un debole campo magnetico laterale. Potreste dapprima pensa- angolare J. re che la direzione di questo campo dovrebbe ruotare con la precessione del momento magnetico in modo da essere sempre ad angolo retto con B questo, come indica il campo B 0 nella FIGURA 35.4a. Un campo simile va benissimo, ma un campo orizzontale alternato va quasi altrettanto bene. Se si ha un piccolo campo orizzontale B 0 che è sempre nella direzione x (positiva o negativa) e che oscilla con la frequenza !p , ogni mezzo ciclo la coppia applicata al momento magnetico si inverte, cosicché c’è un effetto cumulativo che è quasi altrettanto efficace quanto un campo magneJ tico rotante. Classicamente, ci si aspetterebbe dunque che la componente del momento magnetico lungo la direzione z cambiasse se c’è un debole campo magnetico oscillante con una frequenza esattamente uguale a (a) !p . Classicamente, com’è naturale, µz cambierebbe con continuità, ma in meccanica quantistica la componente z del momento magnetico non può B' variare con continuità; deve saltare improvvisamente da un valore all’altro. Si è fatto questo confronto fra le conseguenze della meccanica classica e di B quella quantistica per darvi un’indicazione su quello che potrebbe accadere classicamente e come questo è in rapporto con ciò che realmente accade in meccanica quantistica. Noterete, incidentalmente, che la frequenza di risonanza prevista è la stessa in tutti e due i casi. Ancora un’osservazione: da quello che si è detto riguardo all’aspetto quantistico, non si vede una ragione per cui non ci potrebbero essere tranJ sizioni anche alla frequenza 2!p . Succede che non si ha alcun analogo di questo nel caso classico e che non si presenta nemmeno nella teoria quantistica, o almeno non per quello speciale metodo di indurre transizioni che si è descritto. Con un campo magnetico orizzontale oscillante la probabilità che una frequenza 2!p produca un salto di due scalini in una volta è zero. (b) B' = b cos ωp t È soltanto alla frequenza !p che transizioni, sia in su che in giù, hanno una certa probabilità di prodursi. Siamo ora in grado di descrivere il metodo di Rabi per misurare i mo- FIGURA 35.4 L’angolo di precessione di un magnete atomico può essere alterato con un campo magnetico menti magnetici. Qui considereremo soltanto il funzionamento con atomi orizzontale che sia sempre ad angolo retto con �, di spin 1/2. Uno schema del dispositivo è mostrato in FIGURA 35.5. come in (a), oppure con un campo oscillante, C’è un forno che emette un flusso di atomi neutri che attraversa tre come in (b). magneti allineati. Il magnete 1 è del tutto simile a quello della FIGURA 35.2 e ha un campo con un forte gradiente, mettiamo con @Bz /@z positiva. Se gli atomi hanno un momento magnetico, essi verranno deflessi in giù se è Jz = +~/2, oppure in su se è Jz = ~/2 (perché per gli elettroni µ è diretto all’opposto di J). Se si considerano solo quegli atomi che possono passare attraverso la fenditura S1 , ci sono due possibili traiettorie, come indicato. Gli atomi con Jz = +~/2 devono percorrere la curva a per passare per la fenditura e quelli con Jz = ~/2 devono percorrere la curva b. Atomi che escono dal forno secondo altre traiettorie non passeranno dalla fenditura. Il magnete 2 ha un campo uniforme. Non ci sono forze sugli atomi
378
Capitolo 35 • Paramagnetismo e risonanza magnetica
© 978-8808-22107-0
B0 Jz = +(1/2)
∂Bz / ∂ z
B'
b'
∂Bz / ∂ z Rivelatore
a
b a
b Forno
a'
Jz = –(1/2)
Fenditura S2 Magnete 1
FIGURA
35.5
Fenditura S1
Magnete 2
Magnete 3
L’apparecchio di Rabi a fasci molecolari.
in questa regione, perciò essi l’attraversano in linea retta ed entrano nel magnete 3. Questo è del tutto simile al magnete 1, ma col campo rovesciato, così che @Bz /@z ha il segno opposto. Gli atomi con Jz = +~/2 (possiamo chiamarli «con lo spin su»), che avevano subito una spinta in giù nel magnete 1, subiscono una spinta in su nel magnete 3; essi proseguono il loro cammino e arrivano attraverso la fenditura S2 al rivelatore. Gli atomi con Jz = ~/2 («con lo spin giù») anche loro subiscono forze opposte nei magneti 1 e 3 e percorrono il cammino b che li porta attraverso la fenditura S2 al rivelatore. Il rivelatore può essere fatto in vari modi, a seconda dell’atomo che si vuole misurare. Per esempio, per gli atomi di un metallo alcalino, come il sodio, il rivelatore può essere un sottile filo caldo di tungsteno connesso a un sensibile misuratore di corrente. Quando gli atomi di sodio cadono sul filo, essi evaporano come ioni Na+ , abbandonando al metallo un elettrone. Nel filo si ha una corrente proporzionale al numero di atomi di sodio in arrivo al secondo. Nell’intraferro del magnete 2 c’è una coppia di bobine che produce un piccolo campo magnetico orizzontale B 0. Queste bobine sono alimentate con una corrente che oscilla a una frequenza ! variabile. Perciò fra i poli del magnete 2 c’è un forte campo costante verticale B0 e un debole campo oscillante orizzontale B 0. Pensiamo ora che la frequenza ! del campo oscillante sia regolata al valore !p , la frequenza di «precessione» degli atomi nel campo B. Il campo alternato farà sì che alcuni degli atomi che passano compiano delle transizioni da un Jz all’altro. Lo spin di un atomo che era inizialmente «su» (Jz = +~/2) può essere ribaltato in «giù» (Jz = ~/2). Questo atomo si troverà ad avere invertita la direzione del suo momento magnetico e perciò subirà una forza in giù nel magnete 3 e si muoverà secondo il percorso a 0 indicato in FIGURA 35.5: non potrà quindi più arrivare attraverso la fenditura S2 al rivelatore. Similmente alcuni degli atomi i cui spin erano inizialmente in «giù» (Jz = ~/2) potranno trovarsi con gli spin ribaltati in «su» (Jz = +~/2) nel passare attraverso il magnete 2. Essi si muoveranno secondo il percorso b0 e non arriveranno al rivelatore. Se il campo oscillante B 0 ha una frequenza apprezzabilmente diversa Corrente nel rivelatore da !p , non produrrà l’inversione degli spin e gli atomi seguiranno i loro percorsi indisturbati fino al rivelatore. Potete dunque rendervi conto che la frequenza di «precessione» !p degli atomi nel campo B0 può essere trovata variando la frequenza ! del campo B 0 finché si osserva una diminuzione nella corrente degli atomi che arrivano al rivelatore. Questa diminuzione della corrente si deve presentare quando ! è «in risonanza» con !p . Un grafico della corrente del rivelatore in funzione di ! può avere l’aspetto di ω ω quello mostrato in FIGURA 35.6. Conoscendo !p si può ottenere il valore di g per l’atomo. Queste esperienze con fasci di atomi o esperienze di risonanza di fasci FIGURA 35.6 La corrente di atomi nel fascio diminuisce quando si ha ω = ωp . «molecolari»(1) rappresentano un’elegante maniera di determinare le prop
(1)
In italiano si usa anche l’espressione «raggi» atomici o molecolari, o raggi di vapore. (N.d.T.)
35.4 • Il paramagnetismo dei materiali in massa
© 978-8808-22107-0
prietà magnetiche di oggetti atomici. La frequenza di risonanza !p si può determinare con grande precisione; in effetti, con una precisione maggiore di quella con cui si può misurare il campo magnetico B0 , che bisogna conoscere per trovare g.
35.4
Il paramagnetismo dei materiali in massa
Desideriamo ora descrivere il fenomeno del paramagnetismo dei materiali in massa. Mettiamo di avere una sostanza i cui atomi hanno un momento magnetico permanente, per esempio un cristallo come il solfato di rame. Nel cristallo ci sono gli ioni di rame le cui zone elettroniche interne hanno un momento angolare complessivo e un momento magnetico complessivo. Perciò lo ione di rame è un oggetto che ha un momento magnetico permanente. Diciamo poche parole su quali atomi hanno momenti magnetici e quali no. Qualunque atomo che ha un numero dispari di elettroni, come per esempio il sodio, avrà un momento magnetico. Il sodio ha un elettrone nella sua zona incompleta. Questo elettrone dà all’atomo uno spin e un momento magnetico. Normalmente, però, quando si formano dei composti, gli elettroni extra nella zona esterna si accoppiano insieme ad altri elettroni le cui direzioni di spin sono esattamente opposte, così che tutti i momenti angolari e magnetici degli elettroni di valenza si compensano di solito esattamente. Questo è il perché in generale le molecole non hanno un momento magnetico. Naturalmente se si ha un gas di atomi di sodio, tale compensazione non c’è(2) . Inoltre se si ha ciò che in chimica si chiama un «radicale libero» – un oggetto con un numero dispari di elettroni di valenza – i legami non sono completamente soddisfatti e c’è un momento angolare complessivo. Nella maggior parte dei materiali in massa, c’è un momento magnetico complessivo soltanto se sono presenti degli atomi in cui una zona interna non è riempita. Allora ci può essere un momento angolare complessivo e un momento magnetico. Atomi di questo tipo si trovano nella regione degli «elementi di transizione» del sistema periodico: per esempio cromo, manganese, ferro, nichel, cobalto, palladio e platino sono elementi di questa specie. Inoltre tutti gli elementi delle terre rare hanno zone interne incomplete e momenti magnetici permanenti. Ci sono una o due altre cose strane che presentano un momento magnetico, come l’ossigeno liquido, ma ne lasceremo la spiegazione ai corsi di chimica. Immaginiamo ora di avere una scatola piena di atomi o molecole aventi un momento permanente, mettiamo un gas, un liquido o un cristallo. Si vorrebbe sapere che cosa succede se si applica un campo magnetico esterno. Senza campo magnetico esterno gli atomi sono sballottati dai moti termici e i momenti finiscono per essere rivolti in tutte le direzioni. Quando però c’è un campo magnetico, la sua azione tende ad allineare i magnetini; quindi ce ne sono di più che si trovano nel verso del campo che in senso opposto: il materiale è «magnetizzato». Si definisce magnetizzazione M di un materiale il momento magnetico complessivo per unità di volume, col che intendiamo la somma vettoriale di tutti i momenti magnetici atomici in un’unità di volume. Se ci sono N atomi per unità di volume e il loro momento medio è hµim allora M può essere scritto come il prodotto di N per il momento atomico medio: M = Nhµim
(35.8)
La definizione di M corrisponde alla definizione della polarizzazione elettrica P del capitolo 10. La teoria classica del paramagnetismo è del tutto simile alla teoria della costante dielettrica vista nel capitolo 11. Si postula che ogni atomo abbia un momento µ che ha sempre lo stesso modulo ma che può essere rivolto in qualsiasi direzione. In un campo B l’energia magnetica è µ · B = µB cos ✓ dove ✓ è l’angolo fra il momento e il campo. Dalla meccanica statistica si sa che la probabilità relativa di avere un certo angolo è e energia/kT , perciò gli angoli vicini a zero sono più probabili (2) Ordinariamente il vapore di sodio è prevalentemente monoatomico, benché ci siano anche alcune molecole di Na . 2 (N.d.T.)
379
380
Capitolo 35 • Paramagnetismo e risonanza magnetica
© 978-8808-22107-0
degli angoli vicini a ⇡. Procedendo esattamente come si è fatto nel paragrafo 11.3, si trova che per piccoli campi magnetici la magnetizzazione M è diretta parallelamente a B e ha modulo M=
N µ2 B 3kT
(35.9)
(vedi equazione (11.20).) Questa formula approssimata è corretta soltanto se µB/kT è molto minore di 1. Troviamo dunque che la magnetizzazione indotta – il momento magnetico per unità di volume – è proporzionale al campo magnetico. Questo è il fenomeno del paramagnetismo. Come vedete, l’effetto è più forte alle temperature basse e più debole alle temperature alte. Quando si applica un campo a una sostanza, esso produce – per campi piccoli – un momento magnetico proporzionale al campo. Il rapporto fra M e B (per campi piccoli) è chiamato suscettività magnetica. Vogliamo ora esaminare il paramagnetismo dal punto di vista della meccanica quantistica. Facciamo prima il caso di un atomo con spin 1/2. In assenza di campo magnetico gli atomi hanno una certa energia; in un campo magnetico, però, ci sono due energie possibili, una per ciascun valore di Jz . Per Jz = +~/2 l’energia è modificata dal campo magnetico di una quantità ! qe ~ 1 U1 = +g B (35.10) 2m 2 (Lo spostamento d’energia U è positivo per un atomo perché la carica dell’elettrone è negativa.) Per Jz = ~/2 l’energia è variata dalla quantità ! qe ~ 1 B (35.11) U2 = g 2m 2 Per semplicità di scrittura poniamo
! qe ~ 1 µ0 = g 2m 2
Si ha allora
U = ±µ0 B
(35.12) (35.13)
Il significato di µ0 è chiaro: µ0 è la componente z del momento magnetico nel caso dello spin su e +µ0 è la componente z del momento magnetico nel caso dello spin giù. Ora la meccanica statistica ci dice che la probabilità che un atomo si trovi in uno stato o in un altro è proporzionale a e (energia dello stato)/kT In assenza di campo magnetico i due stati hanno la stessa energia, perciò nel campo magnetico, quando c’è equilibrio, le probabilità sono proporzionali a e
U/kT
(35.14)
Il numero degli atomi per unità di volume aventi spin su è µ0 B/kT
(35.15)
Ngiù = ae+µ0 B/kT
(35.16)
Nsu = ae e il numero di quelli con spin giù è
La costante a deve essere determinata in modo che si abbia Nsu + Ngiù = N
(35.17)
essendo N il numero totale degli atomi per unità di volume. Perciò otteniamo a=
N e+µ0 B/kT + e
µ0 B/kT
(35.18)
381
35.4 • Il paramagnetismo dei materiali in massa
© 978-8808-22107-0
Quello che ci interessa è il momento magnetico medio in direzione dell’asse z. Gli atomi con spin su contribuiranno con un momento µ0 e quelli con lo spin giù avranno un momento +µ0 , perciò il momento medio sarà hµim =
Nsu ( µ0 ) + Ngiù (+µ0 ) N
(35.19)
Il momento magnetico per unità di volume M sarà dunque N hµim . Usando le equazione (35.15), (35.16) e (35.17) si ottiene e+µ0 B/kT e µ0 B/kT M = N µ0 +µ B/kT (35.20) e 0 + e µ0 B/kT Questa è la formula quantistica per M, per atomi con j = 1/2. Incidentalmente questa formula può anche essere scritta in modo un po’ più conciso per mezzo della funzione tangente iperbolica: M = N µ0 tgh
µ0 B kT
(35.21)
Un grafico di M in funzione di B è dato in FIGURA 35.7. Quando B diventa molto grande, la tangente iperbolica tende a 1 e M tende al valore limite N µ0 . Perciò con campi elevati la magnetizzazione si satura. Si può capire perché è così: in campi abbastanza elevati i momenti sono tutti allineati nella stessa direzione. In altre parole essi sono tutti nello stato di spin giù e ognuno contribuisce con il momento µ0 . Nella maggioranza dei casi normali – diciamo per momenti tipici, temperature ordinarie e con i campi che si possono ottenere usualmente (per esempio 10 000 gauss) – il rapporto µ0 B/kT è circa 0,002: si deve andare a bassissime temperature per vedere la saturazione. Per temperature ordinarie di solito si può sostituire tgh x con x e scrivere M=
N µ20 B kT
M
0
1
3
4
35.7 La variazione della magnetizzazione paramagnetica con il campo magnetico B. FIGURA
(35.22)
2
Proprio come si è visto nella teoria classica, M è proporzionale a B. Effettivamente la formula è quasi esattamente la stessa, salvo il fatto che sembra mancare un fattore 1/3. Però dobbiamo ancora mettere in relazione il µ0 della formula quantistica con il µ che appare nel risultato classico, cioè l’equazione (35.9). Nella formula classica ciò che appare è µ2 = µ · µ, il quadrato del vettore momento magnetico, ossia ✓ q ◆2 e µ·µ= g J·J (35.23) 2m
Abbiamo fatto notare nel capitolo precedente che si può con buona probabilità ottenere il risultato giusto da un calcolo classico sostituendo J · J con j( j + 1)~2 . Nel nostro specifico esempio, si ha j = 1/2, è perciò 3 j( j + 1)~2 = ~2 4 Sostituendo questa espressione a J · J nell’equazione (35.23) si ottiene ✓ q ◆2 3 e µ·µ= g ~2 2m 4
ossia, introducendo µ0 com’è definito dall’equazione (35.12): µ · µ = 3µ20 Sostituendo questo valore a µ2 nella formula classica, l’equazione (35.9) riproduce effettivamente la formula quantistica corretta (35.22).
382
Capitolo 35 • Paramagnetismo e risonanza magnetica
© 978-8808-22107-0
La teoria quantistica del paramagnetismo si può estendere facilmente agli atomi con spin qualunque j. La magnetizzazione per campi piccoli è M = Ng 2
j( j + 1) µ2B B 3 kT
(35.24)
dove l’espressione qe ~ (35.25) 2m è una combinazione di costanti che ha le dimensioni di un momento magnetico. Gli atomi hanno per lo più momenti di questo ordine di grandezza. µB è chiamato magnetone di Bohr. Il momento magnetico di spin dell’elettrone è quasi esattamente un magnetone di Bohr. µB =
35.5
Il raffreddamento per smagnetizzazione adiabatica
C’è un’applicazione speciale molto interessante del paramagnetismo. A temperature bassissime è possibile allineare i magneti atomici in un campo intenso. Dopo di che è possibile scendere a temperature estremamente basse per mezzo di un processo chiamato smagnetizzazione adiabatica. Si può prendere un sale paramagnetico (per esempio un sale che contenga un certo numero di atomi delle terre rare, come il nitrato di ammonio e praseodimio) e cominciare a raffreddarlo con elio liquido a uno o due gradi assoluti in un forte campo magnetico. Allora il fattore µB/kT è più grande di 1, diciamo che è più vicino a 2 o 3, quindi la maggior parte degli spin sono allineati e la magnetizzazione è quasi saturata. Diciamo, per semplificare, che il campo sia fortissimo e la temperatura bassissima, così che quasi tutti gli atomi sono allineati. Poi si isola il sale termicamente (mettiamo, allontanando l’elio liquido e facendo un buon vuoto) e quindi si toglie il campo magnetico. La temperatura del sale si abbassa notevolmente. Se il campo fosse improvvisamente soppresso, il saltellio e lo scuotimento degli atomi nel reticolo cristallino manderebbero gradualmente tutti gli spin fuori allineamento. Una parte di essi sarebbe in su e una parte in giù. Ma se non c’è campo (e trascurando le interazioni fra i magneti atomici, ciò che porterà solo un piccolo errore) non occorre energia per capovolgere i magneti atomici. Essi possono rendere casuale la distribuzione dei loro spin senza alcun cambiamento dell’energia e perciò senza variare la temperatura. Supponiamo però che mentre i magneti atomici vengono capovolti dal moto termico una parte del campo sia ancora presente. Allora occorre un certo lavoro per capovolgerli in senso opposto al campo: essi devono compiere lavoro contro il campo. Questo sottrae energia ai moti termici e fa scendere la temperatura. Perciò se il forte campo magnetico non è rimosso troppo rapidamente, la temperatura del sale diminuirà: esso viene raffreddato dalla smagnetizzazione. Dal punto di vista quantistico, quando il campo è intenso, tutti gli atomi sono nello stato più basso, perché è estremamente improbabile che ce ne siano nello stato più alto, ma quando il campo viene ridotto, diventa sempre più probabile che le fluttuazioni termiche facciano saltare un atomo nello stato superiore. Quando ciò accade l’atomo assorbe l’energia U = µ0 B. Perciò se il campo viene soppresso lentamente le transizioni magnetiche possono prelevare energia dalle vibrazioni termiche del cristallo, raffreddandolo. In questo modo è possibile passare da una temperatura di pochi gradi assoluti a una temperatura di pochi millesimi di grado. Vi piacerebbe far diventare qualcosa anche più freddo di così? Ebbene, la Natura ce ne ha fornito il modo. Si è già ricordato che anche i nuclei atomici hanno dei momenti magnetici. Le nostre formule per il paramagnetismo si applicano altrettanto bene ai nuclei, eccetto che i momenti dei nuclei sono all’incirca un migliaio di volte più piccoli. (Sono dell’ordine di grandezza di q~/2mp , dove mp è la massa del protone e perciò sono più piccoli secondo il rapporto fra la massa dell’elettrone e la massa del protone.) Con momenti magnetici così, anche alla temperatura di 2 K, il fattore µB/kT è soltanto di alcune parti su mille. Ma se adoperiamo il processo di smagnetizzazione paramagnetica per raggiungere una temperatura di pochi millesimi di grado, µB/kT diventa un numero vicino a 1: a queste basse temperature si può cominciare
35.6 • La risonanza magnetica nucleare
© 978-8808-22107-0
a saturare i momenti nucleari. Questa è una buona notizia, perché allora si può adoperare la smagnetizzazione adiabatica del magnetismo nucleare per raggiungere temperature ancora più basse. È dunque possibile fare due stadi di raffreddamento magnetico. Prima si adopera la smagnetizzazione degli ioni paramagnetici per raggiungere i millesimi di grado; poi si adopera il sale paramagnetico freddo per raffreddare un materiale che ha un forte magnetismo nucleare; infine, quando si sopprime il campo magnetico da questo materiale, la sua temperatura scenderà a circa un milionesimo di grado dallo zero assoluto, se tutto è stato fatto molto accuratamente.
35.6
La risonanza magnetica nucleare
S’è detto che il paramagnetismo atomico è molto piccolo e che il magnetismo nucleare è ancora un migliaio di volte più piccolo. Tuttavia è relativamente facile osservare il magnetismo nucleare per mezzo del fenomeno della «risonanza magnetica nucleare». Consideriamo una sostanza come l’acqua, nella quale tutti gli spin elettronici sono esattamente compensati, così che il loro momento magnetico complessivo è zero. Le molecole avranno ancora un piccolissimo momento magnetico a causa del momento magnetico nucleare dei nuclei d’idrogeno. Supponiamo di mettere un campioncino d’acqua in un campo magnetico B. Siccome i protoni (dell’idrogeno) hanno spin 1/2, essi hanno due possibili stati energetici. Se l’acqua è in equilibrio termico ci saranno un po’ più di protoni nello stato di più bassa energia, cioè col momento rivolto parallelamente al campo: c’è un piccolo momento magnetico complessivo per unità di volume. Siccome il momento protonico è circa soltanto un millesimo di un momento atomico, la magnetizzazione, che – secondo l’equazione (35.22) – varia come µ2 , è soltanto circa un milionesimo di quella tipica del paramagnetismo atomico. (Questa è la ragione per cui si deve scegliere un materiale privo di magnetismo atomico.) Se si va a calcolarla, la differenza fra il numero dei protoni con spin su e spin giù è soltanto di una parte su 108 ; perciò l’effetto è veramente molto piccolo! Può però essere ancora osservato, nel modo seguente. Supponiamo di circondare il campione d’acqua con una piccola bobina che produce un piccolo campo magnetico orizzontale oscillante. Se questo campo oscilla alla frequenza !p , esso indurrà delle transizioni fra i due stati energetici, proprio come si è detto per l’esperimento di Rabi, nel paragrafo 35.3. Quando un protone scatta da uno stato d’energia superiore a uno stato d’energia inferiore, cederà l’energia µz B che, come si è visto, è uguale a ~!p . Se scatta dallo stato d’energia inferiore a quello superiore, assorbirà l’energia ~!p dalla bobina. Siccome ci sono leggermente più protoni nello stato inferiore che in quello superiore, ci sarà un complessivo assorbimento d’energia dalla bobina. Benché l’effetto sia piccolissimo, questo leggero assorbimento d’energia può esser rivelato con un sensibile amplificatore elettronico. Proprio come nell’esperimento di Rabi con i fasci molecolari, l’assorbimento d’energia si vedrà solo quando il campo oscillante è in risonanza, cioè quando si ha qe + ! = !p = g * B , 2mp -
È spesso più comodo cercare la risonanza variando B mentre è tenuta costante !. L’assorbimento d’energia si manifesterà quando è 2mp B= ! gqe Una tipica apparecchiatura per studiare la risonanza magnetica nucleare è mostrata nella FIGURA 35.8. Un oscillatore ad alta frequenza alimenta una piccola bobina posta fra i poli di un grosso elettromagnete. Due piccoli avvolgimenti ausiliari intorno alle estremità polari sono alimentati da una corrente a 60 periodi, così che il campo viene a oscillare di una piccolissima quantità intorno al suo valor medio(3) . A titolo d’esempio, mettiamo che la corrente principale del magnete sia (3)
In italiano questo procedimento si chiama «scansione» del campo. (N.d.T.)
383
384
Capitolo 35 • Paramagnetismo e risonanza magnetica
© 978-8808-22107-0
regolata in modo da dare un campo di 5000 gauss e che le bobine ausiliarie producano una variazione di Bobine ausiliarie ±1 gauss intorno a questo valore. Se l’oscillatore è regolato a 21,2 megacicli per secondo, si troverà alla Oscillatore risonanza protonica ogni volta che il campo passa per il valore di 5000 gauss (secondo l’equazione (34.13) con g = 5,58 per il protone). Uscita di Acqua frequenza Il circuito dell’oscillatore è disposto in modo da ω dare un segnale d’uscita supplementare proporzionale a qualsiasi variazione della potenza assorbita dall’oSegnale di assorbim. scillatore. Questo segnale viene inviato all’amplificatore della deflessione verticale di un oscilloscopio. La deflessione orizzontale di questo è sganciata a ogni Oscilloscopio periodo della frequenza di scansione del campo. (Più comunemente, la deflessione orizzontale si fa in maniera tale da seguire, proporzionalmente, il campo di scansione.) Prima che il campione d’acqua sia messo dentro V la bobina ad alta frequenza, la potenza prelevata all’oscillatore ha un certo valore (che non cambia con il Trigger di Sorgente scansione campo magnetico). Quando però una bottiglietta d’ac60 ~ orizzontale qua è posta nella bobina, un segnale appare all’oscilloscopio, come mostra la figura: si vede un diagramma FIGURA 35.8 Un’apparecchiatura per risonanza magnetica nucleare. della potenza che viene assorbita dal ribaltamento dei protoni! In pratica è difficile sapere come portare il magnete a 5000 gauss esatti. Ciò che si fa è regolare la corrente finché il segnale della risonanza appare all’oscilloscopio. Questo risulta oggi essere il modo più conveniente di fare una misura precisa dell’intensità di un campo magnetico. Naturalmente, a un certo momento qualcuno ha dovuto misurare con precisione il campo magnetico e la frequenza per determinare il valore di g del protone. Ma ora che questo è stato fatto, un apparecchio per la risonanza dei protoni, come quello in figura, può essere usato come un «magnetometro a risonanza protonica». Sarà bene dire una parola sulla forma del segnale. Se il campo magnetico fosse scandito molto lentamente, ci si aspetterebbe di vedere una normale curva di risonanza. L’assorbimento d’energia registrerebbe un massimo quando !p coincide esattamente con la frequenza dell’oscillatore. Ci sarebbe un certo assorbimento alle frequenze vicine perché i protoni non si trovano tutti esattamente nello stesso campo e campi diversi vogliono dire frequenze di risonanza leggermente diverse. Incidentalmente, ci si potrebbe domandare se alla frequenza di risonanza si dovrebbe vedere un segnale. Non ci si dovrebbe aspettare che il campo d’alta frequenza renda uguali le popolazioni dei due stati, così che non ci dovrebbe essere alcun segnale, salvo il momento in cui s’introduce l’acqua? Non esattamente, perché sebbene si stia tentando di uguagliare le popolazioni, i moti termici da parte loro si sforzano di mantenere il rapporto appropriato, caratteristico della temperatura T. Se si è alla risonanza, la potenza assorbita dai nuclei è proprio quella che viene ceduta ai moti termici. C’è però relativamente poco «contatto termico» fra i momenti magnetici dei protoni e i moti atomici. I protoni sono relativamente isolati, stando giù nel centro delle distribuzioni elettroniche. Perciò nell’acqua pura il segnale è effettivamente troppo piccolo per essere visto. Per aumentare l’assorbimento è necessario aumentare il «contatto termico». Questo di solito si fa aggiungendo all’acqua un poco di ossido di ferro. Gli atomi di ferro sono come dei magnetini; mentre stanno saltellando nella loro danza termica essi producono minuscoli campi saltellanti che agiscono sui protoni. Questi campi variabili «accoppiano» i magneti protonici alle vibrazioni atomiche e tendono a stabilire l’equilibrio termico. È per mezzo di questo «accoppiamento» che i protoni negli stati di più elevata energia possono perderla, così da esser di nuovo capaci di assorbire energia dall’oscillatore. In pratica il segnale d’uscita di un apparecchio di risonanza nucleare non ha l’aspetto di una normale curva di risonanza. È di solito un segnale più complicato, con delle oscillazioni,
© 978-8808-22107-0
35.6 • La risonanza magnetica nucleare
come quello disegnato in figura. Tali forme di segnale appaiono a causa della variabilità del campo. La spiegazione dovrebbe essere data per mezzo della meccanica quantistica, ma si può far vedere che in simili esperienze le idee classiche sulla precessione dei momenti danno sempre risultati corretti. Classicamente, si potrebbe dire che quando si arriva alla risonanza, si dà il via a una quantità di magneti nucleari che precedono in modo sincrono. Così facendo li facciamo precedere insieme. Questi magneti nucleari che ruotano tutti insieme provocano una fem indotta nella bobina dell’oscillatore, con la frequenza !p . Ma siccome il campo sta crescendo con il tempo, la frequenza di precessione cresce anch’essa e il voltaggio indotto presto raggiunge una frequenza un poco più alta di quella dell’oscillatore. Mentre la fem indotta va alternativamente in fase e fuori fase con l’oscillatore, la potenza «assorbita» diventa alternativamente positiva e negativa. Perciò all’oscilloscopio si vede la nota di battimento fra le frequenze dei protoni e quella dell’oscillatore. Siccome le frequenze dei protoni non sono tutte identiche (protoni diversi si trovano in campi leggermente diversi) e forse anche a causa della perturbazione prodotta dall’ossido di ferro nell’acqua, i momenti nella loro precessione libera vanno in breve fuori fase e il segnale di battimento scompare. Questi fenomeni di risonanza magnetica sono stati sfruttati in vari modi come strumenti per scoprire nuove cose sulla materia, specialmente in chimica e in fisica nucleare. È ovvio che i valori numerici dei momenti magnetici dei nuclei ci dicono qualcosa sulla loro struttura. In chimica molto si è imparato dalla struttura (o forma) delle risonanze. A causa dei campi magnetici prodotti da nuclei vicini, la posizione esatta della risonanza nucleare viene spostata un po’ a seconda dell’ambiente nel quale un dato nucleo si trova. La misura di questi spostamenti aiuta a determinare quali atomi sono vicini a quali altri e così serve a chiarire i dettagli della struttura delle molecole. Ugualmente importante è la risonanza degli spin elettronici dei radicali liberi. Benché all’equilibrio non siano mai presenti in quantità notevole, tali radicali si presentano spesso come stati intermedi nelle reazioni chimiche. Una misura della risonanza degli spin elettronici è un saggio delicato per rivelare la presenza di radicali liberi ed è spesso la chiave per capire il meccanismo di certe reazioni chimiche.
385
Indice analitico
A accelerazione sostanziale, 350 accettore, 213 acqua, 383 – molecola, 318 – onde sull’, 3 – – interferenza costruttiva, 4 – – interferenza distruttiva, 4 aggiunta di un’equazione, 174 alluminio, 361 – come impurità, 213 ammoniaca, 112, 318 – descrizione quantistica della molecola, 112 – maser ad, v. maser ad ammoniaca – molecola, 237 – – matrice hamiltoniana, 112 – – in un campo elettrico stazionario, 120 – – stati di base, 116 ampiezza/e – di probabilità, 10, 12, 13, 24-36 – – combinazione delle ampiezze, 24 – – diffusione di neutroni da un cristallo, 30 – – diffusione di nuclei su altri nuclei, 33 – – elettrone, 242 – – interferenza da due fenditure, 28 – – particelle identiche, 33 – dipendenza dal tempo, 87-100 – – atomi in quiete, 87 – – conservazione dell’energia, 92 – – energia potenziale di una particella, 92 – – forza agente su una particella, 96 – – limite classico, 96 – – particella in moto uniforme, 89 – – precessione di una particella a spin un mezzo, 97 – – stati stazionari di un atomo, 87 – dipendenza dalla posizione, 237-253 – – ampiezze in una dimensione, 237 – – equazione di Schrödinger, 248 – – funzione d’onda, 241 – – livelli energetici quantizzati, 250 – – normalizzazione degli stati in x, 245 – – stati di impulso definito, 243 – e vettori di stato, 101 – interferenza, 62
– leggi generali, 65 – trasformazione (spin un mezzo), 71 Anderson, P.W., 353 anello benzenico, 143 annichilimento – del positronio, 276 – elettrone-lacuna, 212, 219 antimateria, 166 antineutrini, 265 apparecchio di Stern-Gerlach, 53 – filtri in serie, 59 – modificato, 55 approssimazione a particelle indipendenti, 223-236 – molecola del benzene, 230 – molecola del butadiene, 233 – molecola dell’etilene, 230 – molecola della clorofilla, 234 – molecola della xantofilla, 234 – numeri magici della fisica nucleare, 236 – onde di spin, 223 – – due onde di spin, 227 – proprietà della tavola periodica degli elementi, 236 argon, 316, 317 armoniche sferiche, 306, 308 arsenico (come impurità), 213 atomo/i – dimensioni, 18 – energia magnetica, 371 – filtrati con un apparecchio di Stern-Gerlach, 53 – – esperimenti con, 57 – – filtri di Stern-Gerlach in serie, 59 – in quiete, 87 – – energia, 87 – livelli di energia, 20 – raggio di Bohr, 19, 301, 305 – stati stazionari, 87 autoaggiunto, operatore, 321 azoto, 317 B banda/e – di conduzione, 209
388
Indice analitico
– interazione tra, 203 Bardeen, John, 344, 349 barioni, 38 – conservazione del numero di, 164 barriera di potenziale, penetrazione di una, 95 base (transistor), 221 benzene, 143, 230 – molecola, 143, 230 berillio, 315, 316, 317 bismuto, 361 Bohr, Niels, 250 – magnetone di, 187, 372, 382 – modello dell’atomo di idrogeno, 304 – raggio di, 19, 301, 305 Boltzmann, Ludwing, 344 – costante di, 212 Born, Max, 1, 22, 24, 342 boro, 315, 316 Bose, Satyendranath – particelle di, 37, 229 – – spin totale, 39 – – stati di due particelle, 39 – – stati di n particelle, 42 bra, 102, 105 bra-ket, 102 butadiene, 233 – molecola, 233 C campo magnetico – ed equazione di Schrödinger, 337 – elettrone in un, 145 – – equazione di moto per gli stati di spin, 147 – – hamiltoniana, 145 carbonio, 316 cella elementare (cristalli), 17 cellule solari, 219 centro donatore, 213 Clebsch, Rudolf - Gordan, Paul – coefficienti di, 289, 293 cloro, 316 clorofilla, 234 – molecola, 234 cobalto, 317, 361 coefficiente/i – di Clebsch-Gordan, 289, 293 – di Hall, 217 – di trasformazione per particelle di spin un mezzo, 72 collettore (transistor), 221 coloranti, 144 combinazione delle ampiezze, 24 commutazione di operatori, 256 composizione dei momenti angolari, 287 – per due particelle di spin un mezzo, 288 – per due particelle di spin uno, 294
© 978-8808-22107-0
– per una particella di spin un mezzo e una particella di spin uno, 293 conducibilità, 215 conservazione – del numero di barioni, 164 – della stranezza, 163 – leggi, 257-271 – – conservazione del momento angolare, 261, 263 – – conservazione dell’energia, 262 – – conservazione dell’impulso, 262 – – conservazione della parità, 260 – – – nell’emissione di un fotone, 297 – – disintegrazione della particella lambda (Λ0), 265 – – e simmetria di un sistema, 257 – – luce polarizzata, 263 – – sommario delle matrici di rotazione, 270 continuazione analitica, 207 Cooper, Leon, 344, 349 coppia elettrone-lacuna, 210, 212 corpo nero, spettro, 45 costante – di Boltzmann, 212 – di Planck ridotta, 11 cristallo/i – cella elementare, 17 – diffrazione, 17 – diffusione di neutroni, 30 – reticolo cristallino, 18 cromo, 317 D de Broglie, Louis-Victor, 91 Deaver, Bascom S. Jr., 348 decadimento/i – α di un nucleo di uranio, 95 – β, 259 – deboli, 166 delta di Kronecker, 64 densità di probabilità, 242, 244, 326, 340 deuterio, 52, 288 – atomo di, 288 – – stati del momento angolare, 290 – – stati J = 3/2, 291 – struttura iperfine del, 288 deutone, 288 diagramma/i – dei livelli energetici, 211 – di energia, 210 diamagnetismo, 361, 365 – e fisica classica 368 diamante, 212, 213 – energia di separazione, 213 diffrazione, 15, 16, 17, 18 – dai cristalli, 17 – di raggi X, 18
© 978-8808-22107-0
diffusione – ampiezze di (propagazione di elettroni in un reticolo cristallino), 207 – da parte delle imperfezioni in un reticolo cristallino, 204 – della luce, 274 – di neutroni da un cristallo, 30 – di nuclei su altri nuclei, 33 – e impurità, 214 diodo a stato solido, 220 dipolo elettrico – radiazione, 272 – – conservazione della parità nell’emissione di un fotone, 297 dipolo magnetico, radiazione di, 273 Dirac, Paul, 24, 25, 102, 103, 104, 182, 250 – equazione relativistica per un elettrone, 250 – formula di, 182 – funzione delta di, 246 distribuzione di probabilità (elettrone), 242 Doll, Robert, 348, 349 E eccitone, 204 effetto – Hall, 215 – Meissner, 345 – Zeeman, 184 Einstein, Albert, 44, 280 Einstein, Albert - Podolsky, Boris - Rosen, Nathan – paradosso di, 280 elemento/i – delle terre rare, 317, 379 – di matrice del dipolo elettrico, 132 – di transizione, 379 elettricità, conduzione dei solidi, 201 elettrone/i, 38, 107, 142, 276 – come particelle di Fermi, 51 – comportamento quantistico, 2 – – elettroni come onde, 4 – – – interferenza delle onde elettroniche, 6 – – – osservazione degli elettroni, 7 – – elettroni come pallottole, 2 – con spin in un campo magnetico, 148 – confinato in una buca di potenziale, 251 – distribuzione di probabilità, 242 – e lacune nei semiconduttori, 209 – in quiete, energia, 87 – in un campo magnetico, 145 – – equazione di moto per gli stati di spin, 147 – – hamiltoniana, 145 – interazione coulombiana fra due, 140 – livelli di energia, 20 – momento angolare, 363 – – nella meccanica quantistica, 369 – momento magnetico, 363 – – di spin, 363, 372
Indice analitico
– nella molecola di idrogeno, 140 – propagazione in un reticolo cristallino, 194-208 – – cattura da parte di un’imperfezione del reticolo, 206 – – diffusione – – – ampiezze di, 207 – – – da parte delle imperfezioni di un reticolo, 204 – – elettrone in un reticolo tridimensionale, 201 – – – altri possibili stati in un reticolo cristallino, 203 – – stati di un elettrone in un reticolo unidimensionale, 194 – – – stati che dipendono dal tempo, 200 – – – stati di energia definita, 197 – – stati legati, 207 – scambio virtuale, 138 – sigma dell’, 178 – spin, 20, 51 – stati di base – – per due elettroni, 106 – – per un elettrone, 106 – – per un elettrone e un protone, 106 elio, 52, 314 – atomo, 50 – elio-3, 49 – elio-4, 39, 49 – – superfluidità, 49 – energia dello stato fondamentale, 326 – liquido, 48 emettitore (transistor), 221 energia – a riposo, 88 – conservazione dell’, 262 – di cattura, 213 – di interazione tra due spin elettronici, 142 – di ionizzazione, 314 – di separazione, 211, 212 – – diamante, 213 – – germanio, 212 – – silicio, 212 – magnetica degli atomi, 371 – media, 321 – – di un atomo, 324 – quantistica (superconduttività), 349 equazione/i – della meccanica quantistica, 110 – di continuità per le probabilità, 339 – di moto per gli stati di spin (elettrone in un campo magnetico), 147 – di Schrödinger, 240, 248, 249 – – in un ambito classico, 337-343 – – – equazione di continuità per le probabilità, 339 – – – equazione di Schrödinger in presenza di un campo magnetico, 337
389
390
Indice analitico
– – – impulso cinematico, 341 – – – impulso dinamico, 341 – – – significato della funzione d’onda, 342 – – – superconduttività, v. superconduttività – – per l’atomo di idrogeno, 299-313 – – – funzioni d’onda, 312 – – – soluzione generale, 309 – – – soluzioni a simmetria sferica, 300 – – – stati con dipendenza angolare, 305 – operatoriale, 320 esperimento – di Stern-Gerlach, 265, 375 – ideale, 10 etilene, 230 – molecola, 230 evento, 10 – probabilità di un, 10, 13 F Fairbank, William M., 348 fascio – filtrato, 54 – non polarizzato, 61 – polarizzato, 54 fattore – g di Landé, 364 – g nucleare, 364 Fermi, Enrico – particelle di, 37, 49, 229 – – spin totale, 39 ferro, 317, 361 ferroelettricità, 362 ferromagnetismo, 223, 361 filtraggio degli atomi con un apparecchio di Stern-Gerlach, 53 filtri di Stern-Gerlach in serie, 53 fisica classica – e diamagnetismo, 361, 365 – e paramagnetismo, 361 fluoro, 315, 316 flusso, quantizzazione (superconduttività), 347 formula di Dirac, 182 forza/e – agente su una particella, 96 – nucleari, 138 fosfina, 318 fosforo, 317 fotocellule, 212 fotoconduttività, 212 fotone/i, 8, 38, 46, 140, 265 – conservazione della parità nell’emissione di un, 297 – emissione e assorbimento, 43 – funzione d’onda, 343 – infrarossi, 117 – matrice di rotazione, 271 – stati di polarizzazione, 159
© 978-8808-22107-0
– ultravioletti, 117 – virtuale, 140 frequenza/e – di Larmor, 367 – spettrali, 21 funzione/i – associate di Legendre, 308 – d’onda, 241 – – atomo di idrogeno, 312 – – fotone, 343 – – significato, 342 G gadolinio, 361 gallio, 317 gas nobile, 317, 236 Gell-Mann, Murray, 163, 166 generatori termoelettrici, 218 germanio, 209 – energia di separazione, 212 giunzione/i – a semiconduttori, 217 – – come raddrizzatori, 219 – Josephson, 351 – n-p, 218, 219 – p-n, 217, 219 gravitone, 38 H Hall, Edwin – coefficiente di, 217 – effetto, 215 Hamilton, William Rowan, 111 hamiltoniana – di un elettrone in un campo magnetico, 145 – di una particella a spin un mezzo in un campo magnetico, 145 – per lo stato fondamentale dell’atomo di idrogeno, 178 – v. anche matrice hamiltoniana Heisenberg, Werner, 1, 9, 11, 12, 22, 336 – principio di indeterminazione, 9, 11, 18, 19, 21, 51, 245 hermitiano, 321 – coniugato, 321 I idrogeno, 314 – atomo di, 50, 107 – – equazione di Schrödinger, v. equazione di Schrödinger per l’atomo di idrogeno – – stati, 312 – – – di base di un, 106 – energia di ionizzazione, 19, 314 – energie dei quattro stati stazionari in un campo magnetico costante, 187 – ione molecolare, 133, 237, 254
Indice analitico
© 978-8808-22107-0
– molecola, 140 – riga a 21 centimentri, 184 – stato/i – – fondamentale, 176 – – in un campo magnetico nullo, 190 – struttura iperfine, 176-193 – – effetto Zeeman, 184 – – hamiltoniana per lo stato fondamentale dell’atomo di idrogeno, 178 – – livelli di energia, 182 – – matrici di proiezione per lo spin uno, 191 – – stati di base per un sistema di due particelle a spin un mezzo, 176 – – stati in un campo magnetico, 188 impulso – cinematico, 341 – conservazione dell’, 262 – definito, stati, 243 – dinamico, 341 – misure di, 14 – operatore dell’, 263, 321, 328 impurità – e diffusione, 214 – nei semiconduttori, 213 interazione/i – coulombiana tra due elettroni, 140 – deboli, 163 – di spin-orbita, 236 – elettromagnetiche, 163 – forti, 163 – tra bande, 203 interferenza – da due fenditure, 26 – delle ampiezze, 62 inversione, 258 – operatore di, 320 ione di idrogeno molecolare, 133, 237, 254 J Jaklevic, R.C., 355 Jensen, Hans, 236 Josephson, Brian – giunzione, 351 Jz, operatore, 320 K Kamerlingh-Onnes, Heike, 343 ket, 102, 105 kripton, 317 Kronecker, Leopold – delta di, 64 L lacuna/e, 203, 210 – nei semiconduttori, 209 – – ed elettroni, 209 Lambe, John, 355
Larmor, Joseph – frequenza di, 367 – teorema di, 366 laser, 129 legame – a due elettroni, 142 – a elettrone singolo, 136 – chimico, 51 – covalente, 143 – ionico, 143 Legendre, Adrien-Marie – funzioni associate di, 308 – polinomi di, 286, 308 leggi – di conservazione, v. conservazione, leggi – generali delle ampiezze, 65 limite classico, 96 litio, 39, 315, 370 – atomo, 50 livelli – di energia, 20 – energetici quantizzati, 250 London, F., 346, 348 London, H., 346 luce, 140 – assorbimento, 130 – diffusione, 274 – emissione, 43, 130 – non polarizzata, 161 – polarizzata, 160, 263 M magenta (colorante), 144 magnesio, 316, 317 magneti atomici – precessione, 364 – precisione, 150 magnetismo della materia, 361-372 – diamagnetismo, 361, 365 – – e fisica classica, 368 – energia magnetica degli atomi, 371 – momento angolare dell’elettrone, 363 – – nella meccanica quantistica, 369 – momento magnetico dell’elettrone, 363 – paramagnetismo, 361 – – e fisica classica, 368 – precessione dei magneti atomici, 364 – teorema di Larmor, 366 magnetizzazione M, 379 magnetometro a risonanza protonica, 384 magnetone di Bohr, 187, 372, 382 magnoni, 226, 229 manganese, 317 maser – a tre stati, 129
391
392
Indice analitico
– ad ammoniaca, 116-132 – – molecola di ammoniaca in un campo elettrico stazionario, 120 – – stati di base di una molecola di ammoniaca, 116 – – transizioni alla risonanza, 127 – – transizioni in un campo dipendente dal tempo, 125 – – transizioni lontano dalla risonanza, 129 massa – a riposo, 88 – efficace, 201 materia, giustificazione della sua solidità, 20 matrice/i, 57, 67, 255 – di proiezione per lo spin uno, 191 – di rotazione, 74 – – per fotoni, 271 – – per sistemi con uno spin qualsiasi, 281 – – – deduzione, 294 – – per una particella di spin 3/2, 285 – – spin un mezzo, 271 – – spin uno, 271 – di spin di Pauli, 151 – – come operatori, 155 – di trasformazione da una rappresentazione a un’altra, 68 – energia, 111 – hamiltoniana, 101-115 – – ampiezze e vettore di stato, 101 – – decomposizione dei vettori di stato, 103 – – molecola di ammoniaca, 112 – – stati che cambiano col tempo, 108 – – stati di base dell’universo circostante,106 – – v. anche hamiltoniana – prodotto, 67, 153 – S, 108 – sigma, 154, 156, 178 – somma, 153 – vettore, 154 Mayer, Maria, 236 meccanica quantistica, 24 – e fenomeni magnetici, 368 – e meccanica classica, 22 – e paramagnetismo, 380 – equazione della, 110 – introduzione, 1-12 – – comportamento quantistico degli elettroni, 2 – – principi base, 10 – – principio di indeterminazione, 11 – non relativistica, 109 – primo principio generale, 25 – relazione tra i punti di vista ondulatorio e corpuscolare, 13-23 – – ampiezze di probabilità, 13 – – conseguenze filosofiche della meccanica quantistica, 21 – – diffrazione dai cristalli, 17
© 978-8808-22107-0
– – dimensioni di un atomo, 18 – – livelli di energia, 20 – – misure di posizione e di impulso, 14 – secondo principio generale, 25 – terzo principio generale, 26 Meissner, Walther – effetto, 345 Mercereau, J.E., 355 mesone/i, 38, 138 – di Yukawa, 138 – K, 140 – – neutro, 163 – , 138 – –, 265 meta-dibromobenzene, 143 metodo di Rabi dei raggi molecolari, 376 mioglobina, diffusione di raggi X, 18 modello a particelle indipendenti, v. approssimazione a particelle indipendenti modo, 46 momento – angolare, 263, 272-298 – – annichilimento del positronio, 276 – – composizione dei momenti angolari, 287 – – – per due particelle a spin un mezzo, 288 – – – per due particelle a spin uno, 294 – – – per una particella a spin un mezzo e una particella a spin uno, 293 – – conservazione del, 261, 263 – – dell’elettrone, 363 – – – nella meccanica quantistica, 369 – – diffusione della luce, 274 – – matrice di rotazione per sistemi con uno spin qualsiasi, 281 – – – deduzione, 294 – – meccanica classica, 261 – – meccanica quantistica, 261 – – misura di uno spin nucleare, 286 – – numeri quantici, 282 – – operatore del, 263 – – orbitale, 299, 305, 308 – – – operatore, 332 – – quantizzazione , 53, 376 – – radiazione di dipolo elettrico, 272 – – – conservazione della parità nell’emissione di un fotone, 297 – – totale, 281, 287 – – – numero quantico del, 312 – diamagnetico, 366 – magnetico – – dell’elettrone, 363 – – misura con il metodo Rabi, 376 moto uniforme, particella in, 89 muone, 38 – disintegrazione in un campo magnetico, 98
© 978-8808-22107-0
N Näbauer, Martin, 348, 349 neon, 315 neutrini, 38, 265 neutrone/i, 39, 52, 138, 153, 236 – diffusione da un cristallo, 30 – interazione con un protone, 138 – interazione tra due neutroni, 139 – lenti, 18 – momento magnetico di spin, 364 – natura ondulatoria, 18 Newton, Isaac, 1 nichel, 223, 317, 361 Nishijima, Kazuhiko, 163 nitrato di ammonio e praseodimio, 382 normalizzazione degli stati in x, 245 nucleo/i – atomico, momento magnetico, 364 – diffusione di nuclei su altri, 33 nucleone, 38, 153 numero/i – magici della fisica nucleare, 236 – quantico – – del momento angolare, 282 – – – totale, 190, 312 – – di stranezza, 163 – – magnetico, 190, 312 – – principale, 312 O onde – di spin, 223 – – due onde di spin, 227 – diffuse, 204 – sull’acqua, 3 – – interferenza costruttiva, 4 – – interferenza distruttiva, 4 Onsager, Lars, 349 operatore/i, 105, 255, 319-336 – algebrici, 321 – commutazione di, 256 – corrispondenza tra operatori quantistici e operatori algebrici, 331 – del momento angolare, 263 – dell’impulso, 263 – di inversione, 259 – di parità, 259 – di scambio spin, 182 – energia media, 321 – – di un atomo, 324 – hamiltoniano, 156, 173 – – autostati, 173 – – autovalori, 173 – quantistici, 320 – – operatore autoaggiunto, 321 – – operatore del momento angolare orbitale, 332
Indice analitico
– – operatore dell’impulso, 321, 328 – – operatore di parità (o di inversione), 320 – – operatore di posizione, 326 – – operatore di rotazione, 320 – – operatore Jz, 320 – – operatori sigma, 158, 178, 320 – variazione dei valori medi col tempo, 334 orologi atomici, 130 orto-dibromobenzene, 143 osservazione di non interferenza, 3 ossigeno, 317, 318 P Pais, Abraham, 166 para-dibromobenzene, 143 paradosso di Einstein-Podolsky-Rosen, 280 paramagnetismo, 361, 373-385 – dei materiali di massa, 379 – e fisica classica, 368 – esperienza di Stern e Gerlach, 375 – metodo di Rabi dei raggi molecolari, 376 – raffreddamento per smagnetizzazione adiabatica, 382 – stati magnetici quantizzati, 373 parità – conservazione della, 260 – di uno stato – – dispari, 259 – – pari, 259 – operatore di, 320 particella/e – α, diffusione di due, 38 – di Bose, 229 – di Fermi, 229 – di spin un mezzo, 106 – – in un campo magnetico, hamiltoniana, 145 – – precessione, 97 – – v. anche spin un mezzo – di spin uno, 53 – – strumenti della meccanica quantistica, 65 – – v. anche spin uno – energia potenziale, 92 – forza agente su una, 96 – identiche, 33, 37-52 – – elio liquido, 48 – – emissione e assorbimento di fotoni, 43 – – particelle di Bose, 37 – – – stati di due particelle, 39 – – – stati di n particelle, 42 – – particelle di Fermi, 37, 49 – – principio di esclusione, 49 – – spettro del corpo nero, 45 – in moto uniforme, 89 – indipendenti, 228 – – approssimazione a, v. approssimazione a particelle indipendenti
393
394
Indice analitico
– lambda (Λ0), 265 – – disintegrazione della, 265 – strane, 111, 163, 171 – – energia, 88 – vettoriali, 69 passaggio da un insieme di stati di base a un altro (particelle di spin uno), 67 Pauli, Wolfgang – matrici di spin di, 151 – – come operatori, 155 penetrazione di una barriera di potenziale, 95 pione, 138, 265 – neutro ( 0), 139 Planck, Max, 48 polarizzazione della luce, 160 – circolare, 161 – ellittica, 160 – lineare, 160 polaroid, 160 polinomi di Legendre, 286, 308 portatori – negativi, 210 – positivi, 210 positrone, 276 positronio, annichilimento del, 276 posizione – misure di, 14 – operatore di, 326 potenziale di Yukawa, 139 precessione – dei magneti atomici, 150, 364 – di una particella a spin un mezzo, 97 principio – di combinazione di Ritz, 21 – di esclusione, 49, 51 – di indeterminazione, 9, 11, 18, 19, 21, 51, 245 probabilità – ampiezza di, 10, 13 – densità di, 242, 244, 326, 340 – di un evento, 10, 13 – distribuzione di (elettrone), 242 protone/i, 39, 52, 107, 138, 153, 236, 265 – interazione con un neutrone, 138 – interazione tra due protoni, 139 – momento magnetico di spin, 364 – nella molecola di idrogeno, 141 – sigma del, 179 – stati di base per un elettrone e un, 106 Q quantizzazione – del flusso (superconduttività), 347 – del momento angolare, 53 R Rabi, Isidor – metodo dei raggi molecolari, 376
© 978-8808-22107-0
raddrizzatore, 219 – meccanico, 220 radiazione – di dipolo elettrico, 272 – – conservazione della parità nell’emissione di un fotone, 297 – di dipolo magnetico, 273 radicale libero, 379, 385 raffreddamento per smagnetizzazione adiabatica, 382 raggio/i – di Bohr, 19, 301, 305 – X, diffrazione di un cristallo, 18 rame, 317 rappresentazione delle coordinate, 248 regola di commutazione, 334 reticolo cristallino, 18 – cattura di un elettrone da parte di un’imperfezione del, 206 – diffusione di elettroni – – ampiezze di, 207 – – da parte delle imperfezioni di un, 204 – propagazione di un elettrone, v. elettrone, propagazione in un reticolo cristallino ricombinazione, 219 righe spettrali, 308 rilevatori a semiconduttore, 212 risonanza – magnetica nucleare, 383 – quantistica, 136 Ritz, Walter – principio di ricombinazione, 21 rotazione/i – operatore di, 320 – spin un mezzo – – arbitrarie, 84 – – di 180° e di 90° intorno all’asse y, 80 – – intorno all’asse x, 83 – – intorno all’asse z, 76 Rowell, J.R., 353 rydberg (unità di energia), 19, 301 S salgemma, diffrazione di raggi X, 18 scambio virtuale di un elettrone, 138 scandio, 317 Schrieffer, Robert, 344, 349 Schrödinger, Erwin, 1, 22, 24, 240, 249, 304, 336, 342 – equazione di, v. equazione di Schrödinger selenio, 318 semiconduttori, 209-222 – di tipo n, 214 – di tipo p, 214 – effetto Hall, 215 – elettroni nei, 209
© 978-8808-22107-0
– giunzioni a, 217 – – come raddrizzatori, 219 – impuri, 213 – lacune nei, 209 – transistor, 220 Shapiro, S., 353 sigma – del protone, 179 – dell’elettrone, 178 – operatori, 158, 178, 320 silicio, 209, 316, 317 – energia di separazione, 212 Silver, A.H., 355 simmetria – di un sistema, 254 – – e leggi di conservazione, 257 – per riflessione, 260 sistema/i – a doppio legame non saturo, 143 – a due stati, 133-150, 151-175 – – coloranti, 144 – – elettrone con spin in un campo magnetico, 148 – – hamiltoniana di una particella a spin un mezzo in un campo magnetico, 145 – – ione di idrogeno molecolare, 133 – – matrici di spin di Pauli, 151 – – – come operatori, 155 – – mesone K neutro, 163 – – molecola di ammoniaca, v. ammoniaca, molecola – – molecola di benzene, 143 – – molecola di idrogeno, 140 – – soluzione delle equazioni per i sistemi a due stati, 158 – – stati di polarizzazione del fotone, 159 – a N stati, 171 – con due stati di base, 111 – con uno stato di base, 111 – di due particelle a spin un mezzo, stati di base, 176 – periodico degli elementi, 314-318 – simmetria, 254 – – e leggi di conservazione, 257 smagnetizzazione adiabatica, raffreddamento per, 382 sodio, 315, 378, 379 solfato di rame, 379 solidi, conduzione dell’elettricità, 201 sostanze – diamagnetiche, 361 – paramagnetiche, 361 spettro – atomico, linee, 21 – del corpo nero, 45 spin – elettrone, 51, 363, 372
Indice analitico
– isotopico, 153 – neutrone, 364 – nucleare, misura, 286 – protone, 364 – sistema, 287 – – atomico, 370, 373 – totale, 287 – – intero, 39 – – semi-intero, 39 – un mezzo, 71-86 – – matrici di rotazione, 271 – – rotazioni arbitrarie, 84 – – rotazioni di 180° e di 90° intorno all’asse y, 80 – – rotazioni intorno all’asse x, 83 – – rotazioni intorno all’asse z, 76 – – trasformazione a un sistema di coordinate ruotato, 73 – – trasformazione delle ampiezze, 71 – uno, 53-70 – – esperimenti con atomi filtrati, 57 – – filtraggio degli atomi con un apparecchio di Stern-Gerlach, 53 – – filtri di Stern-Gerlach in serie, 59 – – interferenza delle ampiezze, 62 – – matrice di rotazione, 271 – – passaggio da un insieme di basi a un altro, 67 – – situazioni con n stati di base, 70 – – stati di base, 60 – – strumenti della meccanica quantistica per le particelle di spin uno, 65 stato/i – con dipendenza angolare (atomo di idrogeno), 305 – d, 308, 313 – d’energia minima, 312 – degeneri, 260 – di base, 60 – – che cambiano col tempo, 108 – – dell’universo circostante, 106 – – di un atomo di idrogeno, 106 – – e descrizione della natura, 107 – – passaggio da un insieme di stati di base a un altro, 67 – – per due elettroni, 106 – – per un elettrone, 106 – – per un protone e un elettrone, 106 – – sistema di due particelle a spin un mezzo, 176 – – situazione con n stati di base, 70 – di due particelle di Bose, 37 – di due particelle di Fermi, 49 – di impulso definito, 243 – di n particelle di Bose, 42 – di polarizzazione del fotone, 159 – di una particella, 39
395
396
Indice analitico
© 978-8808-22107-0
– fondamentale, 312 – legati, 207 – magnetici quantizzati, 373 – normalizzazione in x, 245 – p, 308, 313 – s, 307, 312, 313 – stazionari di un atomo, 87 Stern, Otto - Gerlach, Walter – apparecchio di, 53 – – filtri in serie, 59 – – modificato, 55 – esperimento di, 265, 375 stranezza, 163, 164 – conservazione della, 163 – numero quantico di, 163 strato energetico, 235 struttura iperfine – del deuterio, 288 – dell’idrogeno, v. idrogeno, struttura iperfine superconduttività, 343-355 – descrizione del fenomeno, 343 – dinamica del fenomeno, 349 – effetto Meissner, 345 – giunzione Josephson, 351 – quantizzazione del flusso, 347 superfluidità, 49 suscettività magnetica, 380
transizioni (maser ad ammoniaca), v. maser ad ammoniaca trasformazione – a un sistema di coordinate ruotato (spin un mezzo), 73 – delle ampiezze (spin un mezzo), 71 traslazione spaziale, 262 trifenilciclopropenile, 235
T tavola periodica degli elementi, proprietà, 236 tensore di massa effettiva, 202 teorema di Larmor, 366 termine di perturbazione, 131 termocoppie, 218 titanio, 317 transistor, 194, 209, 220 – n-p-n, 222 – p-n-p, 221
Y Yukawa, Hideki, 138 – mesone di, 138 – potenziale di, 139
U uranio, decadimento α di un nucleo di, 95 V vanadio, 317 velocità di gruppo, 91, 200 verde malachite (colorante), 145 vettore/i – di stato, 101, 102, 319 – – decomposizione, 103 – – e ampiezze, 101 – matrice, 154 – sigma, 154 X xantofilla, 234 – molecola, 234
Z Zeeman, Pieter – effetto, 184 zinco, 317 zolfo, 318